?
Проект Chekhov Digital: разработка цифрового индекса для семантического поиска
С. 82–88.
Северина Е. М.
Рассмотрена специфика разработки цифрового указателя (индекса) имен и названий реальных людей и объектов, упоминаемых в текстах произведений и писем А. П. Чехова и представленных в указателях академического издания. Разработка такого индекса позволяет организовать семантический поиск по текстам произведений писателя, редакционно-критическому аппарату цифрового издания Chekhov Digital.
Язык:
русский
Ключевые слова: семантический поискцифровое изданиепроект Chekhov Digitalцифровой индексуказатель имен и названий
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211–222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
Мыльникова А. В., Трусов В. А., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2023 № 10 С. 16–23
Рассматривается проблема формирования дескрипторов для сокращения объе
ма выдачи данных, сокращения времени поиска в текстовых источниках информа
ции с помощью таких новых факторов, как авторство, регион, эмоциональный
окрас, популярность, категория текста без соответствующих меток, которые
могут формировать дескрипторы. Предлагаемый подход позволяет использовать
уникальные лексико-грамматические дистрибутивные закономерности, имеющиеся
в текстах. Результаты исследования могут быть применены для определения ав
торства и типа текста. ...
Добавлено: 31 октября 2023 г.
Сафарян А. К., Petr Filchenkov, Yan W. и др., , in: Recent Trends in Analysis of Images, Social Networks and Texts. 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020 Revised Supplementary ProceedingsVol. 12602.: Springer, 2021. Ch. 3 P. 22–36.
Добавлено: 18 сентября 2023 г.
В этой статье мы расскажем о работе по созданию цифрового издания текстов Льва Толстого. Наша цель – появление многоуровневой разметки в большом и жанрово разнообразном собрании произведений русского писателя, но попутно мы хотели бы и внести свой вклад в стандартизацию электронного представления текстов и электронной текстологии в России. Мы считаем важным создавать образцы таких подходов для ...
Добавлено: 18 сентября 2019 г.
Козеренко Е. Б., Кузнецов К. И., Романов Д. А., Информатика и ее применения 2018 Т. 12 № 3 С. 91–98
Представлена методика создания систем извлечения знаний, основанная на подходе, главным инструментом которого является программный пакет PullEnti, включающий алгоритмы морфологического и семантико-синтаксического анализа для выделения сущностей определенных типов из текстов естественного языка (персоны, организации, локации и другие целевые семантические объекты). В системе PullEnti используются динамически подключаемые компоненты (плагины), что позволяет без перекомпилирования активировать различные функциональные возможности. ...
Добавлено: 19 декабря 2018 г.
Захлебин И. В., В кн.: Электронный бизнес. Управление интернет-проектами. Инновации: Сборник трудов участников студенческой научно-практической конференции, Москва, 12-14 марта 2013 г.: М.: НИУ ВШЭ, 2014. С. 88–91.
В докладе рассматривается методология построения системы, позволяющей производить поиск специалистов, удовлетворяющих определенному набору требований, по набору текстов на естественном языке. ...
Добавлено: 11 июля 2015 г.
Кириллов А. В., Бизнес-информатика 2011 № 3 С. 16–23
Статья описывает новый метод построения семантических расширений поисковых запросов обобщенного характера для улучшения результатов веб-поиска. Метод базируется на теории К-представлений - теории проектирования семантико-синтаксических анализаторов естественно-языковых текстов с широким использованием формальных средств для представления входных, промежуточных и выходных данных. Изложенный метод реализован на языке программирования Java в экспериментальной поисковой системе AOS (Aspect Oriented Search), эта ...
Добавлено: 21 ноября 2012 г.
Кириллов А. В., Фомичев В. А., Бизнес-информатика 2011 № 1 С. 61–68
В статье рассматриваются существующие подходы к поиску информации, анализируются их основные недостатки. Предлагается новый подход к поиску информации, основанный на семантическом преобразовании поисковых запросов. В рамках предлагаемого подхода выделяются классы естественно-языковых запросов, предлагаются формальная модель проблемноориентированной системы первичных единиц концептуального уровня и метод построения семантического расширения поискового запроса, а также иллюстрируется применение метода. ...
Добавлено: 27 сентября 2012 г.