?
Corpus-Based Text Retrieval and Adaptation for Learning System
International Journal of Advances in Computer Science and Its Applications. 2014. Vol. 4. No. 2. P. 38-43.
Карпов Н. В.
The algorithm to adapt lexical complexity in the news article which can be used as materials for learning language presented in the paper. We consider words substitution retrieval according to wordnet-based and corpus-based semantic relatedness. Two corpus-based similarity measures empirically tested: Vector Space Model and Distributional Semantic Model. This language processing algorithm has created as a client-server application. It retrieves appropriate text from Web-resource. Next it performs adaptation procedure.
Приоритетные направления:
компьютерно-математическое
Язык:
английский
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
M. : Russian State University for the Humanitie, 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...
Добавлено: 16 октября 2019 г.
Малафеев А. Ю., International Journal of Conceptual Structures and Smart Applications (IJCSSA) 2014 Vol. 2 No. 2 P. 20-35
Добавлено: 29 ноября 2014 г.
M. : Russian State University for the Humanitie, 2019
Сборник включает 61 доклад международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 12 июня 2019 г.
Denis Turdakov, Astrakhantsev N., Fedorenko D., Programming and Computer Software 2015 Vol. 41 No. 6 P. 336-349
Добавлено: 26 августа 2016 г.
Клышинский Э. С., Логачёва В. К., Карпик О. В. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2020 Т. 18 № 1 С. 5-21
Неоднозначность слов по их грамматическим характеристикам является хорошо исследованной областью, однако существующие методы ее оценки в текстах на различных естественных языках являются скорее количественными, чем качественными. В данной статье предлагается разделение всех слов на несколько классов неоднозначности. Подобное разделение позволяет ввести количественный метод оценки, основанный на расчете статистики употребления слов. В статье проводится исследование неоднозначности ...
Добавлено: 11 декабря 2019 г.
S.D. Kuznetsov, D.Yu. Turdakov, Астраханцев Н. А. и др., Programming and Computer Software 2014 Vol. 40 No. 5 P. 288-295
Добавлено: 26 ноября 2017 г.
Клышинский Э. С., Калачев Я. Б., Жаднов В. В., Научно-техническая информация. Серия 2: Информационные процессы и системы 2014 № 5 С. 11-15
Рассматривается новый метод автоматизации определения соответствия технического задания и итогового отчета в ходе его приемки. Предложенный метод позволяет экспертам получить предварительную оценку степени соответствия отчета техническому заданию. Используются выделение значимых фрагментов технического задания,поиск соответствующих им элементов отчета и проверка степени его покрытия. Разработанный метод,в отличие, например,от косинусной меры сходства, дает лучшее разделение отчетов по критерию ...
Добавлено: 30 июня 2014 г.
P. : European Language Resources Association (ELRA), 2018
Добавлено: 5 мая 2018 г.
Springer, 2022
Добавлено: 30 августа 2021 г.
M. : Russian State University for the Humanitie, 2015
Добавлено: 28 апреля 2015 г.
Berlin, Heidelberg : Springer, 2012
Добавлено: 21 сентября 2012 г.
Савченко А. В., Вестник компьютерных и информационных технологий 2012 № 8 С. 14-19
Ставится задача автоматического построения транскрипции слитной речи. Предложен новый критерий распознавания фонем на основе принципа минимума информационного рассогласования Кульбака-Лейблера и произвольных признаков - оценок спектральной плотности мощности речевого сигнала. Проведено сравнение предложенного критерия с традиционными мерами близости для популярных оценок спектра (периодограмма, авторегрессионная оценка, гребенка полосовых фильтров). Показано, что предложенный критерий характеризуется существенным повышением точности ...
Добавлено: 14 сентября 2012 г.
Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. и др., Труды Института системного программирования РАН 2014 Т. 26 С. 421-438
В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...
Добавлено: 6 ноября 2017 г.
Association for Computational Linguistics, 2021
Добавлено: 31 августа 2021 г.
Association for Computational Linguistics, 2019
Добавлено: 15 сентября 2020 г.
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 16 октября 2019 г.
Berlin : Springer, 2014
Добавлено: 13 ноября 2014 г.
Switzerland : Springer, 2015
This book constitutes the refereed proceedings of the 6th Conference on Knowledge Engineering and the Semantic Web, KESW 2015, held in Moscow, Russia, in September/October 2015. The 17 revised full papers presented together with 6 short system descriptions were carefully reviewed and selected from 35 submissions. The papers address research issues related to semantic web, ...
Добавлено: 16 сентября 2015 г.
Tikhonov A., Ямщиков И. П., / Cornell University. Series Computer Science "arxiv.org". 2021.
Chekhov's gun is a dramatic principle stating that every element in a story must be necessary, and irrelevant elements should be removed. This paper presents a new natural language processing task — Chekhov's gun recognition or (CGR) — recognition of entities that are pivotal for the development of the plot. Though similar to classical Named Entity Recognition ...
Добавлено: 3 декабря 2021 г.
Повышенное внимание к проблеме АОТ на естественных языках и появление новых методик анализа данных -- одна из главных тенденций ИТ-индустрии. Однако на сегодняшний день нет единого подхода к решению задачи обобщения и визуализации больших объемов текстовых данных. В основе системы LM Monitor (Latent Meaning Monitor) лежит идея использования графа референций, что в некотором смысле близко ...
Добавлено: 16 декабря 2014 г.
Чеповский А. М., М. : Национальный открытый университет «ИНТУИТ», 2015
В монографии рассмотрены различные математические модели для решения практических задач обработки текстов на естественных языках. Предлагаются решения проблем, возникающих при организации индексации и последующего поиска данных. Методы компьютерной лингвистики применяются для прикладных исследований. Предназначена для разработчиков информационных систем, специалистов в области компьютерной лингвистики. ...
Добавлено: 23 мая 2015 г.
Крылов В. В., Крылов С. В., Жигалов Г. М., Journal of Physics: Conference Series 2019 Vol. 1405(1) No. DOI: 10.1088/1742-6596/1405/1/012011б
Добавлено: 28 июня 2021 г.
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211-222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.