Особенности построения морфопроцессора русского языка CrossMorphy

Сапин А. С.; Е. И. Большакова

Publications

?

Особенности построения морфопроцессора русского языка CrossMorphy

С. 73–81.

Сапин А. С., Bolshakova E. I.

Language: Russian

Keywords: морфологический анализ разрешение морфологической омонимии морфемный анализ морфологические процессоры

In book

Новые информационные технологии в автоматизированных системах. Материалы двадцатого научно-практического семинара

Институт прикладной математики им. М.В. Келдыша РАН, 2017.

Орфографические соседи в русском языке: база данных и эксперимент, направленный на изучение морфологической декомпозиции

Alexeeva S., Slioussar N., Вопросы психолингвистики 2017 Т. 32 С. 12–27

В целом ряде психолингвистических экспериментов исследуется влияние на восприятие слова близких по написанию слов, или орфографических соседей (например, крот – корт). Обращение к такому материалу позволяет выявить некоторые закономерности восприятия графического облика слов при чтении и поиска слов в ментальном лексиконе, а также пролить свет на ряд других актуальных для психолингвистики проблем. Однако на материале ...

Added: October 9, 2017

Automatic Morphemic Analysis of Russian Words

Мальтина Л. П., Malafeev A., , in: Supplementary Proceedings of the 7th International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018), Moscow, Russia, July 5-7, 2018. Aachen: CEUR Workshop Proceedings, 2018. Ch. 9 P. 85–94.

The paper considers the task of the morphemic analysis of Russian words and compares the efficiency of several proposed models. These models can be divided into three groups: derivational and inflectional rule-based, proba- bilistic, and hybrid models. The latter achieved state-of-the-art results of 0.848 F-score on a test set of 500 Russian words. The models ...

Added: February 15, 2019

Начальные этапы анализа текста

Klyshinskiy E., В кн.: Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. М.: Московский государственный институт электроники и математики, 2011. С. 106–140.

В данном разделе дается информация о начальных этапах анализа текстов на естественном языке: графематический, морфологический, предсинтаксический. Приводятся методы построения программных систем для реализации указанных этапов. ...

Added: April 12, 2012

Автоматизация процесса поиска побуждений и извлечения их из текста.

Belova P., Safaryan A., В кн.: Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка: сборник научных работ по итогам Международной научно-практической конференции «Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка». М.: ООО «СОЮЗКНИГ», 2023. С. 46–56.

В статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм, выражающих значение побуждения, и реализованной на языке Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. ...

Added: October 29, 2023

Daba: a model and tools for Manding corpora

Kirill Maslinsky, , in: TALN-RECITAL 2014 Workshop TALAf 2014 : Traitement Automatique des Langues Africaines (TALAf 2014: African Language Processing). Marseille: Association pour le Traitement Automatique des Langues, 2014. P. 114–122.

This article provides a brief overview of Daba software package created in the course of building corpora for Manding languages. Key software features are motivated by the tasks and problems characteristic of many African languages. The corpus-building model proposed here was initially developed for Bambara Reference Corpus which is available online and is freely accessible. ...

Added: March 26, 2015

Распределённые представления редких слов русского языка, учитывающие векторы однокоренных слов

Malafeev A., Мальтина Л. П., Научно-техническая информация. Серия 2: Информационные процессы и системы 2021 № 1

The paper proposes algorithms that perform automatic morphemic analysis of words and methods of distributed representations of words that indirectly use information about the morphemic composition through the averaging of vectors of same-root words. Morphemic analysis models for the Russian language are evaluated on samples of common and rare words. Several methods are proposed for obtaining ...

Added: November 9, 2020

A morphological analyser for Maltese

Ravishankar V., Tyers F. M., Gatt A., Procedia Computer Science 2017 Vol. 117 P. 175–182

This article describes the development of a free/open-source morphological description of Maltese, originally created as the analysis component in a rule-based machine translation system for Maltese to Arabic and later applied to other tasks. The lexicon formalism we use is lttoolbox, part of the Apertium machine translation platform. An evaluation of the analyser shows that ...

Added: November 10, 2017

Automatic Disambiguation in the Corpora of Modern Greek and Yiddish

Kuzmenko E., Mustakimova E., , in: Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). М.: Изд-во РГГУ, 2015. P. 388–398.

The problem of morphological ambiguity is widely addressed in the modern NLP. Mostly ambiguity is resolved with the use of large manually-annotated corpora and machine learning. However, such methods are not always available, as good training data is not accessible for all languages. In this paper we present a method of disambiguation without gold standard ...

Added: July 30, 2015

Зачем нам нужны технологии поиска и анализа неструктурированной информации? Как оценить экономический эффект? (часть 1)

Romanov D. A., Современные технологии делопроизводства и документооборота 2014 № 9 С. 21–30

В первой части статьи рассмотрены некоторые базовые технологии для анализа и поиска неструктурированной текстовой информации - морфологический, синтаксический и семантический анализ, анализ эмоциональной окраски, выделение именованных сущностей, фактов и мнений, поиск похожих документов, автоаннотирование, анлиз информационных потоков в социальных сетях и др. ...

Added: March 19, 2015

Инкрементальное предсказание морфологической парадигмы неизвестных слов русского языка

Lyukina E. V., Lytaeva M. A., Вестник Томского государственного университета. Филология 2020 № 68 С. 27–41

The article is dedicated to a new method for predicting the morphological paradigm of unknown (non-dictionary) words in the Russian language. The method allows in incremental mode automatically predict the morphological paradigm of the word. The method is based on ensemble prediction of the morphological paradigm from single wordform and the formation of partial paradigms ...

Added: December 11, 2020

MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian

Sorokin A., Shavrina T., Lyashevskaya O. et al., , in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" ProceedingsVol. 1. Issue 16 (23). M.: -, 2017. P. 297–313.

MorphoRuEval-2017 is an evaluation campaign designed to stimulate the development of the automatic morphological processing technologies for Russian, both for normative texts (news, fiction, nonfiction) and those of less formal nature (blogs and other social media). This article compares the methods participants used to solve the task of morphological analysis. It also discusses the problem ...

Added: October 9, 2018

ПРИМЕНЕНИЕ МОРФОЛОГИЧЕСКОГО АНАЛИЗА ДЛЯ ОБОСНОВАНИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В ЛОГИСТИКЕ

Borisova L. A., В кн.: Инновационные технологии в логистике и управлении цепями поставок. М.: Эс-Си-Эм Консалтинг, 2015. С. 81–90.

В случаях, когда не хватает достоверной информации для построения финансовой или имитационной моделей компании применяются морфологические матрицы для обоснования стратегических решений в логистике. Морфологический анализ–средство изучения всевозможных комбинаций вариантов управленческих решений, предлагаемых для формирования логистической стратегии компании. Если записать в столбец все функции логистической системы, а затем напротив каждой функции построчно указать всевозможные варианты ее ...

Added: June 29, 2015