?
MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian
P. 297-313.
Sorokin A., Шаврина Т. О., Ляшевская О. Н., Дроганова К. А., Алексеева С. В., Bocharov V., Феногенова А. С., Грановский Д.
MorphoRuEval-2017 — соревнование по морфологической разметке, призванное стимулировать развитие технологий морфологической обработки текстов на русском языке, в особенности текстов из сети Интернет, как нормативных( новости, литературные тексты), так и менее формального характера (блоги и другие социальные медиа). Данная статья посвящена сравнению методов, использованных командами-участниками соревнования, а также проблемам унификации различных существующих обучающих коллекций для русского языка.
В книге
Vol. 1. Issue 16 (23). , M. : -, 2017
Ляшевская О. Н., Афанасьев И. А., Jazykovedny Casopis 2021 Vol. 72 No. 2 P. 556-567
Добавлено: 21 октября 2021 г.
Ляшевская О. Н., , in : Computational Linguistics and Intellectual Technologies. Issue 18.: M. : Russian State University for the Humanitie, 2019. P. 422-434.
Статья посвящена созданию морфологического стандарта для разметки Старорусского корпуса, который входит в состав исторических корпусов Национального корпуса русского языка (НКРЯ). Для того, чтобы сделать разметку удобной для лингвистов, работающих с историческими и современными корпусами, а также для разработчиков систем автоматической обработки исторических текстов, мы предусматриваем две параллельные схемы морфологической разметки, в нотации НКРЯ и Универсальных зависимостей ...
Добавлено: 12 июня 2019 г.
Кузьменко Е. А., Мустакимова Э. Г., , in : Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). : М. : Изд-во РГГУ, 2015. P. 388-398.
Добавлено: 30 июля 2015 г.
Сапин А. С., Большакова Е. И., В кн. : Новые информационные технологии в автоматизированных системах. Материалы двадцатого научно-практического семинара. : Институт прикладной математики им. М.В. Келдыша РАН, 2017. С. 73-81.
Описываются морфологический словарь разработанного морфологического процессора CrossMorphy и реализованные в нем методы обработки незнакомых слов, разрешения морфоомонимии и распознавания морфемного состава русскоязычных словоформ. Приводится сравнение функций процессора с несколькими распространенными свободно доступными модулями морфологического анализа для русского языка. ...
Добавлено: 5 сентября 2017 г.
Клышинский Э. С., Рысаков С. В., Новые информационные технологии в автоматизированных системах 2015 С. 555-563
Статья знакомит читателя со статистическими методами устранения морфологической неоднозначности. Описывается процесс насыщения, параметры методов и n-грамм. Большое внимание уделено методам снятия омонимии, в обзоре которых описания сопровождены практическими оценками и даны алгоритмы их работы. В конце приведено сравнение качества методов дизамбигуации, осуществлённое авторами. ...
Добавлено: 25 ноября 2015 г.
Дроганова К. А., Ляшевская О. Н., Zeman D., , in : Proceedings of TLT 2018 International Workshop on Treebanks and Linguistic Theories, 13-14 November 2018, Oslo, Norway. NEALT Proceedings Series. : Linköping University Electronic Press, 2018. P. 52-65.
Добавлено: 6 ноября 2018 г.
Лаврентьев А. М., Соловьев Ф. Н., Суворова М. И. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2018 Т. 16 № 3 С. 19-31
ПлатформаTXM предоставляет широкие возможности корпусного анализа, такие как анализ соответствий,
кластеризация, построение лексических таблиц, поиск сложных лексических конструкций, выделение подкорпу-сов по различным параметрам. По умолчанию платформа работает со словоупотреблениями в качестве структур-ных единиц анализа. Она интегрирована с единственным расширениемTreeTagger, позволяющим проводить лишь морфологический анализ и лемматизацию словоупотреблений. Однако пользователь может сопроводить каждое словоупотребление набором дополнительных характеристик, ...
Добавлено: 8 сентября 2018 г.
Мороз Г. А., , in : Дурхъаси хазна. Сборник статей к 60-летию Р. О. Муталова. : М. : Буки Веди, 2021. P. 258-282.
Добавлено: 23 мая 2021 г.
Kirill Maslinsky, , in : TALN-RECITAL 2014 Workshop TALAf 2014 : Traitement Automatique des Langues Africaines (TALAf 2014: African Language Processing). : Marseille : Association pour le Traitement Automatique des Langues, 2014. P. 114-122.
Добавлено: 26 марта 2015 г.
Добавлено: 30 января 2018 г.
Washington : Association for Computational Linguistics, 2023
Добавлено: 20 марта 2023 г.
Клышинский Э. С., В кн. : Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. : М. : Московский государственный институт электроники и математики, 2011. С. 106-140.
В данном разделе дается информация о начальных этапах анализа текстов на естественном языке: графематический, морфологический, предсинтаксический. Приводятся методы построения программных систем для реализации указанных этапов. ...
Добавлено: 12 апреля 2012 г.
Буйлова Н. Н., , in : Proceedings of Third Workshop "Computational linguistics and language science". Issue 4.: Manchester : EasyChair, 2019.
Добавлено: 11 декабря 2018 г.
Кошевой А. Г., Панова А. Б., Макарчук И. В., , in : Proceedings of the Sixth Workshop on Universal Dependencies (UDW, GURT/SyntaxFest 2023). : Washington : Association for Computational Linguistics, 2023. P. 1-6.
Добавлено: 20 марта 2023 г.
Ляшевская О. Н., Ostyakova L., Сальников Е. А. и др., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.). Дополнительный том материалов. : M. : ., 2020. P. 1091-1108.
Гетерогенность орфографии и грамматического строя текстов старорусской письменности создают существенные трудности для автоматической частеречной и морфологической разметки. Существующие подходы демонстрируют хорошие результаты, не прибегая к помощи нормализации, однако все они, тем не менее, чувствительны к любым изменениям пропорций элементов тренировочного датасета и жанровой неоднородности. В данной работе мы проанализировали влияние этих факторов на качество автоматической ...
Добавлено: 3 июля 2020 г.
Дурандин О. В., Малафеев А. Ю., , in : Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers. Communications in Computer and Information Science. Vol. 1086.: Springer, 2020. P. 120-131.
Добавлено: 16 ноября 2019 г.
Китов В. В., Научные труды Вольного экономического общества России 2014 Т. 186 С. 228-235
В работе рассматривается применение известного алгоритма «обучения трансформаций» для генерации правил, автоматически определяющих части речи в тексте. Приводятся результаты по точности применения алгоритма к размеченной выборке русского языка, а также демонстрируются правила, обеспечивающие наибольший прирост точности. ...
Добавлено: 16 марта 2016 г.
Ravishankar V., Таерз Ф. М., Gatt A., Procedia Computer Science 2017 Vol. 117 P. 175-182
Добавлено: 10 ноября 2017 г.
Борисова Л. А., В кн. : Инновационные технологии в логистике и управлении цепями поставок. : М. : Эс-Си-Эм Консалтинг, 2015. С. 81-90.
В случаях, когда не хватает достоверной информации для построения финансовой или имитационной моделей компании применяются морфологические матрицы для обоснования стратегических решений в логистике. Морфологический анализ–средство изучения всевозможных комбинаций вариантов управленческих решений, предлагаемых для формирования логистической стратегии компании. Если записать в столбец все функции логистической системы, а затем напротив каждой функции построчно указать всевозможные варианты ее ...
Добавлено: 29 июня 2015 г.
Феногенова А. С., Kazorin V., Карпов И. А. и др., , in : Proceedings of Third Workshop "Computational linguistics and language science". Issue 4.: Manchester : EasyChair, 2019. P. 11-17.
Добавлено: 5 октября 2018 г.
Архангельский Т. А., Belyaev O., Vydrin A., , in : Proceedings of COLING 2012: Posters. : Mumbai : The COLING 2012 Organizing Committee, 2012. Ch. 9. P. 83-91.
This paper is devoted to the use of two tools for creating morphologically annotated linguistic corpora: UniParser and the EANC platform. The EANC platform is the database and search framework originally developed for the Eastern Armenian National Corpus (www.eanc.net) and later adopted for other languages. UniParser is an automated morphological analysis tool developed specifically for creating ...
Добавлено: 17 апреля 2013 г.
Ляшевская О. Н., Droganova K., Zeman D. и др., / НИУ ВШЭ. Series WP BRP "Linguistics". 2016. No. 44.
Добавлено: 14 декабря 2016 г.
Yana Shishkina, Ляшевская О. Н., , in : Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers. : Cham : Springer, 2022. P. 137-147.
Добавлено: 4 января 2022 г.