?
So What’s the Plan? Mining Strategic Planning Documents
P. 208-222.
Артемова Е. Л., Batura T., Golenkovskaya A., Ivanin V., Ivanov V., Саркисян В. В., Smurov I., Тутубалина Е. В.
In this paper we present a corpus of Russian strategic planning documents, RuREBus. This project is grounded both from language technology and e-government perspectives. Not only new language sources and tools are being developed, but also their applications to e-government research.
We demonstrate the pipeline for creating a text corpus from scratch. First, the annotation schema is designed. Next texts are marked up using human-in-the-loop strategy, so that preliminary annotations are derived from a machine learning model and are manually corrected.
The amount of annotated texts is large enough to showcase what insights can be gained from RuREBus.
Association for Computational Linguistics, 2021
Natural Language Processing (NLP) has benefited from promising recent advances including the employment of latest deep learning technology amongst a host of other solutions. The current pandemic has prevented the in-person exchange of ideas and networking of NLP researchers and students, but virtual communication opportunities have enabled continued collaboration and provided alternative communication channels. While ...
Добавлено: 27 сентября 2021 г.
Malykh V., Porplenko D., Тутубалина Е. В., , in : Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected Papers. Vol. 12602.: Springer, 2021. P. 149-161.
We present a novel dataset of sports broadcasts with 8,781 games. The dataset contains 700 thousand comments and 93 thousand related news documents in Russian. We run an extensive series of experiments of modern extractive and abstractive approaches. The results demonstrate that BERT-based models show modest performance, reaching up to 0.26 ROUGE-1F-measure. In addition, human evaluation ...
Добавлено: 10 мая 2021 г.
Association for Computational Linguistics, 2019
Добавлено: 1 ноября 2019 г.
Мальтина Л. П., Малафеев А. Ю., , in : Supplementary Proceedings of the 7th International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018), Moscow, Russia, July 5-7, 2018. : Aachen : CEUR Workshop Proceedings, 2018. Ch. 9. P. 85-94.
Добавлено: 15 февраля 2019 г.
Рыбаков В. В., Малафеев А. Ю., , in : Supplementary Proceedings of the 7th International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018), Moscow, Russia, July 5-7, 2018. : Aachen : CEUR Workshop Proceedings, 2018. Ch. 8. P. 75-84.
Добавлено: 15 февраля 2019 г.
Magge A., Тутубалина Е. В., Miftahutdinov Z. и др., Journal of the American Medical Informatics Association : JAMIA 2021 Vol. 28 No. 10 P. 2184-2192
Objective
Research on pharmacovigilance from social media data has focused on mining adverse drug events (ADEs) using annotated datasets, with publications generally focusing on 1 of 3 tasks: ADE classification, named entity recognition for identifying the span of ADE mentions, and ADE mention normalization to standardized terminologies. While the common goal of such systems is to ...
Добавлено: 1 октября 2021 г.
Клышинский Э. С., Логачёва В. К., Карпик О. В. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2020 Т. 18 № 1 С. 5-21
Неоднозначность слов по их грамматическим характеристикам является хорошо исследованной областью, однако существующие методы ее оценки в текстах на различных естественных языках являются скорее количественными, чем качественными. В данной статье предлагается разделение всех слов на несколько классов неоднозначности. Подобное разделение позволяет ввести количественный метод оценки, основанный на расчете статистики употребления слов. В статье проводится исследование неоднозначности ...
Добавлено: 11 декабря 2019 г.
Springer, 2021
Добавлено: 28 октября 2021 г.
Razzhigaev A., Nikolay Arefyev, Panchenko A., , in : Proceedings of the 15th International Workshop on Semantic Evaluation (SemEval-2021). : Association for Computational Linguistics, 2021. P. 157-162.
Добавлено: 23 сентября 2021 г.
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211-222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
Luparov A., Панов А. И., Suvorov R. и др., , in : Proceedings of ICPRAM 2015 - 4th International Conference on Pattern Recognition Applications and Methods. Vol. 2.: SciTePress, 2015. P. 270-276.
Добавлено: 20 ноября 2015 г.
Ivan P. Yamshchikov, Shibaev V., Nagaev A. и др., , in : Proceedings of the 3rd Workshop on Neural Generation and Translation. : Association for Computational Linguistics, 2019. P. 128-137.
Добавлено: 7 января 2021 г.
Switzerland : Springer, 2015
This book constitutes the refereed proceedings of the 6th Conference on Knowledge Engineering and the Semantic Web, KESW 2015, held in Moscow, Russia, in September/October 2015. The 17 revised full papers presented together with 6 short system descriptions were carefully reviewed and selected from 35 submissions. The papers address research issues related to semantic web, ...
Добавлено: 16 сентября 2015 г.
I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176-183
Добавлено: 4 ноября 2023 г.
Кирина М. А., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2022 Т. 20 № 2 С. 93-109
В статье описываются результаты тематического моделирования малой художественной прозы на основе трех методов – латентного размещения Дирихле (LDA), структурного тематического моделирования (STM) и неотрицательной матричной факторизации (NMF) – в сочетании с разными вариантами предобработки текстов. Апробация экспериментального дизайна осуществляется на материале Корпуса русского рассказа 1900–1930 гг. Исследование позволило выявить особенности рассматриваемых алгоритмов и оценить эффективность ...
Добавлено: 10 декабря 2022 г.
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 16 октября 2019 г.
Добавлено: 10 декабря 2023 г.
Карпов Н. В., В кн. : Современные проблемы информатизации в анализе и синтезе технологических и программно-телекоммуникационных систем: Сборник трудов. Вып. 17.: Воронеж : Научная книга, 2012. С. 264-266.
Добавлено: 7 ноября 2012 г.
Davletov A., Gordeev D., Nikolay Arefyev и др., , in : Proceedings of the 15th International Workshop on Semantic Evaluation (SemEval-2021). : Association for Computational Linguistics, 2021. P. 1249-1254.
Добавлено: 23 сентября 2021 г.
Фирсанова В. И., International Journal of Open Information Technologies 2021 Vol. 9 No. 12 P. 53-59
Добавлено: 25 сентября 2023 г.
Berlin : Springer, 2014
Добавлено: 13 ноября 2014 г.
Alimova l., Тутубалина Е. В., Journal of Biomedical Informatics 2020 Vol. 103 P. 1-9
Relation extraction aims to discover relational facts about entity mentions from plain texts. In this work, we focus on clinical relation extraction; namely, given a medical record with mentions of drugs and their attributes, we identify relations between these entities. We propose a machine learning model with a novel set of knowledge-based and BioSentVec embedding ...
Добавлено: 28 октября 2020 г.
Добавлено: 31 октября 2021 г.
Захлебин И. В., В кн. : Электронный бизнес. Управление интернет-проектами. Инновации: Сборник трудов участников студенческой научно-практической конференции, Москва, 12-14 марта 2013 г. : М. : НИУ ВШЭ, 2014. С. 88-91.
В докладе рассматривается методология построения системы, позволяющей производить поиск специалистов, удовлетворяющих определенному набору требований, по набору текстов на естественном языке. ...
Добавлено: 11 июля 2015 г.