В книге
Aachen : CEUR Workshop Proceedings, 2018
Рыбаков В. В., Малафеев А. Ю., , in : Supplementary Proceedings of the 7th International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018), Moscow, Russia, July 5-7, 2018. : Aachen : CEUR Workshop Proceedings, 2018. Ch. 8. P. 75-84.
Добавлено: 15 февраля 2019 г.
Энатская Н. Ю., Вестник Южно-Уральского государственного университета, серия «Математическое моделирование и программирование» 2020 Т. 13 № 3 С. 103-111
Предлагается перечислительный метод анализа комбинаторных схем в доасимптотической области изменения их параметров на основе построения их вероятностной
математическоймодели, представляющей для каждой схемы итерационный случайный
процесс последовательного бесповторного формирования всех ее исходов с определенной дисциплиной их нумерации поединичным добавлением определенных элементов
схемы до данного в ней значения. В связи с важностью для проведения ряда исследований схемы бесповторности перечисления ее ...
Добавлено: 17 октября 2020 г.
Malykh V., Porplenko D., Тутубалина Е. В., , in : Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected Papers. Vol. 12602.: Springer, 2021. P. 149-161.
We present a novel dataset of sports broadcasts with 8,781 games. The dataset contains 700 thousand comments and 93 thousand related news documents in Russian. We run an extensive series of experiments of modern extractive and abstractive approaches. The results demonstrate that BERT-based models show modest performance, reaching up to 0.26 ROUGE-1F-measure. In addition, human evaluation ...
Добавлено: 10 мая 2021 г.
Артемова Е. Л., Batura T., Golenkovskaya A. и др., , in : Digital Transformation and Global Society. DTGS 2020. Vol. 1242.: Springer, 2020. P. 208-222.
In this paper we present a corpus of Russian strategic planning documents, RuREBus. This project is grounded both from language technology and e-government perspectives. Not only new language sources and tools are being developed, but also their applications to e-government research.
We demonstrate the pipeline for creating a text corpus from scratch. First, the annotation schema ...
Добавлено: 10 мая 2021 г.
Association for Computational Linguistics, 2021
Natural Language Processing (NLP) has benefited from promising recent advances including the employment of latest deep learning technology amongst a host of other solutions. The current pandemic has prevented the in-person exchange of ideas and networking of NLP researchers and students, but virtual communication opportunities have enabled continued collaboration and provided alternative communication channels. While ...
Добавлено: 27 сентября 2021 г.
Клышинский Э. С., Логачёва В. К., Карпик О. В. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2020 Т. 18 № 1 С. 5-21
Неоднозначность слов по их грамматическим характеристикам является хорошо исследованной областью, однако существующие методы ее оценки в текстах на различных естественных языках являются скорее количественными, чем качественными. В данной статье предлагается разделение всех слов на несколько классов неоднозначности. Подобное разделение позволяет ввести количественный метод оценки, основанный на расчете статистики употребления слов. В статье проводится исследование неоднозначности ...
Добавлено: 11 декабря 2019 г.
Веселова Ю. А., Social Choice and Welfare 2016 Vol. 46 No. 3 P. 609-638
Рассматривается вычисление индекса манипулируемости Нитцана-Келли в модели независимых анонимных и нейтральных предпочтений (IANC). Проведено теоретическое исследование модели, а также сделана оценка максимальной разницы индексов манипулируемости в данной модели и в базовой, модели независимых предпочтений (IC). Ассимптотическое поведение этой разности исследовано при помощи третей модели, независимых анонимных предпочтений (IAC). Показано, что максимальная разность индексов в моделях ...
Добавлено: 30 октября 2013 г.
Magge A., Тутубалина Е. В., Miftahutdinov Z. и др., Journal of the American Medical Informatics Association : JAMIA 2021 Vol. 28 No. 10 P. 2184-2192
Objective
Research on pharmacovigilance from social media data has focused on mining adverse drug events (ADEs) using annotated datasets, with publications generally focusing on 1 of 3 tasks: ADE classification, named entity recognition for identifying the span of ADE mentions, and ADE mention normalization to standardized terminologies. While the common goal of such systems is to ...
Добавлено: 1 октября 2021 г.
Bautin G. A., Калягин В. А., Колданов А. П., Springer Proceedings in Mathematics & Statistics 2013 Vol. 59 P. 29-41
Market graph is built on the basis of some similarity measure for financial asset returns. The paper considers two similarity measures: classic Pearson correlation and sign correlation. We study the associated market graphs and compare the conditional risk of the market graph construction for these two measures of similarity. Our main finding is that the ...
Добавлено: 27 сентября 2013 г.
Association for Computational Linguistics, 2019
Добавлено: 1 ноября 2019 г.
Springer, 2021
Добавлено: 28 октября 2021 г.
Ivan P. Yamshchikov, Shibaev V., Nagaev A. и др., , in : Proceedings of the 3rd Workshop on Neural Generation and Translation. : Association for Computational Linguistics, 2019. P. 128-137.
Добавлено: 7 января 2021 г.
Switzerland : Springer, 2015
This book constitutes the refereed proceedings of the 6th Conference on Knowledge Engineering and the Semantic Web, KESW 2015, held in Moscow, Russia, in September/October 2015. The 17 revised full papers presented together with 6 short system descriptions were carefully reviewed and selected from 35 submissions. The papers address research issues related to semantic web, ...
Добавлено: 16 сентября 2015 г.
I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176-183
Добавлено: 4 ноября 2023 г.
Luparov A., Панов А. И., Suvorov R. и др., , in : Proceedings of ICPRAM 2015 - 4th International Conference on Pattern Recognition Applications and Methods. Vol. 2.: SciTePress, 2015. P. 270-276.
Добавлено: 20 ноября 2015 г.
Razzhigaev A., Nikolay Arefyev, Panchenko A., , in : Proceedings of the 15th International Workshop on Semantic Evaluation (SemEval-2021). : Association for Computational Linguistics, 2021. P. 157-162.
Добавлено: 23 сентября 2021 г.
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211-222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
Кирина М. А., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2022 Т. 20 № 2 С. 93-109
В статье описываются результаты тематического моделирования малой художественной прозы на основе трех методов – латентного размещения Дирихле (LDA), структурного тематического моделирования (STM) и неотрицательной матричной факторизации (NMF) – в сочетании с разными вариантами предобработки текстов. Апробация экспериментального дизайна осуществляется на материале Корпуса русского рассказа 1900–1930 гг. Исследование позволило выявить особенности рассматриваемых алгоритмов и оценить эффективность ...
Добавлено: 10 декабря 2022 г.
Фирсанова В. И., International Journal of Open Information Technologies 2021 Vol. 9 No. 12 P. 53-59
Добавлено: 25 сентября 2023 г.
Davletov A., Gordeev D., Nikolay Arefyev и др., , in : Proceedings of the 15th International Workshop on Semantic Evaluation (SemEval-2021). : Association for Computational Linguistics, 2021. P. 1249-1254.
Добавлено: 23 сентября 2021 г.
Berlin : Springer, 2014
Добавлено: 13 ноября 2014 г.
Alimova l., Тутубалина Е. В., Journal of Biomedical Informatics 2020 Vol. 103 P. 1-9
Relation extraction aims to discover relational facts about entity mentions from plain texts. In this work, we focus on clinical relation extraction; namely, given a medical record with mentions of drugs and their attributes, we identify relations between these entities. We propose a machine learning model with a novel set of knowledge-based and BioSentVec embedding ...
Добавлено: 28 октября 2020 г.
Добавлено: 31 октября 2021 г.
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 16 октября 2019 г.