Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Viktor V. Prutyanov, Nikita L. Korolev, Aleksandr Y. Romanov, , in: 2025 International Russian Automation Conference (RusAutoCon).: IEEE, 2025. P. 350–354.
Добавлено: 6 ноября 2025 г.
Колмогорова А. В., Калинин А. А., В кн.: Компьютерная лингвистика и интеллектуальные технологии: по материалам международной конференции «Диалог 2022», выпуск 21Вып. 21.: Изд-во РГГУ, 2022. С. 311–322.
В статье обсуждаются результаты решения двух задач машинного обучения: задачи классификации тек
стов социальных сетей на русском языке по критерию доминирующей эмоции и задачи регрессии, в рамках
которой эмоции в тех же текстах социальных сетей предсказываются. В основе экспериментов – сформиро
ванный авторами датасет из 3879 текстов из пабликов ВКонтакте, размеченный 2000 асессорами на краудсор
синговой платформе Толока. Аннотирование ...
Добавлено: 18 марта 2024 г.
A. V. Belov, E. A. Egorova, Bulletin D. Serikbayev East Kazakhstan Technical University 2023 No. 4 P. 92–102
Добавлено: 9 марта 2024 г.
I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176–183
Добавлено: 4 ноября 2023 г.
Alimova I., Тутубалина Е. В., , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 37–44.
Добавлено: 10 апреля 2023 г.
Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн.: НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.: М.: ВИНИТИ РАН, 2022. С. 103–109.
В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...
Добавлено: 31 января 2023 г.
Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6–9
В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...
Добавлено: 31 января 2023 г.
Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947
Добавлено: 15 августа 2022 г.
Харламов А. А., Kulikov A., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 219–231.
В работе показано использование механизма сравнения семантических сетей текстов в задаче диагностики заболеваний с использованием сигнальных сетей. Выявление степени пересечения семантических сетей текстов позволяет говорить о степени их смыслового подобия. Однородная семантическая сеть как множество узлов, связанных дугами, имеет численные характеристики – частоты появления слов, а также пар слов в тексте, которые перенормируются с использованием ...
Добавлено: 7 декабря 2021 г.
Харламов А. А., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 156–167.
На основе представлений об обработке информации в мозге человека [1] реализована технология автоматической смысловой обработки текстов TextAnalyst, позволяющая выявить ключевые понятия текста в их взаимосвязях, реализовать реферирование текстов и их смысловое сравнение (классификацию). Реализованы продукты, использующие функциональность этой технологии: персональный – TextAnalyst, и библиотека COM модулей – TextAnalyst SDK. ...
Добавлено: 7 декабря 2021 г.
Burnyshev P., Malykh V., Bout A. и др., , in: Proceedings of the 14th International Conference on Natural Language Generation.: Association for Computational Linguistics, 2021. Ch. 20 P. 201–211.
Добавлено: 23 сентября 2021 г.
Сметанин С. И., Комаров М. М., , in: IEEE 23rd Conference on Business Informatics (CBI).: IEEE Computer Society, 2021. P. 65–70.
Добавлено: 14 сентября 2021 г.
Dmitry Romanov, Казанцев Н. С., Edgeeva E., , in: Business Process Management: Blockchain and Central and Eastern Europe Forum. BPM 2019Vol. 361.: Springer, 2019. P. 337–341.
Добавлено: 26 октября 2020 г.
Kopeykina L., Савченко А. В., , in: Proceedings of the VI International conference Information Technology and Nanotechnology. Session Image Processing and Earth Remote Sensing (ITNT-IPERS)Vol. 2665: Information Technology and Nanotechnology. Image Processing and Earth Remote Sensing 2020.: Samara: CEUR Workshop Proceedings, 2020. Ch. 39 P. 171–176.
Добавлено: 1 октября 2020 г.
Бызов А. А., Социология: методология, методы, математическое моделирование 2019 № 49 С. 131–160
На протяжении практически всей своей истории социологи стремились изучать неструктурированные органические тексты: материалы газет, дневники, мемуары, письма, документы, а с недавнего времени и сообщения, публикации и другие тексты на различных онлайн-платформах. В этой статье обсуждается то, как современные техники интеллектуального анализа текста (ИАТ) могут улучшить классические социологические подходы к анализу такого типа данных. Статья построена ...
Добавлено: 9 декабря 2019 г.
Малафеев А. Ю., Николаев К. И., , in: Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers. Communications in Computer and Information ScienceVol. 1086.: Springer, 2020. P. 154–159.
В статье проводится исследование методов глубокого обучения для решения новой задачи многоклассовой классификации текстов, а именно определения интересов пользователей с помощью текстовых сообщений. Мы использовали оригинальный набор данных из почти 90 тысяч текстовых сообщений с форумов, размеченных по десяти интересам. Мы экспериментировали с различными современными архитектурами нейронных сетей: рекуррентными и сверточными, а также с более простыми сетями с прямой связью. ...
Добавлено: 7 ноября 2019 г.
Pimonova E., Дурандин О. В., Малафеев А. Ю., , in: Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Lecture Notes in Computer Science, Revised Selected PapersVol. 11832.: Cham: Springer, 2019. P. 193–204.
В данной работе рассматривается проблема моделирования авторского стиля на русском языке. В частности, мы решаем задачу атрибуции авторства, используя собранный набор данных из 30 авторов, 1506 текстов, написанных в период с 18 по 21 век. Мы применяем различные подходы к решению проблемы атрибуции: случайный лес, логистическая регрессия, метод опорных векторов. С точки зрения представления текста, ...
Добавлено: 7 ноября 2019 г.