?
TextAnalyst Technology for Automatic Semantic Analysis of Text
P. 156–167.
На основе представлений об обработке информации в мозге человека [1] реализована технология автоматической смысловой обработки текстов TextAnalyst, позволяющая выявить ключевые понятия текста в их взаимосвязях, реализовать реферирование текстов и их смысловое сравнение (классификацию). Реализованы продукты, использующие функциональность этой технологии: персональный – TextAnalyst, и библиотека COM модулей – TextAnalyst SDK.
В книге
Cambridge Scholars Publishing, 2020.
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Колмогорова А. В., Калинин А. А., В кн.: Компьютерная лингвистика и интеллектуальные технологии: по материалам международной конференции «Диалог 2022», выпуск 21Вып. 21.: Изд-во РГГУ, 2022. С. 311–322.
В статье обсуждаются результаты решения двух задач машинного обучения: задачи классификации тек
стов социальных сетей на русском языке по критерию доминирующей эмоции и задачи регрессии, в рамках
которой эмоции в тех же текстах социальных сетей предсказываются. В основе экспериментов – сформиро
ванный авторами датасет из 3879 текстов из пабликов ВКонтакте, размеченный 2000 асессорами на краудсор
синговой платформе Толока. Аннотирование ...
Добавлено: 18 марта 2024 г.
A. V. Belov, E. A. Egorova, Bulletin D. Serikbayev East Kazakhstan Technical University 2023 No. 4 P. 92–102
Добавлено: 9 марта 2024 г.
I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176–183
Добавлено: 4 ноября 2023 г.
Alekseev A., Тутубалина Е. В., Kwon S. и др., , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 23–36.
Добавлено: 10 апреля 2023 г.
Alimova I., Тутубалина Е. В., , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 37–44.
Добавлено: 10 апреля 2023 г.
Белова П.Е., Юрислингвистика 2023 № 27(38) С. 94–98
В рамках лингвистической экспертизы по делам о нарушении авторских и смежных прав в отношении речевых произведений перед экспертами все чаще ставится вопрос о сравнении нескольких текстов и поиске в них полнотекстовых, частичных и иных (лексических, грамматических, семантических и пр.) совпадений, а также об определении величины данных совпадений. Сравнение документов вручную, как правило, занимает много времени, ...
Добавлено: 6 апреля 2023 г.
Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн.: НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.: М.: ВИНИТИ РАН, 2022. С. 103–109.
В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...
Добавлено: 31 января 2023 г.
Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6–9
В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...
Добавлено: 31 января 2023 г.
Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947
Добавлено: 15 августа 2022 г.
Сметанин С. И., PeerJ Computer Science 2022 No. 8 Article e1039
The Russian language is still not as well resourced as English, especially in the field of sentiment analysis of Twitter content. Though several sentiment analysis datasets of tweets in Russia exist, they all are either automatically annotated or manually annotated by one annotator. Thus, there is no inter-annotator agreement, or annotation may be focused on ...
Добавлено: 29 июня 2022 г.
Харламов А. А., Kulikov A., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 219–231.
В работе показано использование механизма сравнения семантических сетей текстов в задаче диагностики заболеваний с использованием сигнальных сетей. Выявление степени пересечения семантических сетей текстов позволяет говорить о степени их смыслового подобия. Однородная семантическая сеть как множество узлов, связанных дугами, имеет численные характеристики – частоты появления слов, а также пар слов в тексте, которые перенормируются с использованием ...
Добавлено: 7 декабря 2021 г.