TextAnalyst Technology for Automatic Semantic Analysis of Text

?

TextAnalyst Technology for Automatic Semantic Analysis of Text

P. 156–167.

На основе представлений об обработке информации в мозге человека [1] реализована технология автоматической смысловой обработки текстов TextAnalyst, позволяющая выявить ключевые понятия текста в их взаимосвязях, реализовать реферирование текстов и их смысловое сравнение (классификацию). Реализованы продукты, использующие функциональность этой технологии: персональный – TextAnalyst, и библиотека COM модулей – TextAnalyst SDK.

Язык: английский

Текст на другом сайте

В книге

Neuroinformatics and Semantic Representations: Theory and Applications

Cambridge Scholars Publishing, 2020.

Дискриминативная лемматизация сокращений в эпоху LLM

Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155

В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...

Добавлено: 10 марта 2026 г.

Transformer-based approaches for lemmatizing abbreviations in Russian texts

Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47

Добавлено: 10 марта 2026 г.

Эмоциональный анализ постов в ВКонтакте: классификатор или регрессор

Колмогорова А. В., Калинин А. А., В кн.: Компьютерная лингвистика и интеллектуальные технологии: по материалам международной конференции «Диалог 2022», выпуск 21Вып. 21.: Изд-во РГГУ, 2022. С. 311–322.

В статье обсуждаются результаты решения двух задач машинного обучения: задачи классификации тек стов социальных сетей на русском языке по критерию доминирующей эмоции и задачи регрессии, в рамках которой эмоции в тех же текстах социальных сетей предсказываются. В основе экспериментов – сформиро ванный авторами датасет из 3879 текстов из пабликов ВКонтакте, размеченный 2000 асессорами на краудсор синговой платформе Толока. Аннотирование ...

Добавлено: 18 марта 2024 г.

Machine learning approach for scientific and technical expertise

A. V. Belov, E. A. Egorova, Bulletin D. Serikbayev East Kazakhstan Technical University 2023 No. 4 P. 92–102

Добавлено: 9 марта 2024 г.

Classification of Short Scientific Texts

I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176–183

Добавлено: 4 ноября 2023 г.

Near-Zero-Shot Suggestion Mining with a Little Help from WordNet

Alekseev A., Тутубалина Е. В., Kwon S. и др., , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 23–36.

Добавлено: 10 апреля 2023 г.

Selection of Pseudo-Annotated Data for Adverse Drug Reaction Classification Across Drug Groups

Alimova I., Тутубалина Е. В., , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 37–44.

Добавлено: 10 апреля 2023 г.

Способы автоматизации сравнительного анализа текстов при выявлении признаков плагиата в экспертизах по делам о нарушении авторских и смежных прав

Белова П.Е., Юрислингвистика 2023 № 27(38) С. 94–98

В рамках лингвистической экспертизы по делам о нарушении авторских и смежных прав в отношении речевых произведений перед экспертами все чаще ставится вопрос о сравнении нескольких текстов и поиске в них полнотекстовых, частичных и иных (лексических, грамматических, семантических и пр.) совпадений, а также об определении величины данных совпадений. Сравнение документов вручную, как правило, занимает много времени, ...

Добавлено: 6 апреля 2023 г.

Использование BERT для классификации коротких научных текстов на русском языке

Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн.: НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.: М.: ВИНИТИ РАН, 2022. С. 103–109.

В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...

Добавлено: 31 января 2023 г.

Исследование методов машинного обучения для классификации научных текстов на русском языке

Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6–9

В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...

Добавлено: 31 января 2023 г.

Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki

Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947

Добавлено: 15 августа 2022 г.

RuSentiTweet: a sentiment analysis dataset of general domain tweets in Russian

Сметанин С. И., PeerJ Computer Science 2022 No. 8 Article e1039

The Russian language is still not as well resourced as English, especially in the field of sentiment analysis of Twitter content. Though several sentiment analysis datasets of tweets in Russia exist, they all are either automatically annotated or manually annotated by one annotator. Thus, there is no inter-annotator agreement, or annotation may be focused on ...

Добавлено: 29 июня 2022 г.

Using a Homogeneous Semantic Network to Classify the Results of Genetic Analysis

Харламов А. А., Kulikov A., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 219–231.

В работе показано использование механизма сравнения семантических сетей текстов в задаче диагностики заболеваний с использованием сигнальных сетей. Выявление степени пересечения семантических сетей текстов позволяет говорить о степени их смыслового подобия. Однородная семантическая сеть как множество узлов, связанных дугами, имеет численные характеристики – частоты появления слов, а также пар слов в тексте, которые перенормируются с использованием ...

Добавлено: 7 декабря 2021 г.