?
Ассоциативная (однородная семантическая) сеть - семантический компонент системы распознавания слитной речи
.
В работе представлен подход к реализации языковой модели, которая совместно с произносительной моделью, подходы к реализации которой в настоящий момент достаточно хорошо проработаны, позволяет повысить качество распознавания. Языковая модель в данном подходе реализуется в виде ассоциативной (однородной семантической) сети, которая дополняется такими же ассоциативными сетями в качестве моделей предметных областей. Отличие модели предметной области от языковой модели заключается в устранении из анализа, при формировании модели предметной области, общеязыковой информации. Сохраняется лишь сеть переходов между ключевыми понятиями. Эффективным средством для реализации подхода является использование кортикоморфной ассоциативной памяти.
Харламов А. А., , in : Neuroinformatics and Semantic Representations: Theory and Applications. : Cambridge Scholars Publishing, 2020. P. 156-167.
На основе представлений об обработке информации в мозге человека [1] реализована технология автоматической смысловой обработки текстов TextAnalyst, позволяющая выявить ключевые понятия текста в их взаимосвязях, реализовать реферирование текстов и их смысловое сравнение (классификацию). Реализованы продукты, использующие функциональность этой технологии: персональный – TextAnalyst, и библиотека COM модулей – TextAnalyst SDK. ...
Добавлено: 7 декабря 2021 г.
Харламов А. А., Kulikov A., , in : Neuroinformatics and Semantic Representations: Theory and Applications. : Cambridge Scholars Publishing, 2020. P. 219-231.
В работе показано использование механизма сравнения семантических сетей текстов в задаче диагностики заболеваний с использованием сигнальных сетей. Выявление степени пересечения семантических сетей текстов позволяет говорить о степени их смыслового подобия. Однородная семантическая сеть как множество узлов, связанных дугами, имеет численные характеристики – частоты появления слов, а также пар слов в тексте, которые перенормируются с использованием ...
Добавлено: 7 декабря 2021 г.
Чеповский А. М., В кн. : SCVRT2013-14 Труды Международной научной конференции Международного центра по ядерной безопасности Института физико-технической информатики. : Протвино : Изд-во ИФТИ, 2014. С. 250-254.
Рассматривается задача классификации текстовых сообщений. Описываются модели выделения структурных единиц текстов и методика классификации на основе взаимной информации. Анализируется выбор дифференцирующих признаков для задачи классификации. ...
Добавлено: 21 ноября 2014 г.
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК. ...
Добавлено: 30 июля 2017 г.
Буйлова Н. Н., Научно-техническая информация. Серия 2: Информационные процессы и системы 2018 № 8 С. 34-38
В настоящем обзоре была рассмотрена проблема классификации документов по жанрам, выделены основные характеристики текста, используемые для распознавания жанра текста, и описаны наиболее широко применяемые алгоритмы машинного обучения. Рассмотренные методы служат для классификации научных, технических, публицистических и художественных текстов. ...
Добавлено: 28 марта 2018 г.
Ананьева М. И., Кобозева М. В., Соловьев Ф. Н. и др., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2016 Т. 14 № 4 С. 5-13
Рассматриваются методы, используемые для обнаружения экстремистских текстов из Интернета. Дальнейшее исследование необходимо, чтобы найти новые методы классификации текстов и дифференцирующие признаки для классификации текстов экстремистской тематики. ...
Добавлено: 25 января 2017 г.
Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947
Добавлено: 15 августа 2022 г.
Ломотин К. Е., Романова И. И., В кн. : ФЭЭ 2017: Физика, Электроника, Электротехника. Материалы научно-технической конференции. : Сумы : СумДу, 2017. С. 152-152.
В процессе обработки текстов остро встает проблема нехватки производительности. Семантические и статистические модели документов требуют сложных вычислений, которые могут занимать длительное время. Эта проблема является преградой на пути внедрения последних разработок в области классификации текстов. В данной работе рассматривается проект аппаратного модуля, реализующего классификацию входящих документов по заданным тематикам. ...
Добавлено: 31 июля 2017 г.
Поляков И. В., Соколова Т. В., Чеповский А. А. и др., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2015 Т. 13 № 2 С. 55-63
Описан метод классификации текстов на естественных языках, основанный на методе взаимной информации. Показано, что псевдоосновы, выделенные аналитическим алгоритмом морфологического анализа, являются универсальными дифференцирующими признаками при классификации текстовых сообщений. ...
Добавлено: 24 октября 2015 г.
Харламов А. А., Ермоленко Т. В., Информационные технологии 2015 № 11 С. 814-820
Ассоциативная память человека является средством для преодоления информационной сложности, возникающей постоянно в процессе его жизнедеятельности. Рассмотрены архитектура, свойства и функциональность ассоциативной памяти с точки зрения использования ее для моделирования способности преодоления информационной сложности; прототип ассоциативной памяти – гиперколонки коры больших полушарий головного мозга человека; информационные свойства нейроморфной ассоциативной памяти: автоматическое структурирование больших объемов разнородной информации, ...
Добавлено: 19 ноября 2016 г.
Сметанин С. И., , in : Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.). Issue 19(26): дополнительный том.: -, 2020. P. 1149-1159.
Добавлено: 30 ноября 2020 г.
Karpov N., Demidovskij A., Malafeev A., , in : Supplementary Proceedings of the Sixth International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2017), Moscow, Russia, July 27-29, 2017. Vol. 1975.: Aachen : CEUR-WS.org, 2017. P. 69-78.
Добавлено: 14 ноября 2017 г.
Харламов А. А., Ермоленко Т. В., Жонин А. А., В кн. : Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2014) : материалы IV междунар. науч.-техн. конф. (Минск, 20-22 февраля 2014 года). : Мн. : БГУИР, 2014. С. 161-168.
Описанный в статье подход к моделированию динамики процессов основан на технологии автоматического смыслового анализа текстовой информации. В процессе обработки текста формируется ассоциативная сеть, ключевые понятия которой, в том числе, лексические маркеры анализируемого процесса, ранжируются их смысловым весом. Взвешенный статусом маркера на шкале «хорошо - плохо», этот вес дает значение вклада маркера в характеристику состояния процесса. ...
Добавлено: 19 ноября 2016 г.
Малафеев А. Ю., Дружков К. А., В кн. : Нелинейная динамика в когнитивных исследованиях – 2015. Труды IV всероссийской конференции. : Н. Новгород : ИПФ РАН, 2015. С. 147-148.
В данной публикации была сформулирована задача автоматического определения интолерантных высказываний в политическом дискурсе и СМИ и намечен один из возможных путей ее решения. В дальнейшем предполагается реализовать предложенный метод и оценить его эффективность. ...
Добавлено: 21 сентября 2015 г.
Малафеев А. Ю., Николаев К. И., , in : Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers. Communications in Computer and Information Science. Vol. 1086.: Springer, 2020. P. 154-159.
В статье проводится исследование методов глубокого обучения для решения новой задачи многоклассовой классификации текстов, а именно определения интересов пользователей с помощью текстовых сообщений. Мы использовали оригинальный набор данных из почти 90 тысяч текстовых сообщений с форумов, размеченных по десяти интересам. Мы экспериментировали с различными современными архитектурами нейронных сетей: рекуррентными и сверточными, а также с более простыми сетями с прямой связью. ...
Добавлено: 7 ноября 2019 г.
Бызов А. А., Социология: методология, методы, математическое моделирование 2019 № 49 С. 131-160
На протяжении практически всей своей истории социологи стремились изучать неструктурированные органические тексты: материалы газет, дневники, мемуары, письма, документы, а с недавнего времени и сообщения, публикации и другие тексты на различных онлайн-платформах. В этой статье обсуждается то, как современные техники интеллектуального анализа текста (ИАТ) могут улучшить классические социологические подходы к анализу такого типа данных. Статья построена ...
Добавлено: 9 декабря 2019 г.
Казарцев Е. В., Долженко Д. Ю., Емельянов Н. И., В кн. : International Scientific and Theoretical Conference "Problems of poetry and prosody IX" is dedicated to the 30th anniversary of the Independence of the Republic of Kazakhstan and the 90th Anniversary of the Outstanding Kazakh Poet Mukagali Makatayev 20-21 May 2021 Almaty. : КазНПУ им. Абая, 2021. С. 35-40.
Статья посвящена анализу влияния стихотворного ритма на прозу Б. Л. Пастернака и В. В. Набокова. В результате исследования стихоподобных фрагментов прозы у этих авторов были отмечены существенные отличия в проявлении поэтических тенденций. В процессе эволюции ритмика прозы Пастернака обнаруживает сближение с ритмикой классических образцов русского стиха, в то время как Набоков напротив со временем отходит ...
Добавлено: 31 октября 2021 г.
Ланин В. В., Горбунова М. А., Прикладная информатика 2019
Статья описывает процесс разработки модели для сравнения стилистических характеристик научных текстов на английском языке. В ходе работы модель была сформирована из нескольких компонентов, таких как метод представления текстовой информации, метод сравнения этих моделей и способ представления стилистических характеристик текста, а также протестирована на пробном наборе данных. Метрики сравнения стилистических характеристик текстов могут быть использованы для ...
Добавлено: 16 декабря 2018 г.
Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6-9
В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...
Добавлено: 31 января 2023 г.
Романов А. Ю., Lomotin K.E., Kozlova E.S. и др., , in : 2016 International Siberian Conference on Control and Communications (SIBCON). Proceedings. : M. : HSE, 2016. Ch. 543fu4t.
В данной работе рассмотрена реализация автоматической рубрикации текстов научных статей по классификатору UDC, проведено исследование эффективности применения нейросетевых технологий для данной задачи. Предложены оптимальная архитектура и параметры нейронной сети. ...
Добавлено: 11 июня 2016 г.
Дурандин О. В., Золотых Н. Ю., Хилал Н. Р. и др., Научно-технический вестник информационных технологий, механики и оптики 2017 № 1(107) С. 110-116
Предмет исследования. Предложен подход к решению задачи классификации, использующий информацию о распределении вероятностей на множестве классов в обучающей выборке. Алгоритм проиллюстрирован на одной из сложных задач автоматической обработки текстов на естественном языке – классификации арабских диалектов. Метод.Каждому объекту обучающей выборки сопоставляется распределение вероятностей над метками классов, вместо сопоставления единственной метки класса. Предлагаемый подход решает задачу с учетом ...
Добавлено: 8 февраля 2017 г.
Белова П. Е., Юрислингвистика 2023 № 27(38) С. 94-98
В рамках лингвистической экспертизы по делам о нарушении авторских и смежных прав в отношении речевых произведений перед экспертами все чаще ставится вопрос о сравнении нескольких текстов и поиске в них полнотекстовых, частичных и иных (лексических, грамматических, семантических и пр.) совпадений, а также об определении величины данных совпадений. Сравнение документов вручную, как правило, занимает много времени, ...
Добавлено: 6 апреля 2023 г.
Харламов А. А., Ермоленко Т. В., Информационные технологии 2015 № 11 С. 814-820
Ассоциативная память человека является средством для преодоления информационной сложности, возникавшей и возникающей постоянно в процессе его жизнедеятельности. В работе рассмотрена архитектура, свойства и функциональность ассоциативной памяти с целью ее использования для моделирования способности преодоления информационной сложности. Рассмотрен процесс перенормировки весовых характеристик образов событий, хранящихся в иерархии колонок коры полушарий большого мозга человека, который происходит в ...
Добавлено: 12 ноября 2016 г.
Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн. : НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года. : М. : ВИНИТИ РАН, 2022. С. 103-109.
В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...
Добавлено: 31 января 2023 г.