• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Ассоциативная (однородная семантическая) сеть - семантический компонент системы распознавания слитной речи
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 апреля 2026 г.
«Моя цель - стать ординарным профессором»
Михаил Саматов занимается теоретическими исследованиями перовскитных солнечных батарей. В интервью проекту «Молодые ученые Вышки» он рассказал о работе на суперкомпьютере Вышки, сотрудничестве с Пекинским университетом и умении делать мебель.
29 апреля 2026 г.
Научить машину читать прошлое: на ФГН создают нейросеть для расшифровки рукописей
Дневники и письма — бесценный источник для гуманитария-исследователя. Но что делать, если текст невозможно прочитать? На факультете гуманитарных наук (ФГН) ВШЭ эту проблему решили перевести на язык математики: команда филологов, историков и специалистов по машинному обучению создала информационную систему, которая не только распознает неразборчивый почерк, но и помогает анализировать содержание архивов.
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Ассоциативная (однородная семантическая) сеть - семантический компонент системы распознавания слитной речи

.
Харламов А. А.

В работе представлен подход к реализации языковой модели, которая совместно с произносительной моделью, подходы к реализации которой в настоящий момент достаточно хорошо проработаны, позволяет повысить качество распознавания. Языковая модель в данном подходе реализуется в виде ассоциативной (однородной семантической) сети, которая дополняется такими же ассоциативными сетями в качестве моделей предметных областей. Отличие модели предметной области от языковой модели заключается в устранении из анализа, при формировании модели предметной области, общеязыковой информации. Сохраняется лишь сеть переходов между ключевыми понятиями. Эффективным средством для реализации подхода является использование кортикоморфной ассоциативной памяти.

Язык: русский
Текст на другом сайте
Ключевые слова: классификация текстовассоциативная (однородная семантическая) сетьсравнение текстовраспознавание слитной речиязыковая модель

В книге

Речевая коммуникация в информационном пространстве
Речевая коммуникация в информационном пространстве
М.: Издательская группа URSS, 2016.
Похожие публикации
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Языковые модели для предобработки текстов в машинном переводе
Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 7 С. 32–44
Рассмотрена модель использования скелетных структур на базе синтаксической разметки для предобработки корпусов текстов перед передачей в нейросетевые модели машинного перевода с целью повышения качества их работы, реализованная с помощью частеречной и синтаксической разметок корпусов текстов, использующих языковую модель, с использованием сети BERT и набора правил. Описана подготовка данных для обучения и предложены способы повышения эффективности ...
Добавлено: 22 сентября 2025 г.
Способы автоматизации сравнительного анализа текстов при выявлении признаков плагиата в экспертизах по делам о нарушении авторских и смежных прав
Белова П.Е., Юрислингвистика 2023 № 27(38) С. 94–98
В рамках лингвистической экспертизы по делам о нарушении авторских и смежных прав в отношении речевых произведений перед экспертами все чаще ставится вопрос о сравнении нескольких текстов и поиске в них полнотекстовых, частичных и иных (лексических, грамматических, семантических и пр.) совпадений, а также об определении величины данных совпадений. Сравнение документов вручную, как правило, занимает много времени, ...
Добавлено: 6 апреля 2023 г.
Использование BERT для классификации коротких научных текстов на русском языке
Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн.: НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.: М.: ВИНИТИ РАН, 2022. С. 103–109.
В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...
Добавлено: 31 января 2023 г.
Исследование методов машинного обучения для классификации научных текстов на русском языке
Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6–9
В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...
Добавлено: 31 января 2023 г.
Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki
Sergey Smetanin, Mathematics 2022 Vol. 10 No. 16 Article 2947
Добавлено: 15 августа 2022 г.
RuSentiTweet: a sentiment analysis dataset of general domain tweets in Russian
Сметанин С. И., PeerJ Computer Science 2022 No. 8 Article e1039
The Russian language is still not as well resourced as English, especially in the field of sentiment analysis of Twitter content. Though several sentiment analysis datasets of tweets in Russia exist, they all are either automatically annotated or manually annotated by one annotator. Thus, there is no inter-annotator agreement, or annotation may be focused on ...
Добавлено: 29 июня 2022 г.
Using a Homogeneous Semantic Network to Classify the Results of Genetic Analysis
Харламов А. А., Kulikov A., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 219–231.
В работе показано использование механизма сравнения семантических сетей текстов  в задаче диагностики заболеваний с использованием сигнальных сетей. Выявление степени пересечения семантических сетей текстов позволяет говорить о степени их смыслового подобия. Однородная семантическая сеть как множество узлов, связанных дугами, имеет численные характеристики – частоты появления слов, а также пар слов в тексте, которые перенормируются с использованием ...
Добавлено: 7 декабря 2021 г.
TextAnalyst Technology for Automatic Semantic Analysis of Text
Харламов А. А., , in: Neuroinformatics and Semantic Representations: Theory and Applications.: Cambridge Scholars Publishing, 2020. P. 156–167.
На основе представлений об обработке информации в мозге человека [1] реализована технология автоматической смысловой обработки текстов TextAnalyst, позволяющая выявить ключевые понятия текста в их взаимосвязях, реализовать реферирование текстов и их смысловое сравнение (классификацию). Реализованы продукты, использующие функциональность этой технологии: персональный – TextAnalyst, и библиотека COM модулей – TextAnalyst SDK. ...
Добавлено: 7 декабря 2021 г.
Особенности ритмики прозы поэта: поэт-прозаик и прозаик-поэт
Казарцев Е. В., Долженко Д. Ю., Емельянов Н. И., В кн.: International Scientific and Theoretical Conference "Problems of poetry and prosody IX" is dedicated to the 30th anniversary of the Independence of the Republic of Kazakhstan and the 90th Anniversary of the Outstanding Kazakh Poet Mukagali Makatayev 20-21 May 2021 Almaty.: КазНПУ им. Абая, 2021. С. 35–40.
Статья посвящена анализу влияния стихотворного ритма на прозу Б. Л. Пастернака и В. В. Набокова. В результате исследования стихоподобных фрагментов прозы у этих авторов были отмечены существенные отличия в проявлении поэтических тенденций. В процессе эволюции ритмика прозы Пастернака обнаруживает сближение с ритмикой классических образцов русского стиха, в то время как Набоков напротив со временем отходит ...
Добавлено: 31 октября 2021 г.
Toxic Comments Detection in Russian
Сметанин С. И., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.)Issue 19(26): дополнительный том.: -, 2020. P. 1149–1159.
Добавлено: 30 ноября 2020 г.
Интеллектуальный анализ текстов в социальных науках
Бызов А. А., Социология: методология, методы, математическое моделирование 2019 № 49 С. 131–160
На протяжении практически всей своей истории социологи стремились изучать неструктурированные органические тексты: материалы газет, дневники, мемуары, письма, документы, а с недавнего времени и сообщения, публикации и другие тексты на различных онлайн-платформах. В этой статье обсуждается то, как современные техники интеллектуального анализа текста (ИАТ) могут улучшить классические социологические подходы к анализу такого типа данных. Статья построена ...
Добавлено: 9 декабря 2019 г.
A Deep Learning Method Study of User Interest Classification
Малафеев А. Ю., Николаев К. И., , in: Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers. Communications in Computer and Information ScienceVol. 1086.: Springer, 2020. P. 154–159.
В статье проводится исследование методов глубокого обучения для решения новой задачи многоклассовой классификации текстов, а именно определения интересов пользователей с помощью текстовых сообщений. Мы использовали оригинальный набор данных из почти 90 тысяч текстовых сообщений с форумов, размеченных по десяти интересам. Мы экспериментировали с различными современными архитектурами нейронных сетей: рекуррентными и сверточными, а также с более простыми сетями с прямой связью. ...
Добавлено: 7 ноября 2019 г.
Ассоциативная память – нейросетевая среда для формирования единого пространства знаний
Харламов А. А., Информационные технологии 2017 № 1 С. 66–75
Ассоциативная память человека является средой для формирования единого пространства знаний. Рассмотрена обработка текстовой информации как пример процесса обработки человеком информации любой модальности с формированием однородной семантической сети ключевых понятий текста, ранжированных по степени их важности, а так­же иерархической тематической структуры, характеризующей сложность текста. Результаты текстового анализа наглядно интерпретируются на анализе конкретных текстов с применением аппарата ...
Добавлено: 20 февраля 2019 г.
The Prosody of a Poet's Prose: Comparative Analysis of the Rhythmic Structure of A. Pushkin Prose
Наконечная Е. Т., , in: Proceedings of the 22nd Conference of Open Innovations Association FRUCT.: Jyvaskyla: [б.и.], 2018. P. 361–365.
Статья является продолжением ряда исследований, посвященных изучению ритмики художественной прозы А. С. Пушкина. В работе рассматриваются такие произведения, как «Дубровский», «Пиковая дама», «Капитанская дочка», «Кирджали», «Египетские ночи». Применяется метод отбора «случайных» четырехстопных ямбов. Ритмика стихоподобных фрагментов сравнивается с вероятностно-статистическими моделями распределения стихотворных строк в прозе. В результате анализа случайных стихоподобных фрагментов рассмотрена эволюция ритмики прозы ...
Добавлено: 12 июня 2018 г.
Классификация текстов по жанрам при помощи алгоритмов машинного обучения
Буйлова Н. Н., Научно-техническая информация. Серия 2: Информационные процессы и системы 2018 № 8 С. 34–38
В настоящем обзоре была рассмотрена проблема классификации документов по жанрам, выделены основные характеристики текста, используемые для распознавания жанра текста, и описаны наиболее широко применяемые алгоритмы машинного обучения. Рассмотренные методы служат для классификации научных, технических, публицистических и художественных текстов. ...
Добавлено: 28 марта 2018 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору