• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Метод автоматической генерации модели управления глаголов русского языка
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 апреля 2026 г.
«Моя цель - стать ординарным профессором»
Михаил Саматов занимается теоретическими исследованиями перовскитных солнечных батарей. В интервью проекту «Молодые ученые Вышки» он рассказал о работе на суперкомпьютере Вышки, сотрудничестве с Пекинским университетом и умении делать мебель.
29 апреля 2026 г.
Научить машину читать прошлое: на ФГН создают нейросеть для расшифровки рукописей
Дневники и письма — бесценный источник для гуманитария-исследователя. Но что делать, если текст невозможно прочитать? На факультете гуманитарных наук (ФГН) ВШЭ эту проблему решили перевести на язык математики: команда филологов, историков и специалистов по машинному обучению создала информационную систему, которая не только распознает неразборчивый почерк, но и помогает анализировать содержание архивов.
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Метод автоматической генерации модели управления глаголов русского языка

С. 227–235.
Клышинский Э. С., Кочеткова Н. А.

Рассмотрен метод автоматической генерации словаря глагольного управления русского языка. Основой является статистическая обработка результатов поверхностного синтаксического анализа. Для анализа берутся неомонимичные группы слов, которые позволяют однозначноРассмотрен метод автоматической генерации словаря глагольного управления русского языка. Основой является статистическая обработка результатов поверхностного синтаксического анализа. Для анализа берутся неомонимичные группы слов, которые позволяют однозначно провести их синтаксический разбор. Для составления словаря использовался неразмеченный корпус объемом более 10 миллиардов словоупотреблений. провести их синтаксический разбор. Для составления словаря использовался неразмеченный корпус объемом более 10 миллиардов словоупотреблений.

Язык: русский
Полный текст
Ключевые слова: автоматическая обработка текстаглагольное управление

В книге

Тринадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (16-20 октября 2012 г., г. Белгород, Россия). Том 2
Тринадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (16-20 октября 2012 г., г. Белгород, Россия). Том 2
Т. 2. , Белгород: Белгородский государственный технологический университет им. В.Г. Шухова, 2012.
Похожие публикации
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи
Лелик В. П., Еремичева Т. А., Морозова Д. А. и др., В кн.: Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.: М.: «Буки Веди», Московский институт психоанализа, 2023. С. 274–279.
Одно из условий эффективной работы автоматических морфологических анализаторов — это корректное распознавание незнакомых слов и успешное снятие морфологической омонимии. В настоящей работе оценивались результаты автоматиче- ской обработки расшифровок спонтанной детской речи с помощью морфологического анализатора MyStem. Материалами для исследования послужили лонгитюдные записи спонтанной речи двух детей-билингвов и их родителей, созданные по протоколу корпу- са CHILDES. ...
Добавлено: 5 апреля 2024 г.
Проект Chekhov Digital: задачи и проблемы реализации семантической разметки текстов (на примере рассказа А. П. Чехова «Смерть чиновника»)
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211–222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
ВИЗУАЛИЗАЦИЯ ДАННЫХ В ЭМОЦИОНАЛЬНОМ АНАЛИЗЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ТЕКСТОВ НА ОСНОВЕ МОДЕЛИ "КУБ ЛЁВХЕЙМА"
Колмогорова А. В., Калинин А. А., В кн.: Язык и искусственный интеллект: Сборник статей по итогам конференции «Лингвистический форум 2020: Язык и искусственный интеллект».: Издательский дом ЯСК, 2023. С. 167–181.
В данной публикации рассматривается специфика и эвристика средств визуализации данных, полученных в результате применения алгоритмов анализа эмоций в тексте. Дан общий обзор применения техник визуализации для задач сентимент-анализа и анализа эмоций. Предложены варианты визуализации эмоционального представления текстов, анализируемых в рамках теоретического подхода «Куб Лёвхейма», в котором эмоция представляется в виде комбинации трех нейротрансмиттеров. Подобная модель ...
Добавлено: 31 октября 2023 г.
Обзор методов оценки сложности текстов в сфере регулирования банковской деятельности
Морковкин А. Г., Ильвовский Д. А., В кн.: ИТиС 2022: Сборник трудов 46-й междисциплинарной школы-конференции ИППИ РАН "Информационные технологии и системы 2022".: Институт проблем передачи информации им. А.А. Харкевича РАН, 2022.
Оценка сложности текстов является важной и актуальной задачей области обработки естественного языка. Например, в банковской сфере, по мнению экспертов, прослеживается тенденция к повышению сложности текстов во всех областях финансового регулирования, что усложняет их понимание даже профессионалами. Это может приводить к различным трактовкам, поэтому текст должен быть написан простым языком и быть понятным для адресатов. Но ...
Добавлено: 23 сентября 2023 г.
Building Dataset and Morpheme Segmentation Model for Russian Word Forms
Большакова Е. И., Sapin A., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. P. 154–161.
Добавлено: 30 октября 2021 г.
Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference “Dialogue” (2019)
M.: Russian State University for the Humanitie, 2019.
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...
Добавлено: 16 октября 2019 г.
Анализ корпусов текстов террористической и антиправовой направленности
Лаврентьев А. М., Смирнов И. В., Соловьев Ф. Н. и др., Вопросы кибербезопасности 2019 № 4(32) С. 54–60
Цель исследования: разработка методики создания и автоматического анализа специальных корпусов текстов для последующего применения их в качестве обучающих выборок и определения дифференцирующих признаков в задачах классификации текстов. Метод: применялись инструменты анализа корпусной платформы TXM, расширенной разработанными процедурами вычисления дополнительных характеристик текстов, таких как буквосочетания, псевдоосновы, именные группы, глагольные группы.  Полученные результаты: показано, что  разработанные средства расширения ...
Добавлено: 10 августа 2019 г.
Внедрение в TXM дополнительных инструментов автоматической обработки текста
Лаврентьев А. М., Соловьев Ф. Н., Чеповский А. М., В кн.: Труды международной конференции "Корпусная лингвистика - 2019".: СПб.: Издательство Санкт-Петербургского университета, 2019. С. 55–62.
Представлен опыт расширения возможностей платформы TXM за счет инструментов автоматической обработки текста (выделение псевдооснов, именных групп, анализ глагольного управления). В сочетании со стандартными функциями TXM (факторный анализ соответствий, специфичность и т.д.) они позволяют более эффективно осуществлять анализ специализированных корпусов, нацеленных, в частности, на выявление противоправного дискурса. ...
Добавлено: 8 июля 2019 г.
Машинная лингвистика: от перевода со словарём к нелинейным динамическим системам
Волкова Л. Л., В кн.: Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-технического семинара.: М.: Московский государственный институт электроники и математики, 2013. С. 317–328.
В статье дан краткий обзор ключевых этапов развития машинной лингвистики в разрезе анализа и синтеза текста. Выделены проблемы работы с языком, являющиеся фундаментальными ограничениями, отделяющими существующий уровень развития отрасли от качественно нового. Рассмотрены перспективные теории, предлагающие новый подход к рассмотрению языка и открывающие возможность заглянуть за барьер машинной лингвистики. ...
Добавлено: 31 января 2018 г.
Automatic Arabic Dialect Classification
Durandin O. V., Strebkov D. Y., Hilal N. R., , in: Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (2016).: М.: Изд-во РГГУ, 2016. P. 1–13.
Добавлено: 18 января 2017 г.
Моделирование динамики процессов последовательностью однородных семантических сетей на основе анализа последовательности описывающих процесс текстовых выборок
Харламов А. А., Ермоленко Т. В., Жонин А. А., В кн.: Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2014) : материалы IV междунар. науч.-техн. конф. (Минск, 20-22 февраля 2014 года).: Мн.: БГУИР, 2014. С. 161–168.
Описанный в статье подход к моделированию динамики процессов основан на технологии автоматического смыслового анализа текстовой информации. В процессе обработки текста формируется ассоциативная сеть, ключевые понятия которой, в том числе, лексические маркеры анализируемого процесса, ранжируются их смысловым весом. Взвешенный статусом маркера на шкале «хорошо - плохо», этот вес дает значение вклада маркера в характеристику состояния процесса. ...
Добавлено: 19 ноября 2016 г.
Морфосинтаксическая разметка текста на китайском языке с помощью статистических анализаторов: методика, оценка качества.
Кубатиева А. А., В кн.: I Молодежная международная конференция «Методы точных наук в востоковедении», 10-11 ноября 2015 г.: Материалы конференции.: СПб.: Издательство РХГА, 2015.
Данная работа посвящена критериям выделения морфосинтаксических категорий в китайском языке и их моделированию для автоматической частеречной разметки текста. В работе приведен краткий обзор основных критериев выделения частей речи в современном китайском языке, их оценка с точки зрения задач автоматической обработки текста, в частности, с точки зрения частеречной разметки текста и использования статистических моделей. С помощью ...
Добавлено: 10 декабря 2015 г.
Exercise Maker: Automatic Language Exercise Generation
Малафеев А. Ю., , in: Computational Linguistics and Intellectual Technologies. Papers from the Annual International Conference “Dialogue” (2015)Issue 14(21).: M.: Russian State University for the Humanitie, 2015. P. 441–452.
Добавлено: 28 апреля 2015 г.
Метод визуального представления полноты отчетных документов
Клышинский Э. С., Калачев Я. Б., Научная визуализация 2014 Т. 6 № 3 С. 96–104
В статье рассматривается метод визуального контроля полноты технической документации, изучаемой в ходе ее приемки. Полнота отчетной документации проверяется по тексту технического задания. Для построения визуального представления используются как цветные точечные диаграммы, так и статистическая информация о степени соответствия текстов, полученная с использованием предлагаемого метода. ...
Добавлено: 25 марта 2015 г.
Система автоматической обработки русскоязычных текстов
Дубов М. С., Миркин Б. Г., Шаль А. А., Открытые системы. СУБД 2014 № 10 С. 15–17
Повышенное внимание к проблеме АОТ на естественных языках и появление новых методик анализа данных -- одна из главных тенденций ИТ-индустрии. Однако на сегодняшний день нет единого подхода к решению задачи обобщения и визуализации больших объемов текстовых данных. В основе системы LM Monitor (Latent Meaning Monitor) лежит идея использования графа референций, что в некотором смысле близко ...
Добавлено: 16 декабря 2014 г.
Language Exercise Generation: Emulating Cambridge Open Cloze
Малафеев А. Ю., International Journal of Conceptual Structures and Smart Applications (IJCSSA) 2014 Vol. 2 No. 2 P. 20–35
Добавлено: 29 ноября 2014 г.
Corpus-Based Text Retrieval and Adaptation for Learning System
Карпов Н. В., International Journal of Advances in Computer Science and Its Applications 2014 Vol. 4 No. 2 P. 38–43
The algorithm to adapt lexical complexity in the news article which can be used as materials for learning language presented in the paper. We consider words substitution retrieval according to wordnet-based and corpus-based semantic relatedness. Two corpus-based similarity measures empirically tested: Vector Space Model and Distributional Semantic Model. This language processing algorithm has created as ...
Добавлено: 23 ноября 2014 г.
Автоматическое создание словообразовательных упражнений на основе английского текста
Малафеев А. Ю., В кн.: Homo Loquens: Актуальные вопросы лингвистики и методики преподавания иностранных языков (2014)Вып. 6.: СПб.: Отдел оперативной полиграфии НИУ ВШЭ – Санкт-Петербург, 2014. С. 372–381.
В статье описывается эффективный алгоритм автоматического создания словообразовательных упражнений в формате, близком к кембриджским сертификационным экзаменам и российскому ЕГЭ. Задания генерируются на основе текстов любого объема и произвольной тематики на английском языке, что особенно актуально в контексте обучения английскому для профессиональных и академических целей. В процессе создания упражнений используется словарь из 11977 единиц: 2466 слов-основ ...
Добавлено: 15 октября 2014 г.
Методика автоматизации проверки полноты технической отчетной документации
Клышинский Э. С., Калачев Я. Б., Жаднов В. В., Научно-техническая информация. Серия 2: Информационные процессы и системы 2014 № 5 С. 11–15
Рассматривается новый метод автоматизации определения соответствия технического задания и итогового отчета в ходе его приемки. Предложенный метод позволяет экспертам получить предварительную оценку степени соответствия отчета техническому заданию. Используются выделение значимых фрагментов технического задания,поиск соответствующих им элементов отчета и проверка степени его покрытия. Разработанный метод,в отличие, например,от косинусной меры сходства, дает лучшее разделение отчетов по критерию ...
Добавлено: 30 июня 2014 г.
К вопросу об автоматизации проверки полноты отчетной документации
Клышинский Э. С., Калачев Я. Б., Жаднов В. В., Информационные технологии в проектировании и производстве 2014 № 2 С. 68–72
В статье рассматривается новый метод автоматизации определения соответствия технического задания и итогового отчета в ходе его приемки. Предложенный метод предлагает экспертам предварительную оценку степени соответствия отчета техническому заданию. Для этого используется выделение значимых фрагментов технического задания, поиск соответствующих им элементов отчета и проверка степени покрытия последнего. Разработанный метод, в отличие, например, от косинусной меры сходства, ...
Добавлено: 3 июня 2014 г.
Новые информационные технологии в автоматизированных системах: материалы семнадцатого научно-практического семинара
М.: Институт прикладной математики им. М.В. Келдыша РАН, 2014.
Содержит материалы, представленные к рассмотрению на научно-практический семинар “Новые информационные технологии в автоматизированных системах”. Представляет интерес для научных сотрудников, преподавателей, аспирантов и студентов, работающих по указанным научным направлениям. ...
Добавлено: 12 апреля 2014 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору