• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Russian-Language Question Classification: a New Typology and First Results
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.
14 мая 2026 г.
<a>Ученые ФКН ВШЭ представили работы в сфере ИИ и биоинформатики на ICLR 2026
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭи студенты трека «ИИ360: Инженерия искусственного интеллекта» бакалаврской программы «Прикладная математика и информатика» приняли участие в международной конференции ICLR — одном из самых авторитетных мировых форумов в области машинного обучения и представления данных. В этом году конференция состоялась в Рио-де-Жанейро (Бразилия).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Russian-Language Question Classification: a New Typology and First Results

Ch. 7. P. 72–81.
Николаев К. И., Malafeev A.

This paper deals with automatic classification of questions in the Russian language, a natural early step in building a question answering system. We developed a typology of Russian questions using interrogative particles, pronouns and word order as the main features. A corpus of 2008 questions was manually compiled and annotated according to our typology. We used a fine-grained class set and a coarse-grained one (23 and 14 classes, respectively). The training data, represented as character bi-/trigrams and word uni-/bi-/trigrams, was used to approach the task of question classification. We tested several widely used machine-learning methods (logistic regression, support vector machines, naïve Bayes) against a regular expression baseline on a held-out test corpus annotated by an external expert. The best results were achieved by a SVM classifier (linear kernel) that achieved the accuracy of 65.3% (fine-grained) and 68.7% (coarse-grained), while the baseline regular expression model showed 52.7% accuracy.

Язык: английский
Полный текст
DOI
Ключевые слова: question answeringquestion answering systemsQA systemsRussian-language questionsquestion classificationquestion taggingRussian question typology

В книге

Analysis of Images, Social Networks and Texts. 6th International Conference, 2017, Revised Selected Papers
Analysis of Images, Social Networks and Texts. 6th International Conference, 2017, Revised Selected Papers
Vol. 10716. , Cham: Springer, 2018.
Похожие публикации
RuCLEVR: A Russian Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning
Biryukova K., Chelnokova D., Erkenova J. и др., Communications in Computer and Information Science 2024 Vol. 2364 CCIS P. 109 – 121
Добавлено: 25 февраля 2026 г.
CausalQA: A Benchmark for Causal Question Answering
Bondarenko A., Wolska M., Heindorf S. и др., , in: Proceedings of the 29th International Conference on Computational Linguistics.: International Committee on Computational Linguistics, 2023. P. 3296–3308.
Добавлено: 14 августа 2023 г.
Relying on Discourse Trees to Extract Medical Ontologies from Text
Galitsky B., Ильвовский Д. А., Гончарова Е. Ф., , in: Artificial Intelligence. RCAI 2021. Lecture Notes in Computer ScienceVol. 12948.: Springer, 2021. P. 215–231.
Добавлено: 28 октября 2021 г.
DaNetQA: a yes/no Question Answering Dataset for the Russian Language
Glushkova T., Мачнев А. Е., Феногенова А. С. и др., , in: Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected PapersVol. 12602.: Springer, 2021. P. 57–68.
Добавлено: 22 ноября 2020 г.
Обогащение контекста вопросов знаниями из ConceptNet для улучшения точности ответов
Смирнов Д. М., Ильвовский Д. А., В кн.: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.). Доклады студенческой сессии.: [б.и.], 2020..
Современные модели для задачи Question Answering могут показывать точность ответов на фактические вопросы о данном фрагменте текста на английском языке близкую к человеческой. Между тем, такие модели не могут достичь такого же качества на наборах данных, которые требуют дополнительной информации, не представленной в контексте вопроса. В данной статье описывается экспериментальная оценка простого метода обогащения контекста ...
Добавлено: 16 сентября 2020 г.
Russian Q&A Method Study: From Naive Bayes to Convolutional Neural Networks
Николаев К. И., Малафеев А. Ю., , in: Analysis of Images, Social Networks and Texts. 7th International Conference AIST 2018.: Springer, 2018. Ch. 12 P. 121–126.
Добавлено: 15 февраля 2019 г.
Parse thicket representations of text paragraphs
Galitsky B., Ильвовский Д. А., Кузнецов С. О. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 239–255.
Мы разрабатываем технику представления структуры предложений и абзацев текста в виде графов. Мы определяем чащу синтаксиче ского разбора как объединение синтаксических деревьев разбора предложений. Чаща включает дуги между вершинами синтаксических деревьев для таких отношений, как кореферентность и таксономия. Эти дуги также получаются из других источников, в том числе, тео рии Риторических Структур и Речевых Актов. В работе предлагается алгоритм вычисления чащ разбора. ...
Добавлено: 1 ноября 2013 г.
Matching sets of parse trees for answering multi-sentence questions
Galitsky B., Ильвовский Д. А., Кузнецов С. О. и др., , in: Proceedings of the Recent Advances in Natural Language Processing.: Hissar: INCOMA Ltd, 2013. P. 285–293.
Добавлено: 1 ноября 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору