• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
24 июня 2026 г.
Древняя чашекрания - новый вид брахиопод с необычной формой раковины и образом жизни
Российские ученые из Высшей школы экономики, МГУ имени М.В. Ломоносова и Таллинского технического университета изучили ископаемый вид древних брахиопод (плеченогих), который обитал в теплом море на севере современной Эстонии более 445 миллионов лет назад. Древняя брахиопода росла в форме чашки со «шляпкой», чтобы защититься от зарастания. Исследование опубликовано в журнале Palaeogeography, Palaeoclimatology, Palaeoecology.
23 июня 2026 г.
<a><a><a>НИУ ВШЭ и Positive Technologies наградили проекты молодых ученых по оценке последствий кибератак
Молодые исследователи из ведущих вузов страны представили проекты по прогнозированию и оценке последствий кибератак. Защита идей прошла 22 июня в Москве в рамках междисциплинарного научного конкурса, организованного Институтом мировой военной экономики и стратегии НИУ ВШЭ и Positive Technologies. Победителями стали команды Военно-космической академии имени Можайского, НИУ ВШЭ и университета «Сириус» — они разделят грантовый фонд в три миллиона рублей и продолжат свои разработки под руководством научных наставников.
23 июня 2026 г.
Дрожь земли: ученые ВШЭ научились отслеживать опасные подземные вибрации в реальном времени
Исследователи из МИЭМ ВШЭ и ИПКОН РАН разработали новую математическую модель мониторинга, которая позволяет фиксировать источник опасных подземных вибраций в реальном времени. Технология поможет снизить риск повреждения зданий, дорог и другой инфраструктуры рядом с карьерами и шахтами. Работа ученых опубликована в журнале «Горная промышленность».

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка)

С. 159–175.
Митрофанова О. А., Ляшевская О. Н., Грачкова М. А., Шиморина А. С., Шурыгина А. С., Романов С. В.

Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex),
морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.

Язык: русский
Полный текст
Ключевые слова: Национальный корпус русского языкаконструкцииразрешение лексико-семантической неоднозначностивыделение конструкцийклассификация контекстов

В книге

Структурная и прикладная лингвистика
Вып. 9. , СПб.: Издательство СПбГУ, 2012.
Похожие публикации
Вполне приличная статья
Рахилина Е. В., Труды института русского языка им. В.В. Виноградова 2025 № 3(45) С. 296–305
Работа посвящена языковым изменениям как предсказуемым цепочкам семантических сдвигов, мотивированных как в целом, так и на отдельных этапах. Стимулом к наблюдениям над ними стал проект лингвистического комментария к повести М. Ю. Лермонтова «Фаталист», в котором исследовалась природа расхождений между нормой XIX века и современной — прежде всего, в лексике, синтаксисе и конструкциях. В ходе интерпретации ...
Добавлено: 6 декабря 2025 г.
Прагматика в цифровую эпоху: база данных «Рутиникон»
Рахилина Е. В., Гюласарян С. М., Бычкова П., Слово.ру: балтийский акцент 2025 Т. 16 № 2 С. 28–52
Настоящая работа посвящена базе данных «Рутиникон» как цифровому инструменту описания рутин — особого класса формульных фразеологических единиц, которые представляют собой реакции на стандартные экстралингвистические ситуации или комментарии к ним. Например, формула Кого я вижу! — это реакция на ситуацию неожиданной встречи, а Кто там? — стандартная формула-реакция на стук в дверь. Сбор, классификация и исследование ...
Добавлено: 29 октября 2025 г.
О национальном корпусе русского языка
Рахилина Е. В., Вестник Российской академии наук 2024 Т. 94 № 9 С. 795–803
Статья посвящена проекту создания Национального корпуса русского языка (НКРЯ) – мощной справочно-информационной системы по русскому языку, которая была разработана консорциумом организаций РАН с участием компании “Яндекс”. Описаны история создания Корпуса, основной его функционал и пути совершенствования, а также наиболее технологичные подкорпуса – поэтический, параллельный, мультимедийный; приведены примеры их работы. Особое внимание уделено последним разработкам, которые ...
Добавлено: 25 февраля 2025 г.
База «Диахроникон»: история, задачи, структура
Бажуков М. О., Рахилина Е. В., Русский язык в научном освещении 2024 № 2(48) С. 11–30
В статье представлен ресурс «Диахроникон», в котором содержится информация о диахронических изменениях русских конструкций. Под конструкциями нами понимаются частотные, частично идиоматизированные последовательности языковых единиц, в нашем случае слов на стыке лексики и грамматики [Fillmore et al. 1988]. То, как они ведут себя в современном русском языке, описано в специализированной лексической базе «Русский конструктикон» [Janda et ...
Добавлено: 2 января 2025 г.
Толк и толки: диахронический портрет имени с семантикой ментальной сферы
Рыжаченков И. И., Труды института русского языка им. В.В. Виноградова 2024 № 4(42) С. 102–118
В статье исследуется процесс диахронического развития полисемии русского толк, привлёкшего наше внимание своим нетривиальным распределением лексем внутри числовой парадигмы. Несмотря на её формальную двучленность, в современном русском языке толк и толки образуют два семантически несвязанных класса конструкций. Для выявления отношений семантической производности в структуре многозначности толк семантические деривации были рассмотрены в диахронической перспективе на материале ...
Добавлено: 8 декабря 2024 г.
Жизнь и судьба калек XVIII века: опыт корпусного исследования
Рыжаченков И. И., Рахилина Е. В., Труды института русского языка им. В.В. Виноградова 2024 № 2 (40) С. 211–231
В статье исследуется процесс семантического калькирования — на корпусных данных русского языка XVIII–XIX вв. Акцент делается не на вхождении языковой единицы в язык, то есть на самом появлении кальки, а на ее последующем существовании в нем. Рассматриваются разные этапы адаптации калькированного слова к морфо-синтаксической системе, лексическая конкуренция новой единицы с другими — вплоть до причин ...
Добавлено: 15 октября 2024 г.
Диахроникон: новый ресурс для изучения русских конструкций в микродиахронической перспективе
Буденная Е. В., Бажуков М. О., Баркова Л. А. и др., В кн.: Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной международной конференции «Диалог». Вып. 22. Дополнительный томВып. 22: Дополнительный том.: [б.и.], 2023. С. 1041–1051.
Добавлено: 14 сентября 2023 г.
Особенности метрики стихов Н. Е. Горбаневской
Баркова Л. А., Труды института русского языка им. В.В. Виноградова 2022 № 3(33) С. 59–95
В статье анализируются строфика, метр и рифма в стихах Н. Е. Горбаневской и показываются их особенности на фоне других стихотворений второй половины XX — начала XXI века на основе данных поэтического подкорпуса НКРЯ. Для метрики Горбаневской характерны многие черты редкие в регулярном стихе ее современников: использование в твердых формах нестандартных для этих форм метров; работа ...
Добавлено: 21 октября 2022 г.
Конструкции с отрицательными элементами ни капли и ни разу в русском языке
Баранова В. В., Вопросы языкознания 2021 Т. 5 С. 93–105
В русском языке представлено достаточно много средств усиления отрицания показателями, среди которых встречаются как отрицательные местоимения ни-серии (ничего, ничуть, никого), так и выражения ни капли, ни крошки, ни грамма, ни пылинки, ни искры и др., возникающие обычно на основе квантификаторов малого объема. Происходит постоянное обновление средств усиления отрицания за счет втягивания новых элементов и изменения ...
Добавлено: 4 октября 2021 г.
Акцентологический корпус как инструмент для исследования русского ударения
Орехов Б. В., Савчук С. О., Труды института русского языка им. В.В. Виноградова 2019 № 21 С. 61–82
В настоящей статье рассмотрено несколько вопросов, связанных с разработкой и использованием акцентологического корпуса в качестве инструмента для исследования ударения: состав и структура корпуса, текущее состояние, перспективы развития, пополнение новым материалом. Особое внимание уделено подкорпусу наивной поэзии в составе акцентологического корпуса как источнику акцентологических данных. Возможности этого ресурса, его эффективное использование проверены на нескольких участках акцентологической ...
Добавлено: 25 марта 2020 г.
В генеральских руках Ерофея: О синтаксическом представлении именованных сущностей в поэтическом и исторических корпусах
Ляшевская О. Н., Журавлева А. А., В кн.: VII Международные Бодуэновские чтения: Международная конференция И.А. Бодуэн де Куртенэ и мировая лингвистика.: Каз.: Казанский (Приволжский) федеральный университет, 2019.
В статье анализируется смешанная адъективно-генитивная посессивная конструкция в контексте ее представления в синтаксическом формализме Universal Dependencies. Исследование выполнено на материалах частотных синтаксических баз данных поэтического и старорусского корпусов НКРЯ. ...
Добавлено: 15 декабря 2019 г.
A Reusable Tagset for the Morphologically Rich Language in Change: a Case of Middle Russian
Ляшевская О. Н., , in: Computational Linguistics and Intellectual TechnologiesIssue 18.: M.: Russian State University for the Humanitie, 2019. P. 422–434.
Статья посвящена созданию морфологического стандарта для разметки Старорусского корпуса, который входит в состав исторических корпусов Национального корпуса русского языка (НКРЯ). Для того, чтобы сделать разметку удобной для лингвистов, работающих с историческими и современными корпусами, а также для разработчиков систем автоматической обработки исторических текстов, мы предусматриваем две параллельные схемы морфологической разметки, в нотации НКРЯ и Универсальных зависимостей ...
Добавлено: 12 июня 2019 г.
A Data Analysis Tool for the Corpus of Russian Poetry
Ляшевская О. Н., Власова Е. А., Литвинцева К. В. и др., / NRU HSE. Series WP BRP "Linguistics". 2018. No. 77.
Добавлено: 13 декабря 2018 г.
Имена времени: эпитеты десятилетий в Национальном корпусе русского языка как проекция культурной памяти
Бонч-Осмоловская А. А., Шаги/Steps 2018 № 4 С. 115–146
Исследование рассматривает конструкции, включающие в себя название десятилетия – двадцатые, тридцатые, сороковые  и т.д. – и определяющее его прилагательное.  Интерес к этим конструкциям обусловлен предположением, что по спискам прилагательных, сочетающихся с каждым из десятилетий, и их частотностям можно восстановить мнемонический образ каждого из десятилетий советской и постсоветской истории. Исследование сделано на материале выборки из Национального корпуса русского языка. ...
Добавлено: 15 апреля 2018 г.
ЕВРика! Сборник статей о поисках и находках к юбилею Е.В. Рахилиной
М.: Лабиринт, 2018.
В сборнике на материале свыше 20 языков рассматриваются различные аспекты лингвистического поведения глаголов с семантикой ‘искать’ и ‘находить’. В фокусе внимания оказываются прежде всего принципы лексикализации исследуемых зон: обсуждается, какие типы поисков и находок могут лексически противопоставляться в том или ином языке. Предметом анализа становятся также синтактико-грамматические свойства изучаемых глаголов и пути их диахронической эволюции. Специальный раздел книги посвящен возможностям использования ...
Добавлено: 24 февраля 2018 г.
«Тамань сегодня»: корпусное исследование русского языка XIX века
Рахилина Е. В., Резникова Т. И., Бородина М. А., Труды института русского языка им. В.В. Виноградова 2016 № 10 С. 242–255
Работа представляет проект Школы лингвистики НИУ ВШЭ по описанию языка XIX века. Он касается мониторинга изменений, которые претерпел русский язык — и прежде всего, конструкции русского языка — первой трети XIX века по сравнению с началом века XXI. Эти изменения, часто затрагивающие (как это бывает именно в конструкциях) одновременно лексику, морфологию и синтаксис, могут быть ...
Добавлено: 9 марта 2017 г.
Взiaлъ, възялъ, вьзял: Обработка орфографической вариативности при лексико-грамматической аннотации старорусского корпуса XV-XVII вв.
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2017 Т. 51 С. 11–20
Рассматривается проблематика нестабильной орфографии корпуса текстов позднедревнерусского периода в свете их автоматической обработки. Тексты Старорусского корпуса Национального корпуса русского языка (НКРЯ) включают памятники, написанные преимущественно в XV-XVII вв., т. е. в тот период, когда вариативность написания слов была общераспространенным явлением. Задача лексико-грамматической разметки словоформ в корпусе заключается в определении начальной формы (словарной формы, леммы), части ...
Добавлено: 14 декабря 2016 г.
К задаче автоматической лексико-грамматической разметки старорусского корпуса XV-XVII вв.
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2016 Т. 47 № 2 С. 7–25
В работе рассматриваются два подхода к разработке автоматической аннотации корпуса старорусских текстов XV–XVII вв., включенных в Национальный корпус русского языка (НКРЯ). Лексико-грамматическая аннотация состоит в определении части речи, грамматических характеристик и начальной формы слова (леммы) для каждой словоформы корпуса. Язык старорусской письменности совмещает в себе, с одной стороны, черты древнерусского словоизменения, включая формы аориста и ...
Добавлено: 14 декабря 2016 г.
Глаголы со значением продолжения: семантика и конструкции
Апресян В. Ю., Известия РАН. Серия литературы и языка 2017 Т. 76 № 2 С. 5–15
В работе представлены результаты корпусного исследования семантического поля ‘продолжения’. Для глаголов со значением ‘продолжения’ релевантны следующие семантические противопоставления: 1) тип ситуации и степень контроля субъекта над ней (действие, состояние, событие, мероприятие, временной период); 2) ожидания относительно прекращения ситуации; 3) фаза ситуации, на которой сфокусировано ожидание – начало новой ситуации или конец старой; 4) наличие фиксированного ...
Добавлено: 30 ноября 2016 г.
Корпусное преподавание в российской школе
Левинзон А. И., Труды института русского языка им. В.В. Виноградова 2015 № 6 С. 641–658
До сих пор на уроках русского языка в российской школе практически не используются электронные корпуса. Цель статьи — продемонстрировать возможности НКРЯ как инструмента эффективной работы с детьми. Мы анализируем как основные достоинства различных методов корпусной педагогики, так и сложности, которые предстоит преодолеть учителю, выбравшему, например, метод обучения на основе анализа данных. Ключевые слова: корпусная педагогика, Национальный корпус русского языка, ...
Добавлено: 14 марта 2016 г.
Культуромика в национальном корпусе русского языка, к постановке задачи: три века русских дорог.
Бонч-Осмоловская А. А., Труды института русского языка им. В.В. Виноградова 2015 Т. 4 № 6 С. 605–641
Культуромика – новый метод исследования культурных и социальных процессов с помощью статистического анализа употребления слов и словосочетаний в огромных текстовых массивах. Исследования по культуромике выполняются на базе Google ngrams, хранилища всех сочетаний слов для каждого года длиной от 1 до 5 на 8 языках. Однако работа с большими данными обладает рядом проблем, решить которые предлагается, ...
Добавлено: 14 марта 2016 г.
Stem initial alternation in Russian third person pronouns: variation in grammar
Даниэль М. А., , in: Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015).: М.: Изд-во РГГУ, 2015. P. 95–103.
The paper discusses the present stage of the evolution of the initial [n]/[j] stem alternation in Russian third person pronouns. After providing a short overview of the origins of the forms, I focus on their category status, discuss Zalizniak’s ‘adpositionality’ in some detail, and then proceed to considering the cases where the ‘n’-forms are induced ...
Добавлено: 9 октября 2015 г.
Корпусные исследования особенностей речи нестандартных говорящих ("херитажный русский")
Рахилина Е. В., Марушкина А. С., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2015 Т. XI № 1 С. 621–639
В статье рассматриваются особенности построения трех видов конструкций - условных, сравнительных и предложных - в речи эртажных носителей русского языка и изучающих русский как иностранный. В качестве материала использованы тексты Russian Learner Corpus. ...
Добавлено: 25 июля 2015 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору