• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • The impact of syntactic structure on verb-noun collocation extraction
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.
20 мая 2026 г.
Творческая работа как лекарство от выгорания
Творческая и доброжелательная атмосфера, новые методы в Международной лаборатории (впоследствии центре) социокультурных исследований привлекают молодых исследователей. За годы работы в Вышке они становятся учеными и преподавателями, известными в России и за рубежом. О своем пути в центре и в Вышке, исследованиях и роли наставников в научных успехах рассказали главный научный сотрудник ЦСКИ Зарина Лепшокова и ведущий научный сотрудник Екатерина Бушина.
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

The impact of syntactic structure on verb-noun collocation extraction

P. 2–17.
Toldova S. Y., Akinina Y. S., Kuznetsov I. O.

Automatic verb-noun collocation extraction is an important natural language processing task. The results obtained in this area of research can be used in a variety of applications including language modeling, thesaurus building, semantic role labeling, and machine translation. Our paper de-scribes an experiment aimed at comparing the verb-noun collocation lists extracted from a large corpus using a raw word order-based and a syntax-based approach. The hypothesis was that the latter method would result in less noisy and more exhaustive collocation sets. The experiment has shown that the collocation sets obtained using the two methods have a surprisingly low degree of correspondence. Moreover, the collocate lists extracted by means of the window-based method are often more complete than the ones obtained by means of the syntax-based algorithm, despite its ability to filter out adjacent collocates and reach the distant ones. In order to interpret these differences, we provide a qualitative analysis of some common mismatch cases.

Язык: английский
Полный текст
Текст на другом сайте
Ключевые слова: corpus analysiscollocationstreebanksyntactic dependenciesautomatic collocation extractionparsing

В книге

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.
Т. 1: Основная программа конференции. Вып. 12 (19). , М.: РГГУ, 2013.
Похожие публикации
A genre-based model of rhetorical structure in scoping review introductions
Elena V. Tikhonova, Косычева М. А., Training, Language and Culture 2025 Vol. 9 No. 4 P. 35–55
По мере развития жанрового моделирования описание риторических структур исследовательских статей становится все более важным. Хотя обзоры предметного поля второстепенны по отношению к эмпирическим исследованиям, они формируют научную коммуникацию, определяя рамки анализа и устанавливая эпистемологические ориентиры. Их введения выступают в качестве концептуальных линз, определяя интерпретационные рамки. Однако большинство риторических моделей, разработанных для эмпирических статей, оказываются неприменимыми ...
Добавлено: 9 февраля 2026 г.
Репрезентация фрейма ГОРОД в текстах почтовой переписки: корпусное исследование
Куликова В. А., Человек: образ и сущность. Гуманитарные аспекты 2026 № 1 С. 64–81
Исследуется вербальная репрезентация города на материале 993 контекстов, содержащих описание города в открытках дореволюционного, советского и постсоветского периодов. Объектом анализа выступает фрейм-структура ГОРОД, а предметом – особенности ее вербализации в корпусе текстов почтовой переписки. Исследование сочетает методы концептуального моделирования и корпусные методы. В результате построена модель фрейма ГОРОД, состоящая из 6 вершинных узлов со слотами. ...
Добавлено: 2 ноября 2025 г.
Правовой режим персональных данных в социальных сетях: проблемы квалификации и практические аспекты обработки
Ковалева Н. Н., Жирнова Н. А., Закон 2025 № 9 С. 61–68
Исследование посвящено комплексному анализу правовых коллизий, возникающих при обработке персональных данных в социальных сетях. На основе системного изучения российского законодательства и эволюции судебной практики выявлены ключевые проблемы квалификации статуса таких данных. Доказана ошибочность отождествления понятий «общедоступные источники персональных данных» и «общедоступные персональные данные». Особое внимание уделено противоречиям, связанным с автоматизированным сбором информации (парсингом) и правовыми ...
Добавлено: 1 октября 2025 г.
Медиаконцепт «вакцинация» в дискурсе немецких СМИ во время пандемии COVID-19
Балакина Ю. В., Вестник Томского государственного университета 2024 № 509 С. 23–34
В данной работе рассмотрен идеологический межтекстовый медиаконцепт «вакцинация» как биополитический инструмент, объективируемый в дискурсе немецких СМИ. Методологической основой исследования послужили понимание «биополитики» по М.Фуко (2010), модель пропаганды Э. Хермана, Н. Хомского (2002), положения культуромики (Бонч-Осмоловская, 2015), теория когнитивно-дискурсивного миромоделирования (Кушнерук, 2018). Для выявления и анализа коллокаций были использованы инструменты Цифрового словаря немецкого языка (DWDS), Sketch ...
Добавлено: 12 декабря 2024 г.
Teaching Russian Through STEM: Contexts, Tools, and Approaches
L.: Routledge, 2024.
Добавлено: 8 ноября 2024 г.
Academic English melting pot: Reconsidering the use of lexical bundles in academic writing
Gritsenko E.S, Kamou O.M., Russian Journal of Linguistics 2024 Vol. 28 No. 3 P. 615–632
Many studies addressing the differences in the use of lexical bundles in academic English by L1 and L2 writers interpret these differences as a deficiency or deviation that L2 writers need to eliminate. In this paper, we argue that this “deviant” use is not essentially the product of insufficient knowledge of English and/or Anglophone norms ...
Добавлено: 31 октября 2024 г.
Hedges in Written Academic Discourse: A Corpus Analysis of L2 Students’ Project Proposals
Nuriiat Omarovna Omarova, , in: The Youth in Science: Challenges and Prospects.: [б.и.], 2024. P. 64–72.
Добавлено: 30 октября 2024 г.
Оценочная лексика в почтовой коммуникации: динамический аспект
Куликова В. А., В кн.: Динамика коммуникативных практик в почтовой переписке (на материале корпуса «Пишу тебе»).: М.: Издательство РОИФН, 2024. Гл. 3 С. 92–130.
В главе 3 «Оценочная лексика в почтовой коммуникации: динамический аспект» (В.А. Куликова) изучается динамика на примере отдельной лексической подсистемы – качественных прилагательных  с оценочной семантикой. Изучено функционирование оценочных прилагательных и их дериватов в текстах дореволюционных, советских, постсоветских открыток: вхождение оценочных лексем в списки ключевых слов и уникальных слов, изменения в частотности и функционировании оценочных лексем. ...
Добавлено: 28 октября 2024 г.
Exploring collocational complexity in L2 Russian: A corpus-driven contrastive analysis
Копотев М. В., Климов А. А., Kisselev O., International Journal of Bilingualism 2025 Vol. 29 No. 2 P. 439–455
Objective: The objective of this article is to discuss the pedagogical and practical need for automated assessment tools that enable teachers, researchers, and other language practitioners to relatively quickly and automatically assess the general proficiency of second language (L2) speakers according to a number of different linguistic parameters, specifically the use of collocations. Introduction: The Introduction discusses existing ...
Добавлено: 9 сентября 2024 г.
Словами героев русского рассказа: речевая картина XX века
Кирина М. А., Лукьянчикова А. С., В кн.: Русская и зарубежная филология в диалоге культур : материалы Всероссийской научно-практической конференции с международным участием (г. Ростов-на-Дону, 19–21 октября 2023 г.).: Издательство Южного федерального университета, 2024. С. 16–20.
Добавлено: 10 декабря 2023 г.
Семантическое наполнение понятия «популизм» в английском языке (опыт лексикографического и корпусного анализа)
Гриценко Е. С., Галочкин А. Е., Вопросы лексикографии 2023 № 27 С. 29–46
Анализируется смысловое наполнение понятия «популизм» в английском языке с использованием методов семантического и корпусно-ориентированного анализа. Материалом для исследования послужили дефиниции и иллюстративные контексты слова populism в британских и американском толковых словарях и тексты корпуса современного американского английского языка (COCA). Выявление оценочной тональности (семантической просодии) лексемы populism производится на основе анализа коллокатов и кластеров в соответствии с особенностями ее синтаксической ...
Добавлено: 6 мая 2023 г.
Изражавања ауторског става у уводницима и онлајн коментарима на руском језику
Трнавац Р., Зборник Матице српске за филологију и лингвистику 2020 Vol. 63 No. 2 P. 139–153
Добавлено: 28 декабря 2022 г.
Плеонастические причастия в современной русской речи: функции и тенденции развития
Ю. М. Кувшинская, Н. А. Зевахина, Acta Linguistica Petropolitana. Труды института лингвистических исследований 2023 Т. 19 № 1 С. 138–192
Статья посвящена современным плеонастическим употреблениям полных атрибутивных причастий в русской письменной речи. На материале двух корпусов (НКРЯ и КРУТ) и коллекции примеров, собранных вручную из разных письменных и электронных источников, описаны основные типы употребления плеонастических причастий и характерные для них семантические, грамматические, прагматические, коммуникативные эффекты: выражение избыточной анафорической связи, выражение определенности, экспликация пресуппозиций, выражение аспектуальных ...
Добавлено: 8 декабря 2022 г.
Clausal complexity of expert and student writing: a corpus-based analysis of papers in social sciences
Смирнова Е. А., Language Learning in Higher Education 2022 Vol. 12 No. 2 P. 453–475
Добавлено: 7 декабря 2022 г.
Terminology of Migration Studies: A Corpus Analysis of Research Papers in Social Sciences
Elizaveta Smirnova, Tatiana Permyakova, Migration Letters 2022 Vol. 19 No. 4 P. 401–412
Добавлено: 1 августа 2022 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору