• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus

P. 70–83.
Шаврина Т. О.
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: corpus linguisticscorpus analysistext classification

В книге

Proceedings of Third Workshop "Computational linguistics and language science"
Wohlgenannt G., von Waldenfels R., Толдова С. Ю., Рахилина Е. В., Ляшевская О. Н., Лукашевич Н. В., Артемова Е. Л. Issue 4. , Manchester: EasyChair, 2019.
Похожие публикации
Syntactic functions of non-manuals in Russian Sign Language
Burkova S., Khristoforova E., Kimmelman V., , in: Advances in Sign Language Corpus Linguistics.: John Benjamins Publishing Company, 2023. P. 90–129.
Добавлено: 3 июня 2026 г.
Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов
Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50
На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...
Добавлено: 18 марта 2026 г.
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Transformer-based approaches for lemmatizing abbreviations in Russian texts
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Promotional adjectives in grant proposal abstracts: a corpus study
Dmitriy S. Tulyakov, Tatiana M. Permyakova, Ekaterina A. Balezina, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 6 P. 58–67
Эффективно интегрируя дискурс продвижения в аннотации заявок на гранты, исследователи могут более убедительно представить свои идеи и повысить шансы на получение финансирования. Частотность использования прилагательных продвижения при написании заявок на гранты может отличаться в разных областях исследований. В данной статье рассматривается употребление прилагательных продвижения в аннотациях заявок на гранты в шести научных сферах. Основная гипотеза ...
Добавлено: 2 марта 2026 г.
A genre-based model of rhetorical structure in scoping review introductions
Elena V. Tikhonova, Косычева М. А., Training, Language and Culture 2025 Vol. 9 No. 4 P. 35–55
По мере развития жанрового моделирования описание риторических структур исследовательских статей становится все более важным. Хотя обзоры предметного поля второстепенны по отношению к эмпирическим исследованиям, они формируют научную коммуникацию, определяя рамки анализа и устанавливая эпистемологические ориентиры. Их введения выступают в качестве концептуальных линз, определяя интерпретационные рамки. Однако большинство риторических моделей, разработанных для эмпирических статей, оказываются неприменимыми ...
Добавлено: 9 февраля 2026 г.
Динамика восприятия площадей в пространстве города носителями русского языка (сравнительный анализ по данным НКРЯ)
Белова П. Е., В кн.: Актуальные вопросы лингвистики и литературоведения: сборник научных статей по материалам международной научной конференции памяти доктора филологических наук, профессора Л.А. Араевой (6–8 февраля 2025).: Кемеровский государственный университет, 2025. С. 155–160.
В данной статье содержатся результаты исследования того, как в русской языковой кар-тине мира, начиная со второй половины XX века по настоящее время, менялось восприятие площадей в пространстве города. В ходе обращения к подкорпусу художественных текстов второй половины XX века и XXI в. Национального корпуса русского языка были выявлены присущие рассматриваемому объекту когнитивные признаки, установлены предметно-понятийные ...
Добавлено: 4 февраля 2026 г.
Preposition drop in Russian spoken by Mari and Beserman bilinguals
Яковлева А. В., Kosheliuk N., Мороз Г. А., International Journal of Bilingualism 2025 P. 1–19
Добавлено: 26 ноября 2025 г.
Вариативность годов vs. лет в русских говорах: корпусное исследование
Земичева С. С., Мороз Г. А., Наккарато М. К., Вопросы языкознания 2025 № 6 С. 7–34
The presence of the genitive plural suppletive form let in the paradigm of the noun god ‘year’ distinguishes Russian from other East Slavic languages. In Russian dialects, instead of let, the dialect variant godov is sometimes used. Data from the panchronic subcorpus of the Russian National Corpus show that the form godov, which is first attested in the ...
Добавлено: 12 ноября 2025 г.
Репрезентация фрейма ГОРОД в текстах почтовой переписки: корпусное исследование
Куликова В. А., Человек: образ и сущность. Гуманитарные аспекты 2026 № 1 С. 64–81
Исследуется вербальная репрезентация города на материале 993 контекстов, содержащих описание города в открытках дореволюционного, советского и постсоветского периодов. Объектом анализа выступает фрейм-структура ГОРОД, а предметом – особенности ее вербализации в корпусе текстов почтовой переписки. Исследование сочетает методы концептуального моделирования и корпусные методы. В результате построена модель фрейма ГОРОД, состоящая из 6 вершинных узлов со слотами. ...
Добавлено: 2 ноября 2025 г.
Automatic Annotation of Discourse and Speech Formulas in Internet Communication: A Telegram Comment Corpus
Maslenikova A., Tatiana I. Popova, , in: 27th International Conference, SPECOM 2025, Szeged, Hungary, October 13–15, 2025, Proceedings, Part I. Speech and Computer. Lecture Notes in Artificial Intelligence 16187Vol. 16187: Lecture Notes in Artificial Intelligence.: Springer, 2025. P. 278–292.
Добавлено: 19 октября 2025 г.
27th International Conference, SPECOM 2025, Szeged, Hungary, October 13–15, 2025, Proceedings, Part II. Speech and Computer. Lecture Notes in Artificial Intelligence 16188
Springer, 2025.
Добавлено: 19 октября 2025 г.
Variation in a Narrative Corpus of Mano and Kpelle: Contact-Induced or Not?.
Khachaturyan M., Konoshenko M., Мороз Г. А. и др., , in: N’yng-dyuumgu, n’yng-ngafq: Festschrift for Ekaterina GruzdevaVol. 126.: Helsinki: Studia Orientalia, 2025. P. 35–59.
Добавлено: 5 сентября 2025 г.
Переписка Н. С. Хрущева и Ф. Кастро периода Карибского кризиса: опыт компьютеризованного анализа
Герцен А. С., В кн.: Четвёртая зимняя школа по гуманитарной информатике.: Балтийский федеральный университет им. Иммануила Канта, 2020. С. 92–97.
Проанализированы письма первого секретаря ЦК КПСС и председателя Совета министров СССР Н.С. Хрущева и премьер-министра Кубы Ф. Кастро Руса, написанные с 26 по 31 октября 1962 г. на тему Карибского кризиса и размещенные на кубинском сайте «Fidel. Soldado de las ideas» (http://www.fidelcastro.cu/es). Цель исследования — выявить общие черты и различия в восприятии и оценках исторического ...
Добавлено: 15 июля 2025 г.
An overview of morphosyntactic variation in the speech of Russian-Chuvash bilinguals: number, gender, case assignment and preposition drop
Гришанова А. Ю., Russian linguistics 2025 Vol. 49 Article 10
Цель данного исследования – описание морфосинтаксической вариативности и детальный анализ явления выпадения предлогов в русской речи чувашских билингвов. В частности, исследуется, какие факторы могут обусловливать эту вариативность. Чтобы рассмотреть морфосинтаксические особенности, был проведен качественный анализ данных, извлеченных из корпуса русской речи Чувашии. Было также проведено количественное исследование явления выпадения предлогов с использованием всех 2529 предложных ...
Добавлено: 10 июля 2025 г.
Do Formal Stance Strategies Reveal Disciplinary Variation in Professional Scientific Writing?
Смирнова Е. А., Pérez-Guerra J., International Journal of Applied Linguistics 2025 Vol. 35 No. 3 P. 1242–1261
Добавлено: 10 апреля 2025 г.
Русский язык в условиях контактирования: тюркско-русское языковое взаимодействие. Часть 1. Социолингвистическое и корпусное исследование
Резанова З. И., Артёменко Е. Д., Диброва В. С. и др., Томск: Издательство Томского государственного университета, 2024.
В монографии представлены собственно лингвистические, социолингвистические и психолингвистические аспекты взаимодействия русского и трех тюркских языков – шорского, хакасского, татарского (сибирского варианта). Охарактеризованы варианты влияния тюркских языков на речевую практику и когнитивные процессы порождения и восприятия речи русскоязычными билингвами. Представлены методики сбора данных, их обработки при формировании социолингвистической базы данных и морфологически размеченного бимодального корпуса русской устной речи билингвов, ...
Добавлено: 7 апреля 2025 г.
The ‘adverb-ly adjective’ construction in English: meanings, distribution and discourse functions
Taboada M., Goddard C., Трнавац Р., English Language and Linguistics 2025 Vol. 29 No. 1 P. 102–131
Добавлено: 4 апреля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору