• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Exploration of register-dependent lexical semantics using word embeddings
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Exploration of register-dependent lexical semantics using word embeddings

P. 26–34.
Кутузов А. Б., Кузьменко Е. А., Marakasova A.
Язык: английский
Полный текст
Текст на другом сайте
Ключевые слова: natural language processingавтоматическая обработка естественного языкаdigital humanitiescommunicative grammar, text structure, texts typology, fiction – non-fiction, register.digital humanitiesисследования жанраword2vecword embeddings

В книге

Proceedings of the Workshop on Language Technology Resources and Tools for Digital Humanities (LT4DH)
Osaka: [б.и.], 2016.
Похожие публикации
Цифровое сопровождение гуманитарных образовательных программ
Корниенко С. И., Исмакаева И. Д., Сенина А. В., Отечественная и зарубежная педагогика 2026 Т. 1 № 2 (113) С. 91–102
В эпоху цифровизации владение цифровыми технологиями становится ключевой грамотностью XXI века, что особенно актуально при подготовке студентов гуманитарных образовательных программ. В статье предложена сквозная модель интеграции цифровых технологий в гуманитарное образование в вузе. Методология опирается на кейс-стади и элементы design-based research: анализ нормативных документов, образовательных программ, результатов студенческих проектов, исследовательской работы студентов, обратной связи. Теоретическая ...
Добавлено: 30 апреля 2026 г.
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
RuCLEVR: A Russian Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning
Biryukova K., Chelnokova D., Erkenova J. и др., Communications in Computer and Information Science 2024 Vol. 2364 CCIS P. 109 – 121
Добавлено: 25 февраля 2026 г.
30th International Conference on Applications of Natural Language to Information Systems, NLDB 2025, Kanazawa, Japan, July 4–6, 2025, Proceedings, Part I. Natural Language Processing and Information Systems. (LNCS, volume 15836)
Springer, 2025.
Добавлено: 3 февраля 2026 г.
Открытые компьютерные инструменты для решения задач оцифровки и анализа русскоязычного текста в области Digital Humanities
Орехов Б. В., Цифровые гуманитарные исследования 2025 № 2 С. 71–83
В статье дается обзор не очень известных модулей, которые можно использовать для решения задач Digital Humanities, связанных с текстовым анализом и оцифровкой. К таким модулям отнесены те, которые облегчают оцифровку текстов, напечатанных в дореформенной орфографии (OCR-модель и конвертер в новую орфографию), акцентуатор, расставляющий ударения, детектор прямой речи, код, позволяющий оценить формульность фольклорного текста, конвертер для ...
Добавлено: 19 декабря 2025 г.
Digital Humanities and Literary Realism
Skorinkin D., Орехов Б. В., , in: The Oxford Handbook of Global Realisms.: Oxford: Oxford University Press, 2025. Ch. 10 P. 177–204.
Добавлено: 14 сентября 2025 г.
Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions
Чепиков И. А., Карпов И. А., , in: 26th International Conference, AIED 2025, Palermo, Italy, July 22–26, 2025, Proceedings, Part I. Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.
Добавлено: 4 сентября 2025 г.
Автоматическая саммаризация родительских чатов в WhatsApp
Дмитриева К. А., Жолус М. Р., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2025 Т. 23 № 1 С. 80–92
Автоматическая саммаризация текста – одна из ключевых задач NLP, предполагающая создание краткой версии исходного текста. В современном мире, где объемы потребляемой человеком информации неустанно растут, задаче саммаризации уделяется все больше внимания. Автореферирование предполагает два основных подхода: экстрактивный и абстрактивный. Последний заключается в автоматическом создании саммари текста, в котором могут содержаться слова и предложения, не встречающиеся ...
Добавлено: 8 июля 2025 г.
Методы и средства извлечения терминов из текстов для терминологических задач
Большакова Е. И., Семак В. В., Программные продукты и системы 2025 Т. 38 № 1 С. 5–16
Рассматривается современное состояние в области автоматического извлечения терминов из специализированных текстов на естественном языке, включая научно-технические документы. К числу актуальных практических приложений методов и средств извлечения терминов из текстов относятся создание терминологических словарей, тезаурусов и глоссариев предметных областей,  а также выявление ключевых слов и построение предметных указателей для узкоспециализированных документов. Обзорно излагаются применяемые подходы к автоматическому ...
Добавлено: 2 июля 2025 г.
Высокоуровневая семантическая интерпретация структуры статических моделей для русского языка
Сериков О. А., Ганеева В. А., Аксенова А. А. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2023 Т. 21 № 1 С. 67–82
ной и практической деятельности. С течением времени стало понятно, что необходима разработка новых методов интерпретации расположения слов в векторном пространстве. Существующие методы включали рассмотрение узкого круга аналогий либо кластеризацию пространства. В последние годы активно развивается подход на основе пробинга – анализа влияния небольших изменений в модели на результат. В этой работе мы предлагаем метод интерпретации ...
Добавлено: 28 апреля 2025 г.
Automation of Forensic Authorship Attribution: Problems and Prospects
Романова Т. В., Хоменко А. Ю., Legal Issues in the Digital Age 2022 Vol. 3 No. 2 P. 90–115
The article deals with validation of an integrative attribution algorithm based on the analysis of the author’s idiostyle using methods of interpretative linguistics with ob jectification of the available data with the help of mathematical statistics. The algo rithm addresses the identification problem of the attribution. The choice of parameters describing the individual style of ...
Добавлено: 12 марта 2025 г.
Основы цифровой филологии: методы и принципы компьютерного анализа текста
Казарцев Е. В., Пронин Д. Д., СПб.: Издательство "Политехника", 2024.
Учебник представляет собой уникальное издание, содержащее материал для обучения методам компьютерного анализа текстов, прежде всего, художественной литературы. Используются базы данных и корпусы, размещенные на цифровой платформе СОЦИОЛИТ, предназначенной для изучения взаимодействия литературы и общества. Представленные методы размыкают границы традиционной филологической науки, они позволяют проводить количественный и качественный анализ содержания и лексики текста в парадигме современной ...
Добавлено: 19 февраля 2025 г.
Automatic Morpheme Segmentation for Russian: Can an Algorithm Replace Experts?
Morozov D., Garipov T., Ляшевская О. Н. и др., Journal of Language and Education 2024 Vol. 10 No. 4 P. 71–84
Introduction: Numerous algorithms have been proposed for the task of automatic morpheme segmentation of Russian words. Due to the differences in task formulation and datasets utilized, comparing the quality of these algorithms is challenging. It is unclear whether the errors in the models are due to the ineffectiveness of algorithms themselves or to errors and inconsistencies ...
Добавлено: 7 января 2025 г.
Возможна ли цифровая история философии?
Алиева О. В., Историко-философский ежегодник 2024 Т. 39 С. 266–304
В статье ставится вопрос о возможности «цифровизации» историко-философских исследований. В первой части статьи дается краткий обзор основных жанров историко-философского исследования, а во второй рассматривается совместимость этих жанров с основными методами компьютерного анализа текста. Мы приходим к выводу, что наиболее востребованными у историков философии могут стать методы векторной семантики, которые на практике нередко соединяются с методами ...
Добавлено: 28 декабря 2024 г.
Цифровые гуманитарные проекты: learning DH by doing
Гоменюк Н. В., Исмакаева И. Д., В кн.: Будь в курсе цифровых гуманитарных исследований.: Красноярск: Сибирский федеральный университет, 2024. С. 98–108.
Появление и развитие такой области, как цифровые гуманитарные науки (Digital Humanities), ставит перед университетами новые задачи по подготовке специалистов, обладающих не только глубокими знаниями в своей предметной области, но и владеющих современными цифровыми инструментами и методами. «Инфраструктурным» требованием к подготовке таких специалистов становится формирование у них проектного мышления и навыков проектной деятельности. Мы описываем опыт реализации ...
Добавлено: 3 декабря 2024 г.
Python для гуманитариев, или почему программированию невозможно научиться с первой попытки
Сенина А. В., В кн.: Будь в курсе цифровых гуманитарных исследований.: Красноярск: Сибирский федеральный университет, 2024. С. 164–181.
Монография стала результатом Всероссийского семинара «Гуманитарная цифра в вузах: программы, курсы, компетенции». Собраны педагогические опыты, составляющие сегодня дидактическую основу цифровых гуманитарных наук. Предложенные читателю материалы посвящены широкому спектру направлений — с​амоопределению цифровых гуманитариев в современном университете, архитектурам магистратур и майноров, программам специальных и онлайн-­курсов, цифровым компетенциям и проектным практикам. Будет интересна широкому кругу преподавателей-­гуманитариев — историкам, филологам, лингвистам, философам, социологам, ...
Добавлено: 3 декабря 2024 г.
Как сделана цифровая история идей
Алиева О. В., В кн.: Будь в курсе цифровых гуманитарных исследований.: Красноярск: Сибирский федеральный университет, 2024. С. 51–59.
Цифровая история идей — сравнительно молодое направление внутри Digital Humanities, использующее инструменты корпусной лингвистики в сочетании с методологией Кембриджской школы и Begriffsgeschichte. Как теоретические рамки, так и практические воплощения этого подхода нуждаются в осмыслении, которое должно показать, во-первых, целесообразность, а во-вторых, возможность его усвоения в российском образовательном и научном контексте. Оставляя теоретические вопросы для другого ...
Добавлено: 3 декабря 2024 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору