• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Система автоматического аннотирования текстов с помощью стохастической модели
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.
28 апреля 2026 г.
Почему слабые участники соревнований сдаются - и как это изменить
Доцент факультета экономических наук НИУ ВШЭ Анастасия Анцыгина разработала модель распределения призов, которая максимально стимулирует активность участников соревнований. Она предложила пересмотреть классический принцип «победитель получает все» и в некоторых случаях предлагать небольшую награду даже проигравшему. По ее мнению, это может повысить мотивацию участников и сделать соревнование более конкурентным. Результаты исследования опубликованы в журнале Economic Theory.
28 апреля 2026 г.
Исследователи НИУ ВШЭ собрали научную базу данных для изучения пищевых привычек у детей
Созданная в Высшей школе экономики база данных может стать основой для изучения пищевых привычек у детей. Об этом говорится в исследовании «Влияние возрастных, гендерных и социально-ролевых факторов на соответствие пищевого выбора детей возрастным нормам: экспериментальное исследование с веб-приложением Dish-I-Wish». Работа выполнена в рамках Программы фундаментальных исследований НИУ ВШЭ. Исследование было представлено в рамках XXVI Апрельской международной научной конференции.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Система автоматического аннотирования текстов с помощью стохастической модели

Машинное обучение и анализ данных. 2018. Т. 4. № 4. С. 266–279.
Вознесенская Т. В., Леднов Д. А.

Работа посвящена системе автоматического аннотирования текста, реализованной в рамках совместного проекта компании «DC – Systems» и факультета компьютерных наук НИУ ВШЭ. Построение аннотации осуществляется с помощью синтаксически согласованных словосочетаний, наиболее близких к семантике всего текста. При этом пренебрегается возможными дополнительными смыслами отдельных фрагментов текста. Качество аннотации определяется семантической близостью к исходному тексту.

Задача построения аннотации разбивается на две части: оценка семантики текста в целом, то есть без разделения на более мелкие составляющие, и преобразование текста, приводящее к построению аннотации.

В работе описана структурная схема реализованной системы автоматического аннотирования и алгоритм ее работы. Система протестирована на коллекции из 50 текстов различной тематики, приведен пример построенной аннотации и дана оценка его качества с помощью набора мер качества ROUGE [9]. Ограничением применения текущей версии системы является наличие в тексте формул и специальных символов.

Научное направление: Компьютерные науки
Приоритетные направления: компьютерно-математическое
Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: корпусная лингвистикаcorpus linguisticsавтоматическое аннотированиеText summarizationautomatic text processing
Похожие публикации
Influence of the Normal Magnetic Component to Magnetotail Current Sheet Forma
Domrin V. I., Malova H. V., V. Yu. Popov и др., Cosmic Research 2026 Vol. 64 No. 2 P. 238–252
Добавлено: 27 апреля 2026 г.
Asymmetric Equilibrium Structures of Superthin Current Sheets: The Asymmetry of Plasma Sources
Tsareva O. O., Malova H. V., V. Yu. Popov и др., Plasma Physics Reports 2026 Vol. 52 No. 2 P. 179–185
Добавлено: 27 апреля 2026 г.
WWW '26: The ACM Web Conference 2026
NY: Association for Computing Machinery (ACM), 2026.
Добавлено: 23 апреля 2026 г.
Разработка микросервиса ADP для идентификации источников выбросов на основе машинного обучения с подкреплением
Кычкин А. В., Черницин И. А., Прикладная информатика 2026 Т. 21 № 1 С. 40–58
Представлены результаты разработки программного микросервиса, встраиваемого в системы мониторинга качества атмосферного воздуха для поддержки процессов идентификации промышленных источников загрязнений. Выброс и последующее распространение вредных веществ в приземистых слоях атмосферы происходит в динамике и характеризуется высокой неопределенностью из‑за особенностей технологических установок, их режимов работы, влияния рельефа местности, зданий и метеофакторов. Зависимости между местоположением источника выброса и ...
Добавлено: 23 апреля 2026 г.
2026 International Conference on Artificial Intelligence, Computer, Data Sciences and Applications (ACDSA)
IEEE, 2026.
Добавлено: 21 апреля 2026 г.
What Drives Multi-Chain Crypto Forecasting: Model Choice, Feature Selection, and Transferability
Wang M., Xiao Y., Браславский П. И. и др., Mathematics 2026 Vol. 14 No. 8 Article 1286
Добавлено: 20 апреля 2026 г.
Cross-influence of two societies in deterministic evolutionary game
Щур Л. Н., Antonov D., Burovski E., International Journal of Bifurcation and Chaos in Applied Sciences and Engineering 2026 P. 1–9
Добавлено: 20 апреля 2026 г.
Ising models on the hydrogen peroxide and other lattices
Qin X., Deng Y., Щур Л. Н. и др., / Series arXiv "math". 2026. No. 2603.02962.
Добавлено: 20 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Проектирование сети Интернета вещей на основе многокритериальной оптимизации и информационного моделирования здания
Эбрахим А., Информационные процессы 2025 Т. 25 № 4 С. 787–798
В статье предложен метод планирования расположения точек доступа и шлюзов внутри зданий для построения сетей Интернета вещей. Основа метода — использование информации из информационой модели здания, что даёт возможность легко учитывать как геометрию, так и физико-технические характеристики строительных элементов при расчёте распространения радиосигнала. В данной работе для решения задач оптимизации применяется генетический алгоритм U-NSGA-III. Расчёты ...
Добавлено: 19 апреля 2026 г.
Modeling cosolvent effects on solubility in supercritical CO2 using data-driven approaches
Makarov D. M., Каликин Н. Н., Gurikov P. и др., Journal of Supercritical Fluids 2026 Vol. 235 Article 106979
Добавлено: 19 апреля 2026 г.
2026 28th International Conference on Digital Signal Processing and its Applications (DSPA)
IEEE, 2026.
Добавлено: 18 апреля 2026 г.
WWW '26: Proceedings of the ACM Web Conference 2026
NY: Association for Computing Machinery (ACM), 2026.
Добавлено: 17 апреля 2026 г.
Сопоставление номенклатур товаров ресторанов и поставщиков с помощью LLM — Case Study для ресторанного холдинга
Джин С., Панфилов П. Б., Сулейкин А. С., Труды Института системного программирования РАН 2025 Т. 37 № 6 С. 163–176
В современном ресторанном бизнесе точное сопоставление номенклатуры продуктов между ресторанами и поставщиками является критически важной задачей. Эффективное управление запасами и оптимизация закупок напрямую влияют на прибыльность бизнеса. С ростом числа поставщиков и ассортимента продукции традиционные методы сопоставления становятся менее эффективными. В данном исследовании предлагается использовать большие языковые модели (LLM) для автоматизации и повышения точности сопоставления ...
Добавлено: 17 апреля 2026 г.
Имитационное моделирование. Теория и практика (ИММОД 2025)
СПб.: АО "ЦТСС", 2025.
В научном издании представлены труды Двенадцатой всероссийской научно-практической конференции по имитационному моделированию и его применению в науке и промышленности «Имитационное моделирование. Теория и практика» (ИММОД-2025) по следующим направлениям: - теоретические основы и методология имитационного и комплексного моделирования; - методы исследования и оценки качества моделей, валидация и верификации моделей; - методы и системы распределенного моделирования; - ...
Добавлено: 17 апреля 2026 г.
Proceedings of the 2025 INTERNATIONAL CONFERENCE "QUALITY MANAGEMENT, DIGITAL SECURITY, INFORMATION TECHNOLOGIES" (2025 QM&DS&IT)
IEEE, 2025.
Добавлено: 17 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов
Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50
На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...
Добавлено: 18 марта 2026 г.
Promotional adjectives in grant proposal abstracts: a corpus study
Dmitriy S. Tulyakov, Tatiana M. Permyakova, Ekaterina A. Balezina, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 6 P. 58–67
Эффективно интегрируя дискурс продвижения в аннотации заявок на гранты, исследователи могут более убедительно представить свои идеи и повысить шансы на получение финансирования. Частотность использования прилагательных продвижения при написании заявок на гранты может отличаться в разных областях исследований. В данной статье рассматривается употребление прилагательных продвижения в аннотациях заявок на гранты в шести научных сферах. Основная гипотеза ...
Добавлено: 2 марта 2026 г.
«Звезды рекомендуют весам пить сливовое вино»: исследование астрологического дискурса на основе распределений частотной лексики и сентимент-анализа
Кирина М. А., Лукьянчикова А. С., В кн.: Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : Сборник научных статей по итогам II Международной научной конференции Минск, 23–24 октября 2025 г.: Мн.: БГУИЯ, 2025. С. 74–85.
В статье рассматриваются характерные особенности гороскопических текстов как части астрологического дискурса. Материалом исследования выступает представительная выборка ежедневных предсказаний на русском языке, опубликованных в открытых группах социальной сети «ВКонтакте», суммарным объемом 1185425 словоупотреблений. С использованием методов корпусной и компьютерной лингвистики анализируются содержательные лексические единицы – как общие, так и отличительные для каждого знака зодиака (в сопоставлении ...
Добавлено: 28 февраля 2026 г.
Динамика восприятия площадей в пространстве города носителями русского языка (сравнительный анализ по данным НКРЯ)
Белова П. Е., В кн.: Актуальные вопросы лингвистики и литературоведения: сборник научных статей по материалам международной научной конференции памяти доктора филологических наук, профессора Л.А. Араевой (6–8 февраля 2025).: Кемеровский государственный университет, 2025. С. 155–160.
В данной статье содержатся результаты исследования того, как в русской языковой кар-тине мира, начиная со второй половины XX века по настоящее время, менялось восприятие площадей в пространстве города. В ходе обращения к подкорпусу художественных текстов второй половины XX века и XXI в. Национального корпуса русского языка были выявлены присущие рассматриваемому объекту когнитивные признаки, установлены предметно-понятийные ...
Добавлено: 4 февраля 2026 г.
Языковая концептуализация пространства в художественном тексте (по данным НКРЯ)
Белова П. Е., В кн.: Когнитивные исследования языка. Вып. №1 (62): материалы Международной научной конференции по когнитивной лингвистике. 5-7 июня 2025. Ч. 2Ч. 2. Кн. 62. Вып. 1.: ТюмГУ-Press, 2025. С. 56–60.
Данная статья представляет результаты изучения содержания концепта ПРОСТРАНСТВО в русском языковом сознании на материале художественных прозаических текстов разных жанров, созданных во второй половине XX века и в XXI веке и представленных в НКРЯ. Анализ проведен с учетом таких культурно-языковых фильтров, как пропозициональные установки, предметно-понятийные корреляции и метафорические преобразования. ...
Добавлено: 4 февраля 2026 г.
Iterative Ricci-Foster Curvature Flow with GMM-Based Edge Pruning: A Novel Approach to Community Detection
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Implementing Transport Coding in OMNeT++ for Message Delay Reduction
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору