• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Автоматическая саммаризация родительских чатов в WhatsApp
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.
2 июня 2026 г.
От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем
Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Автоматическая саммаризация родительских чатов в WhatsApp

Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2025. Т. 23. № 1. С. 80–92.
Дмитриева К. А., Жолус М. Р.

Автоматическая саммаризация текста – одна из ключевых задач NLP, предполагающая создание краткой версии исходного текста. В современном мире, где объемы потребляемой человеком информации неустанно растут, задаче саммаризации уделяется все больше внимания. Автореферирование предполагает два основных подхода: экстрактивный и абстрактивный. Последний заключается в автоматическом создании саммари текста, в котором могут содержаться слова и предложения, не встречающиеся в источнике. Этот подход зачастую требует использования нейросетевых моделей, и для его реализации необходимы большие наборы специальным образом размеченных данных. Несмотря на значительные успехи в абстрактивной саммаризации публицистических и научных текстов, методы и датасеты, используемые для работы с монологическими документами, не всегда применимы для саммаризации диалогов. Кроме того, хотя создано достаточно много англоязычных датасетов для саммаризации текстов различных доменов, существующие наборы данных для автоматического аннотирования текстов на русском языке пока немногочисленны. Настоящая статья посвящена разработке и описанию русскоязычного диалогового датасета для саммаризации сообщений в родительских чатах и последующему обучению модели абстрактивной саммаризации для русского языка на авторском наборе диалоговых данных. В качестве материала выступил родительский чат с учителем в мессенджере WhatsApp. Процесс ручной разметки датасета включал в себя разбиение всех сообщений чата на отдельные диалоги, создание саммари и присвоение тематических меток для каждого разговора. В результате был создан датасет, содержащий 616 диалогов, в общей сложности состоящих из 3380 сообщений. Для файн-тьюнинга были выбраны модели-трансформеры ruT5, mT5 и RuGPT (ruT5 и RuGPT были предварительно обучены на русскоязычном датасете для автоматической саммаризации новостей), а для оценки их качества – метрики ROUGE-1, ROUGE-2, ROUGE-L, BLEU и BERTScore. В результате модели ruT5, дообученной на авторском датасете, удалось превзойти бейзлайн по всем пяти метрикам.

Научное направление: Филология и лингвистика Компьютерные науки
Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: машинное обучениеавтоматическая обработка естественного языкатрансформерыавтоматическая суммаризация
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Текст как Big Data: методы и модели работы с большими текстовыми данными (2024)
Похожие публикации
От «контейнеров для знаний» к «эпистемической амальгамации»: концептуальная метафора в дискурсе междисциплинарности
Нагорная А. В., Бакулев А. В., Человек: образ и сущность. Гуманитарные аспекты 2026 № 2 (66) С. 9–36
В статье исследуется роль концептуальной метафоры в осмыслении принципов междисциплинарного взаимодействия и в продвижении междисдиплинарности как модуса научного познания. Определяются функции метафоры в дискурсе междисциплинарности: идеационная, экспланаторная, иллюстративная, прескриптивная и аффективная. На материале статей и монографий по методологии науки, написанных в период с 1961 по 2025 гг., выявляются главенствующие метафоры, с помощью которых осмысляется суть ...
Добавлено: 5 июня 2026 г.
Avant-Garde Poetry and the Tékhnē of Traditional Versification
Казарцев Е. В., Kirichenko N., Arts 2026 Vol. 15 No. 5 Article 97
Добавлено: 4 июня 2026 г.
Rank‑Turbulence Delta and interpretable approaches to stylometric Delta measures
Evgeny Kazartsev, Dmitry Pronin, Digital Scholarship in the Humanities 2026 P. 1–15
Добавлено: 4 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
Трансфикциональный метаперсонаж Жан-Батист Ботюль
Кириченко В. В., Известия Саратовского университета. Новая серия. Серия: Филология. Журналистика 2026 Т. 26 № 2 С. 200–209
Настоящая работа посвящена фигуре вымышленного философа по имени Жан-Батист Ботюль и его роли в дискурсе современной французской литературы. Для анализа данного героя в работе используются концепции трансфикциональности и метаперсонажа. Сам Ботюль придуман французским журналистом-сатириком Фредериком Пажесом. Его изобретение получило широкую популярность в среде различных деятелей науки и искусства, которые продолжили придумывать исследования и работы, якобы ...
Добавлено: 3 июня 2026 г.
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
Жанровое своеобразие стихотворений во «Властелине колец» Дж.Р.Р. Толкина (на примере плача по Боромиру)
Афанасьев В. А., Новый филологический вестник 2026 № 1(76) С. 274–283
Роман Дж.Р.Р. Толкина «Властелин Колец» отличается обилием стихот-ворных включений в виде поэтических текстов, цитируемых или исполняе-мых (в случае песен) персонажами романа. Этим текстам присуще особенное жанровое разнообразие, согласующееся с литературно-эстетическими пред-почтениями Толкина и отвечающее его стремлению наполнить создаваемую «вторичную реальность» произведениями, которые отражали бы традиции вымышленных народов и служили выразительными повествовательными эле-ментами, дополняющими прозаический рассказ ...
Добавлено: 2 июня 2026 г.
Между дилетантизмом и диссидентством: переводы рассказов Бориса Виана в «Митином журнале»
Балакирева М. Е., Новое литературное обозрение 2026 № 2 (198) С. 225–237
Статья посвящена исследованию неофициальных переводов с французского языка и акцентирует внимание на конкретном примере — переводе рассказов Бориса Виана в «Митином журнале». Рассмотрение особенностей этих переводов позволяет выявить характерную для самиздата рефлексию о роли языка, а также переосмыслить позицию переводчика, противопоставленного переводчику официальному, просветителю и цензору, создающему иллюзорный образ зарубежной литературы в советском пространстве. Разрабатывая ...
Добавлено: 1 июня 2026 г.
Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий
Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26
Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...
Добавлено: 31 мая 2026 г.
ФУНКЦИОНИРОВАНИЕ ВИДА ГЛАГОЛОВ В НАУЧНЫХ ТЕКСТАХ ПОСТНЕКЛАССИЧЕСКОГО ПЕРИОДА
Ильина Е. А., Международный научно-исследовательский журнал 2024 № 6(144)
В настоящей статье рассматривается вопрос об изменении характера научного стиля речи русского литературного языка в постнеклассический период. Показано, что в научно-речевых произведениях (научные статьи по трем отраслям: искусственный интеллект, синергетика и космология) нынешнего периода тенденция к выбору наиболее отвлеченных грамматических единиц проявляется еще отчетливее, чем в научной литературе второй половины XX столетия. В частости, увеличивается ...
Добавлено: 31 мая 2026 г.
Употребление отыменных предлогов в научных текстах постнеклассического периода
Ильина Е. А., Russian linguistic Bulletin 2024 № 12 Статья 14
В настоящей статье рассматривается вопрос об изменении характера научного стиля речи русского литературного языка в постнеклассический период. Анализ отыменных предлогов в научно-речевых произведениях (научные статьи по трем отраслям: искусственный интеллект, синергетика и космология) продемонстрировал продолжение процесса кристаллизации одной из важнейших стилевых черт научной речи – её подчеркнутой логичности. Установлено также увеличение частотности именно тех предлогов, использование которых обусловлено определенным ...
Добавлено: 31 мая 2026 г.
The recognition-by-components method
Slivnitsin P., Мыльников Л. А., Engineering Applications of Artificial Intelligence 2026 Vol. 179 Article 115185
Добавлено: 29 мая 2026 г.
Стратегия оперативного информирования адресата в англоязычном жанре футбольного комментария
Тырыгина В. А., Кабанова И. Н., Занозина В. В., Вестник Нижегородского государственного лингвистического университета им. Н.А. Добролюбова 2023 № 4 С. 180–191
В фокусе внимания настоящей статьи находится жанр футбольного комментария, рассматриваемый с точки зрения реализации в нем стратегии информирования. Соответственно, объектом данного исследования служит жанр футбольного комментария, а предмета состоит в выявлении и описании стратегии информирования и соответствующих ей тактик в текстах данного жанра. Целью исследования является описание актуальной стратегии и тактик сообщения информации при комментировании ...
Добавлено: 29 мая 2026 г.
Сборник студенческих работ «Восточная перспектива»
М.: ООО «Адвансед солюшнз», 2026.
Данный выпуск сборника студенческих статей .Восточная перспектива. включает в себя статьи победителей и призеров XI Международной научной студенческой конференции "Восточная перспектива", состоявшейся 18 мая 2024 года. В 2024 году на конференцию было подано 115 заявок, офлайн и онлайн в конференции приняли участие докладчики и слушатели из различных вузов России и ближнего и дальнего Зарубежья. ...
Добавлено: 29 мая 2026 г.
Сборник студенческих работ «Восточная перспектива»
М.: ООО «Адвансед солюшнз», 2026.
Данный выпуск сборника студенческих статей «Восточная перспектива» включает в себя статьи победителей и призеров X Международной научной студенческой конференции «Восточная перспектива», состоявшейся 15 апреля 2023 года. Юбилейная конференция стала знаковым событием для студентов различных подразделений НИУ ВШЭ и других вузов России, занимающихся подготовкой востоковедческих кадров. ...
Добавлено: 29 мая 2026 г.
От неизвестности к прозрачности: обзор технологий объяснимого ИИ (XAI)
Авдошин С. М., Песоцкая Е. Ю., Информационные технологии 2026 Т. 32 № 4 С. 185–194
С развитием ИИ, и в особенности глубокого обучения, появились модели, способные давать крайне точные прогнозы. Однако их внутренняя логика остается трудной для понимания — и это серьезная проблема, особенно в сферах, где от корректности алгоритма зависят критиче ски важные решения. Одним из перспективных путей ее решения считается направление Explainable Artificial Intelligence (XAI) — разработка подходов, позволяющих прояснять ...
Добавлено: 8 мая 2026 г.
Современные методы анализа временных рядов в мониторинге и прогнозировании состояния оборудования для механизированной добычи
Незнанов А. А., Глушко А. А., Овчинников С. и др., В кн.: Интеллектуальный анализ данных в нефтегазовой отрасли.: М.: ООО «Геомодель Развитие», 2024. С. 140–143.
С развитием систем мониторинга мы получили возможность собирать ключевые показатели работы устройств в процессе механизированной добычи. Каждый день генерируется огромное количество телеметрии, которая пройдя процесс гармонизации и трансформации может быть использована для прогнозирования состояния оборудования. В докладе представлен обзор и произведён отбор современных математических методов и программных реализации инструментов анализа многомерных нерегулярных временных рядов для ...
Добавлено: 29 апреля 2026 г.
Machine Learning Approach to Anticancer Activity Prediction of Transition-Metal Complexes Based on a Large-Scale Experimental Database
Krasnov L., Malikov D., Kiseleva M. и др., Journal of Medicinal Chemistry 2026 Vol. 69 No. 8 P. 8838–8851
Добавлено: 23 апреля 2026 г.
LSTM-модель потребления тепловой энергии в многоэтажном жилом здании
Ершов И. А., Системная инженерия и инфокоммуникации 2025 № 4 С. 11–14
Теплопотребление жилых зданий представляет собой стохастический ряд, создание нейросетевой модели для которого необходимо для проектирования регуляторов тепловой энергии. В статье модель разработана с применением "длинной цепи элементов краткосрочной памяти" (LSTM, Long Short-Term Memory). Высокая точность воспроизведения рядов достигнута обучением модели на наборе данных города Томска 2013-2023 г.г. При моделировании учтены характеристики зданий и температура наружного воздуха. ...
Добавлено: 22 апреля 2026 г.
Алгоритм анализа новостной информации для принятия экономических решений
Чудинова О. С., Первицкая Л. А., Раменская А. В., Индустриальная экономика 2026 № 1 С. 65–78
Статья посвящена разработке алгоритма анализа новостной информации методами машинного обучения, реализованными в библиотеках Python. Обоснование выбора инструментов, применяемых на каждом этапе алгоритма, осуществляется с помощью расчета метрик качества решения соответствующих задач машинного обучения. Результаты работы алгоритма представлены классификацией региональных новостей, собранных за период с августа 2024 года по июнь 2025 года, по отраслям экономики и ...
Добавлено: 20 апреля 2026 г.
Modeling cosolvent effects on solubility in supercritical CO2 using data-driven approaches
Makarov D. M., Каликин Н. Н., Gurikov P. и др., Journal of Supercritical Fluids 2026 Vol. 235 Article 106979
Добавлено: 19 апреля 2026 г.
Эффективность применения прогнозов волатильности в активных торговых стратегиях институциональных инвесторов на российском рынке акций
Лысенок Н. И., Фундаментальная и прикладная математика 2026 Т. 26 № 3 С. 33–42
Исследование посвящено оценке влияния прогнозов реализованной волатильности на результаты активных торговых стратегий на российском рынке акций. На выборке 17 ликвидных акций за 2014-2026 гг. построена гибридная прогнозная модель, объединяющая HAR-J и градиентный бустинг; её преимущество над базовой HAR-J подтверждено тестом Дибольда-Мариано (p < 0,001). Шесть направленных стратегий трёх категорий протестированы с тремя механизмами интеграции прогнозов и без них. ...
Добавлено: 17 апреля 2026 г.
Особые экономические зоны Российской Федерации: моделирование решений потенциальных резидентов и процесса их генерации
Плесовских А. Е., Journal of Applied Economic Research 2023 Т. 22 № 2 С. 323–354
В современных исследованиях широко обсуждается роль особых экономических зон в стимулировании экономического роста и развития России, формировании необходимых инвестиционных потоков и повышении инновационного потенциала страны за счет расширения производства продукции в высокотехнологичных отраслях экономики с высокой добавленной стоимостью. Цель исследования – моделирование процесса генерации резидентов и детерминация количественных факторов, оказывающих статистически значимый эффект на среднегодовой ...
Добавлено: 13 апреля 2026 г.
Опыт генерации оценок эмоциональной валентности и возбуждения слов на основе символьно-уровневой CNN
Люсин Д. В., Валуева Е. А., Сысоева Т. А., В кн.: Психология познания: Материалы Всероссийской научной конференции, ЯрГУ, Институт психологии РАН, 5–6 декабря 2025 г.: Институт психологии РАН, 2026. С. 310–314.
Эмоциональная окраска слов широко используются в  различных академических и прикладных исследованиях, от анализа текстов до понимания когнитивных процессов. Актуальной задачей является создание объёмных датасетов с оценками слов по ряду эмоциональных параметров. Современные методы машинного обучения, основанные на семантической близости слов, извлекаемой из текстовых корпусов, демонстрируют высокие корреляции с человеческими оценками, однако иногда наблюдаются существенные расхождения. ...
Добавлено: 10 апреля 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору