• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Новый комплекс инструментов автоматической обработки текста для платформыTXM и его апробация на корпусе для анализа экстремистских текстов
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Новый комплекс инструментов автоматической обработки текста для платформыTXM и его апробация на корпусе для анализа экстремистских текстов

Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2018. Т. 16. № 3. С. 19–31.
Лаврентьев А. М., Соловьев Ф. Н., Суворова М. И., Фокина А. И., Чеповский А. М.

ПлатформаTXM предоставляет широкие возможности корпусного анализа, такие как анализ соответствий,
кластеризация, построение лексических таблиц, поиск сложных лексических конструкций, выделение подкорпу-сов по различным параметрам. По умолчанию платформа работает со словоупотреблениями в качестве структур-ных единиц анализа. Она интегрирована с единственным расширениемTreeTagger, позволяющим проводить лишь  морфологический  анализ  и  лемматизацию  словоупотреблений.  Однако  пользователь  может  сопроводить каждое словоупотребление набором дополнительных характеристик, позволяющих существенно усложнить анализ, сделать его более гибким. В настоящей работе описывается разработанный нами набор утилит, позво-ляющий, опираясь как на наши собственные программные решения, так и на готовые средства анализа, расши-рить и усложнить анализ корпусов в платформеTXM. Особого внимания заслуживают выделение псевдоосновы в словах текста с использованием метода структурных схем и выявление именных групп в структуре текста. Эти расширения позволяют повысить эффективность таких используемыхTXM методов, как анализ специфичности и анализ соответствий. В порядке апробации излагаются результаты эксперимента по анализу корпуса, содержа-щего тексты, оцененные экспертами как экстремистские, и«нейтральные» тексты схожей тематики(религия, политика, идеология). Все тесты показывают ярко выраженное противостояние нейтральных и маркированных текстов и позволяют на основе полученных результатов продолжить работу по автоматическому и полуавтомати-ческому выявлению потенциально противоправных текстов

Научное направление: Компьютерные науки Филология и лингвистика
Приоритетные направления: гуманитарные науки компьютерно-математическое
Язык: русский
Полный текст
DOI
Ключевые слова: корпусная лингвистикаcorpus linguisticscorrespondence analysisанализ соответствийautomated morphological analysisspecificityавтоматический морфологический анализautomated syntactic parsingTXM platformdetecting extremist textsавтоматический синтак-сический анализплатформаTXMспецифичностьвыявление экстремистских текстов
Похожие публикации
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 3: System Demonstrations)
Association for Computational Linguistics, 2026.
Добавлено: 19 мая 2026 г.
Dataset of solubility values for organic compounds in binary mixtures of solvents at various temperatures
Беззубов С. И., Malikov D., Krasnov L. и др., Scientific data 2026 Vol. 13 Article 727
Добавлено: 19 мая 2026 г.
Aerokinesis: An IoT-Based Vision-Driven Gesture Control System for Quadcopter Navigation Using Deep Learning and ROS2
Pikalov V., Meshcheryakov V., Kondratev S. и др., Technologies 2026 Vol. 14 No. 1 P. 1–27
This paper presents Aerokinesis, an IoT-based software–hardware system for intuitive gesture-driven control of quadcopter unmanned aerial vehicles (UAVs), developed within the Robot Operating System 2 (ROS2) framework. The proposed system addresses the challenge of providing an accessible human–drone interaction interface for operators in scenarios where traditional remote controllers are impractical or unavailable. The architecture comprises ...
Добавлено: 19 мая 2026 г.
Aerokinesis: An IoT-Based Vision-Driven Gesture Control System for Quadcopter Navigation Using Deep Learning and ROS2
Кондратьев С., Никитин Г. Э., Дырченкова Ю. А. и др., Technologies 2026 Vol. 14 No. 1 P. 1–27
This paper presents Aerokinesis, an IoT-based software–hardware system for intuitive gesture-driven control of quadcopter unmanned aerial vehicles (UAVs), developed within the Robot Operating System 2 (ROS2) framework. The proposed system addresses the challenge of providing an accessible human–drone interaction interface for operators in scenarios where traditional remote controllers are impractical or unavailable. The architecture comprises ...
Добавлено: 19 мая 2026 г.
Parallel Computational Technologies. PCT 2025
Springer, 2025.
Добавлено: 18 мая 2026 г.
Juxtapositional vs. possessive-like encoding in Russian specificational constructions
Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11
Добавлено: 18 мая 2026 г.
KMHCR: A Key-Controlled Signal-Domain Transformation for 5G IoT Security
Ronglin Z., Wei L., Jiahong C. и др., Journal of Signal Processing Systems 2026 Vol. 98 P. 1–15
Добавлено: 16 мая 2026 г.
DPN Verifier: A Toolkit for Faster Soundness Verification and Repair of Process Models with Data
Суворов Н. М., Proceedings of the Institute for System Programming of the RAS 2026 Vol. 38 No. 3(2) P. 49–66
Сети Петри с данными (DPN) являются расширением классических сетей Петри, позволяющим моделировать процессы, где данные влияют на поток управления, обеспечивая комплексное представление о поведении системы и возможность обнаружения точек отказа, которые в противном случае были бы скрыты. Одним из критериев корректности для моделей процессов является бездефектность. Модель процесса называется бездефектной, если она всегда корректно завершается ...
Добавлено: 16 мая 2026 г.
КОГНИТИВНО-АССОЦИАТИВНОЕ ПОЛЕ ОНИМОВ САНКТ-ПЕТЕРБУРГА И ВЕНЫ
Зелинская Ю. Ю., Когнитивные исследования языка 2025 № 4(65) С. 180–186
Статья посвящена исследованию онима как когнитивного стимула, способствующего декодированию языка городского пространства двух этносов. Основу исследования составляет анализ результатов ономастического ассоциативного эксперимента, целью которого было выявление доминирующих типов ассоциативных реакций на антропонимы, ойкодонимы, годонимы и ресторонимы Санкт-Петербурга и Вены. Выявленные реакции отображают сформированный ментальный ономастикон респондентов. ...
Добавлено: 16 мая 2026 г.
Лично-числовая асимметрия: согласование пассивных миративов в казымском диалекте хантыйского языка
Старченко А. М., Толдова С. Ю., Типология морфосинтаксических параметров 2023 Т. 6 № 1 С. 130–148
Работа рассматривает ранее не засвидетельствованную модель расщеплённого согласования в парадигме миратива в казымском диалекте хантыйского языка. Расщеплённое согласование выявляется при сравнении активной и пассивной миративных конструкций, а также в ограниченном наборе употреблений нефинитных форм и выражается в том, что в пассивном залоге, в отличие от активного, 3 лицо немаркировано — наблюдается согласование только по числу. ...
Добавлено: 14 мая 2026 г.
QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks
Neal N. X., Weiqing L., Dacheng H. и др., Algorithms 2026 Vol. 19 No. 5 P. 1–22
Добавлено: 13 мая 2026 г.
Глаголы перемещения веществ в славянских языках
Федоров Д. Г., Jezikoslovni Zapiski 2026 № 32(1) С. 23–52
В статье описываются глаголы перемещения жидких и сухих веществ в славянских языках. В ходе работы рассматривается, как славянские языки лексикализуют различные ситуации в рамках семантического поля перемещения веществ, и выделяются параметры которые определяют эту лексикализацию (напр., тип вещества, интенсивность и квантованность потока, каузация). Смежные грамматические явления, такие как мена диатезы и лабильность, также играют роль ...
Добавлено: 13 мая 2026 г.
Образ женщины сквозь года: диахронический анализ репрезентации женщин в российской агитационной рекламе
Габриелова Е. В., Максименко О. И., Социальные и гуманитарные науки на Дальнем Востоке 2026 Т. 23 № 1 С. 241–249
В статье представлен диахронический анализ репрезентации женщины в российской рекламе на материале агитационных плакатов 1917 - 1990 годов и социальных и мотивационных рекламных материалов 2000 - 2020 годов. Целью исследования является выявление эволюции вербальных и визуальных стратегий конструирования женского образа в контексте изменений социально-политической и культурной среды, в основу которых легла память поколений. В теоретической ...
Добавлено: 13 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., Shumen: INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Школьный литературный канон эмиграции 1918–1939 гг.
Стрижкова Д. А., / Институт русской литературы (Пушкинский Дом) РАН. Серия B001 "Репозиторий открытых данных по русской литературе и фольклору". 2026.
В базе данных представлена роспись русскоязычных литературных произведений и отрывков, напечатанных в учебниках по словесности, хрестоматиях, книгах для чтения, сборниках стихотворений и рассказов, выходивших во Франции, Германии, Латвии, Эстонии, Болгарии, Сербии в период первой волны русской эмиграции с 1918 по 1939 гг. Датасет представляет интерес для исследователей школьного литературного канона, эмиграции и детского чтения ...
Добавлено: 22 апреля 2026 г.
Ising models on the hydrogen peroxide and other lattices
Qin X., Deng Y., Щур Л. Н. и др., / Series arXiv "math". 2026. No. 2603.02962.
Добавлено: 20 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Современная российская мультипликация как инструмент воспитания традиционных духовно-нравственных ценностей
Жигунов А. Ю., / Basic Research Programme. Серия HUM "Humanities". 2026. № 1.
В статье предпринимается попытка описания образовательного и воспитательного потенциала современной российской анимации в аспекте формирования представлений молодого поколения о традиционных российских ценностях. С опорой на медиа- и семиотический анализ, метод культурно-исторической интерпретации рассмотрены анимационные российские проекты, созданные с 2000 года по 2025 гг., находившиеся в прокате в эфире телевизионных каналов либо стриминговых сервисов с большой ...
Добавлено: 19 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов
Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50
На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...
Добавлено: 18 марта 2026 г.
Promotional adjectives in grant proposal abstracts: a corpus study
Dmitriy S. Tulyakov, Tatiana M. Permyakova, Ekaterina A. Balezina, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 6 P. 58–67
Эффективно интегрируя дискурс продвижения в аннотации заявок на гранты, исследователи могут более убедительно представить свои идеи и повысить шансы на получение финансирования. Частотность использования прилагательных продвижения при написании заявок на гранты может отличаться в разных областях исследований. В данной статье рассматривается употребление прилагательных продвижения в аннотациях заявок на гранты в шести научных сферах. Основная гипотеза ...
Добавлено: 2 марта 2026 г.
«Звезды рекомендуют весам пить сливовое вино»: исследование астрологического дискурса на основе распределений частотной лексики и сентимент-анализа
Кирина М. А., Лукьянчикова А. С., В кн.: Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : Сборник научных статей по итогам II Международной научной конференции Минск, 23–24 октября 2025 г.: Мн.: БГУИЯ, 2025. С. 74–85.
В статье рассматриваются характерные особенности гороскопических текстов как части астрологического дискурса. Материалом исследования выступает представительная выборка ежедневных предсказаний на русском языке, опубликованных в открытых группах социальной сети «ВКонтакте», суммарным объемом 1185425 словоупотреблений. С использованием методов корпусной и компьютерной лингвистики анализируются содержательные лексические единицы – как общие, так и отличительные для каждого знака зодиака (в сопоставлении ...
Добавлено: 28 февраля 2026 г.
Динамика восприятия площадей в пространстве города носителями русского языка (сравнительный анализ по данным НКРЯ)
Белова П. Е., В кн.: Актуальные вопросы лингвистики и литературоведения: сборник научных статей по материалам международной научной конференции памяти доктора филологических наук, профессора Л.А. Араевой (6–8 февраля 2025).: Кемеровский государственный университет, 2025. С. 155–160.
В данной статье содержатся результаты исследования того, как в русской языковой кар-тине мира, начиная со второй половины XX века по настоящее время, менялось восприятие площадей в пространстве города. В ходе обращения к подкорпусу художественных текстов второй половины XX века и XXI в. Национального корпуса русского языка были выявлены присущие рассматриваемому объекту когнитивные признаки, установлены предметно-понятийные ...
Добавлено: 4 февраля 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору