• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Применение платформы TXM для анализа текстов различного типа
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.
20 мая 2026 г.
Творческая работа как лекарство от выгорания
Творческая и доброжелательная атмосфера, новые методы в Международной лаборатории (впоследствии центре) социокультурных исследований привлекают молодых исследователей. За годы работы в Вышке они становятся учеными и преподавателями, известными в России и за рубежом. О своем пути в центре и в Вышке, исследованиях и роли наставников в научных успехах рассказали главный научный сотрудник ЦСКИ Зарина Лепшокова и ведущий научный сотрудник Екатерина Бушина.
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Применение платформы TXM для анализа текстов различного типа

С. 283–285.
Фокина А. И., Бурба А. В.

В работе рассматриваются результаты исследования текстов на основе метода анализа соответствий платформы корпусного анализа TXM. Исследованы не связанные между собой корпусы противоправных и поэтических текстов для проверки применимости и эффективности методики на несходных наборах текстов. В результате выявлена результативность применения анализа соответствий для корпусов различного типа. Сделан вывод о возможности применения данного инструмента платформы TXM для оценки качества составления какого-либо корпуса и его дальнейшего применения в качестве обучающей выборки для решения задач машинного обучения.

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: анализ соответствийкорпусный анализплатформа TXMкорпус противоправных текстовкорпус поэтических текстов

В книге

Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов им. Е.В. Арменского 2023
МИЭМ НИУ ВШЭ, 2023.
Похожие публикации
Дискурсивные возможности больших языковых моделей при решении задач генерации новых текстов
Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38
На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...
Добавлено: 19 ноября 2025 г.
Репрезентация фрейма ГОРОД в текстах почтовой переписки: корпусное исследование
Куликова В. А., Человек: образ и сущность. Гуманитарные аспекты 2026 № 1 С. 64–81
Исследуется вербальная репрезентация города на материале 993 контекстов, содержащих описание города в открытках дореволюционного, советского и постсоветского периодов. Объектом анализа выступает фрейм-структура ГОРОД, а предметом – особенности ее вербализации в корпусе текстов почтовой переписки. Исследование сочетает методы концептуального моделирования и корпусные методы. В результате построена модель фрейма ГОРОД, состоящая из 6 вершинных узлов со слотами. ...
Добавлено: 2 ноября 2025 г.
Корпусное исследование «рынка животных»: стратегии репрезентации идеального питомца в Интернет-дискурсе
Кирина М. А., Родионов Р. А., В кн.: Векторы. Сборник тезисов XXIII международной конференции молодых учёных (10‒13. 04. 2025 г.).: М.: МВШСЭН, 2025. С. 11–17.
Добавлено: 31 июля 2025 г.
Риторическая структура в советских агитационных материалах: Корпусный анализ брошюр для переселенцев 1950‒60-х годов
Пермякова Т. М., Смирнова Е. А., Вестник Пермского университета. Серия: История 2024 № 4(67) С. 84–98
Представлен риторический анализ корпуса советских агитационных брошюр, опубликованных с 1952 по 1966 г. с целью побудить людей переселяться в колхозы и совхозы, расположенные в различных областях страны. Корпус составил 21 документ общим объемом 166 тысяч слов. Представлен анализ риторической структуры текстов, а также наиболее частотных многословных последовательностей из 4‒6 слов и их распределения по риторическим ...
Добавлено: 27 декабря 2024 г.
АНАЛИЗ КОРПУСА ПОЭТИЧЕСКИХ ТЕКСТОВ НА ПЛАТФОРМЕ TXM
Фокина А. И., Чеповский А. М., В кн.: Труды международной конференции «Корпусная лингвистика — 2023», 21–23 июня 2023 г., Санкт-Петербург.: СПб.: Издательство Санкт-Петербургского университета, 2024. С. 224–231.
В работе рассматриваются результаты анализа соответствий на основе платформы корпусного анализа TXM. Исследован корпус поэзии Серебряного века, в состав которого входят подкорпуса, соответствующие основным течениям и авторам данного периода ...
Добавлено: 2 декабря 2024 г.
ТОКСИЧНОСТЬ КАК КОММУНИКАТИВНАЯ КАТЕГОРИЯ РУССКОЙ РЕЧЕВОЙ ПРАКТИКИ ЧЕРЕЗ ПРИЗМУ КОРПУСА, ТЕХНОЛОГИЙ NLP И ПСИХОЛИНГВИСТИЧЕСКОГО ЭКСПЕРИМЕНТА
Колмогорова А. В., В кн.: XV Конгресс МАПРЯЛ. Избранные доклады.: СПб.: МАПРЯЛ, 2024. Гл. 8 С. 1683–1690.
Добавлено: 29 ноября 2024 г.
КОЛИЧЕСТВЕННЫЙ АНАЛИЗ ЖЕСТОВ В СОВЕТСКОМ КИНО НА МАТЕРИАЛЕ МУЛЬТИМЕДИЙНОГО КОРПУСА НАЦИОНАЛЬНОГО КОРПУСА РУССКОГО ЯЗЫКА
Колмогорова А. В., Сергеева М. О., Мигаль А. В., Культура и текст 2024 № 2(57) С. 181–191
Статья посвящена исследованию корреляции эмоциональной тональности жеста с его локализацией путем проведения контент-анализа жестов, представленных в мультимедийном подкорпусе устного русского языка, проаннотированного Е.А.Гришиной и состоящего из видеофрагментов позднесоветсткого кинематографа. Целью статьи является определение превалирующей эмоциональной тональности жеста в зависимости от его телесной локализации. В рамках работы были проведены корпусный лингвистический анализ, сентимент-анализ и корреляционный анализ ...
Добавлено: 29 ноября 2024 г.
Academic English melting pot: Reconsidering the use of lexical bundles in academic writing
Gritsenko E.S, Kamou O.M., Russian Journal of Linguistics 2024 Vol. 28 No. 3 P. 615–632
Many studies addressing the differences in the use of lexical bundles in academic English by L1 and L2 writers interpret these differences as a deficiency or deviation that L2 writers need to eliminate. In this paper, we argue that this “deviant” use is not essentially the product of insufficient knowledge of English and/or Anglophone norms ...
Добавлено: 31 октября 2024 г.
Хеджирование в точных и гуманитарных дисциплинах: корпусный анализ научных статей
Смирнова Е. А., Жанры речи 2026 Т. 21 № 1(49) С. 60–67
Статья посвящена количественному анализу использования средств снижения категоричности высказывания (хеджей) в корпусе научных статей по четырем точным (химия, физика, математика, машиностроение) и четырем гуманитарным (лингвистика, история, менеджмент, политология) наукам, объемом приблизительно 1,6 млн слов. Выдвигается гипотеза о том, что существуют значимые различия в употреблении хеджей между двумя группами дисциплин. Анализ основан на изучении 81 языковой ...
Добавлено: 26 октября 2024 г.
Dostoevsky in Japanese Translations: The Problem of Textual Images
U. P. Strizhak, Russian Japanology Review 2024 Vol. 7 No. 1 P. 110–127
Добавлено: 16 августа 2024 г.
Применение вычислительных методов корпусного анализа к исследованию текстов литературных произведений
Аванесян Н. Л., Губина О. В., Чеповский А. М., Труды Института системного анализа Российской академии наук 2024 Т. 74 № 2 С. 25–32
Статья посвящена применению математических методов корпусного анализа для  исследований литературных текстов русских писателей. Для исследований создан корпус прозаических текстов художественной литературы России XIX века, состоящий из пяти подкорпусов. Каждый подкорпус содержит тексты одного из авторов. На примере созданного корпуса  продемонстрированы возможности применения метода анализа соответствий, интегрированного в корпусную платформу TXM в качестве одного из средств ...
Добавлено: 4 июля 2024 г.
Словами героев русского рассказа: речевая картина XX века
Кирина М. А., Лукьянчикова А. С., В кн.: Русская и зарубежная филология в диалоге культур : материалы Всероссийской научно-практической конференции с международным участием (г. Ростов-на-Дону, 19–21 октября 2023 г.).: Издательство Южного федерального университета, 2024. С. 16–20.
Добавлено: 10 декабря 2023 г.
Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей
Фокина А. И., Чеповский А. А., Чеповский А. М., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2023 Т. 21 № 2 С. 29–38
При формировании графов взаимодействующих объектов, построенных при импорте данных из социальных  сетей и сетей мгновенного обмена сообщениями, в качестве атрибутов вершин выступают в том числе и тек-стовые данные. В настоящей работе авторы приводят описание методики исследования текстов, основанной на процедурах  корпусного  анализа.  Целью  данной  статьи  является  проверка  методологических  средств,  предо-ставляемых программным обеспечением TXM для сравнительного анализа текстов ...
Добавлено: 9 октября 2023 г.
Оценка в устной истории: корпусный анализ воспоминаний переселенцев в Калининградскую область в 1945–1950 гг.
Смирнова Е. А., Пермякова Т. М., Исмакаева И. Д., Вестник Томского государственного университета 2023 № 491 С. 40–48
В работе представлен анализ оценочной лексики в воспоминаниях переселенцев из разных частей Советского союза в Калининградскую область в период 1945–1950 гг. с использованием методов корпусной лингвистики и системно-функционального подхода. Исследование корпуса, основанное на модели анализа оценки (Appraisal Framework) Мартина и Уайта (2005), позволяет заключить, что процесс переселения и адаптации к новой жизни часто воспринимался переселенцами ...
Добавлено: 9 сентября 2023 г.
Применение методов корпусной лингвистики к анализу текстов Telegram
Асеева Я. О., Фокина А. И., В кн.: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием, Москва, РУДН, 17–21 апреля 2023 г.: М.: Российский университет дружбы народов, 2023. С. 290–294.
За последнее время число пользователей мессенджера Telegram во всем мире превысило 700 миллионов человек в ежемесячном измерении и продолжает расти каждый день. Telegram используется не только для обмена личными сообщениями, но он также стал ведущей площадкой политических, культурных и новостных каналов — альтернативы традиционным СМИ. Цель данной работы — исследовать выборку текстов, взятую из Telegram, ...
Добавлено: 8 июня 2023 г.
Исследование проектных культур российских компаний с помощью метода анализа соответствий (correspondence analysis)
Титов С. А., Титова Н. В., Брикошина И. С., Cloud of Science 2019 Т. 6 № 3 С. 349–386
В управлении социальными системами организационная культура играет важную роль. Изучению организационной культуры посвящено большое количество исследований. Но проблематика организационной культуры в контексте проектно-ориентированного управления изучена в значительно меньшей степени, несмотря на высокую практическую значимость использования организационной культуры как одного из инструментов и элементов управления проектами. Еще больший дефицит обнаруживается в эмпирических исследованиях организационной культуры с ...
Добавлено: 30 августа 2019 г.
Анализ корпусов текстов террористической и антиправовой направленности
Лаврентьев А. М., Смирнов И. В., Соловьев Ф. Н. и др., Вопросы кибербезопасности 2019 № 4(32) С. 54–60
Цель исследования: разработка методики создания и автоматического анализа специальных корпусов текстов для последующего применения их в качестве обучающих выборок и определения дифференцирующих признаков в задачах классификации текстов. Метод: применялись инструменты анализа корпусной платформы TXM, расширенной разработанными процедурами вычисления дополнительных характеристик текстов, таких как буквосочетания, псевдоосновы, именные группы, глагольные группы.  Полученные результаты: показано, что  разработанные средства расширения ...
Добавлено: 10 августа 2019 г.
Внедрение в TXM дополнительных инструментов автоматической обработки текста
Лаврентьев А. М., Соловьев Ф. Н., Чеповский А. М., В кн.: Труды международной конференции "Корпусная лингвистика - 2019".: СПб.: Издательство Санкт-Петербургского университета, 2019. С. 55–62.
Представлен опыт расширения возможностей платформы TXM за счет инструментов автоматической обработки текста (выделение псевдооснов, именных групп, анализ глагольного управления). В сочетании со стандартными функциями TXM (факторный анализ соответствий, специфичность и т.д.) они позволяют более эффективно осуществлять анализ специализированных корпусов, нацеленных, в частности, на выявление противоправного дискурса. ...
Добавлено: 8 июля 2019 г.
О чувстве долга как лингвоспецифичном концепте русского языка (в фокусе Национального корпуса русского языка)
Бочкарев А. Е., Вестник Санкт-Петербургского университета. Язык и литература 2019 Т. 16 № 1 С. 20–32
Предметом статьи является корпусное исследование чувства долга в  плане концептуальной конфигурации в  русском языковом сознании. Обращение к  Национальному корпусу русского языка представляется в этой связи тем более оправданным, что содержание анализируемого концепта не представлено в «готовом виде» ни в одном из  отдельно взятых контекстов употребления, а  реконструируется из  совокупности всех возможных употреблений. О специфичной конфигурации можно судить по дистрибутивным ...
Добавлено: 2 апреля 2019 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору