• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Внедрение в TXM дополнительных инструментов автоматической обработки текста
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
11 июня 2026 г.
Время жизни популяций определяется законами математики
Исследователи НИУ ВШЭ и МГУ доказали универсальный закон, описывающий время исчезновения популяций в случайной среде. Анализ эволюции ветвящихся процессов — сложных вероятностных систем — показал, что вне зависимости от изначального числа особей процесс вымирания подчиняется строгим математическим закономерностям. Результаты опубликованы в Journal of Applied Probability.
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Внедрение в TXM дополнительных инструментов автоматической обработки текста

С. 55–62.
Лаврентьев А. М., Соловьев Ф. Н., Чеповский А. М.

Представлен опыт расширения возможностей платформы TXM за счет инструментов автоматической обработки текста (выделение псевдооснов, именных групп, анализ глагольного управления). В сочетании со стандартными функциями TXM (факторный анализ соответствий, специфичность и т.д.) они позволяют более эффективно осуществлять анализ специализированных корпусов, нацеленных, в частности, на выявление противоправного дискурса.

Язык: русский
Полный текст
Ключевые слова: глагольное управлениеstemmingautomated text analysisTXM platformnoun phrasesverbal dependenciesплатформа TXMпсевдоосновыименные группыавтоматический анализ текстов

В книге

Труды международной конференции "Корпусная лингвистика - 2019"
СПб.: Издательство Санкт-Петербургского университета, 2019.
Похожие публикации
Сравнительный анализ переводов поэтических текстов
Аванесян Н. Л., Чеповский А. М., Правовая информатика 2025 № 3 С. 37–44
Показана применимость к переводам поэтических текстов разработанной ранее методики частотного анализа различных лингвистических характеристик русскоязычных текстов, которая позволяет по коэффициентам попарной ранговой корреляции словарей лингвистических характеристик сравнивать различные тексты и выявлять дифференцирующие признаки для идентификации текстов на естественном языке; проведен сравнительный анализ различных вариантов переводов на русский язык трагедии Уильяма Шекспира «Гамлет, принц датский»; показаны ...
Добавлено: 13 октября 2025 г.
The impact of innovation news coverage on illiquid stocks: the case of US market
Федорова Е. А., Степанов В. А., European Journal of Innovation Management 2023 Vol. 27 No. 5 P. 1767–1792
Добавлено: 29 апреля 2025 г.
АНАЛИЗ КОРПУСА ПОЭТИЧЕСКИХ ТЕКСТОВ НА ПЛАТФОРМЕ TXM
Фокина А. И., Чеповский А. М., В кн.: Труды международной конференции «Корпусная лингвистика — 2023», 21–23 июня 2023 г., Санкт-Петербург.: СПб.: Издательство Санкт-Петербургского университета, 2024. С. 224–231.
В работе рассматриваются результаты анализа соответствий на основе платформы корпусного анализа TXM. Исследован корпус поэзии Серебряного века, в состав которого входят подкорпуса, соответствующие основным течениям и авторам данного периода ...
Добавлено: 2 декабря 2024 г.
Применение вычислительных методов корпусного анализа к исследованию текстов литературных произведений
Аванесян Н. Л., Губина О. В., Чеповский А. М., Труды Института системного анализа Российской академии наук 2024 Т. 74 № 2 С. 25–32
Статья посвящена применению математических методов корпусного анализа для  исследований литературных текстов русских писателей. Для исследований создан корпус прозаических текстов художественной литературы России XIX века, состоящий из пяти подкорпусов. Каждый подкорпус содержит тексты одного из авторов. На примере созданного корпуса  продемонстрированы возможности применения метода анализа соответствий, интегрированного в корпусную платформу TXM в качестве одного из средств ...
Добавлено: 4 июля 2024 г.
Применение платформы TXM для анализа текстов различного типа
Фокина А. И., Бурба А. В., В кн.: Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов им. Е.В. Арменского 2023.: МИЭМ НИУ ВШЭ, 2023. С. 283–285.
В работе рассматриваются результаты исследования текстов на основе метода анализа соответствий платформы корпусного анализа TXM. Исследованы не связанные между собой корпусы противоправных и поэтических текстов для проверки применимости и эффективности методики на несходных наборах текстов. В результате выявлена результативность применения анализа соответствий для корпусов различного типа. Сделан вывод о возможности применения данного инструмента платформы TXM для оценки качества ...
Добавлено: 6 мая 2024 г.
Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей
Фокина А. И., Чеповский А. А., Чеповский А. М., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2023 Т. 21 № 2 С. 29–38
При формировании графов взаимодействующих объектов, построенных при импорте данных из социальных  сетей и сетей мгновенного обмена сообщениями, в качестве атрибутов вершин выступают в том числе и тек-стовые данные. В настоящей работе авторы приводят описание методики исследования текстов, основанной на процедурах  корпусного  анализа.  Целью  данной  статьи  является  проверка  методологических  средств,  предо-ставляемых программным обеспечением TXM для сравнительного анализа текстов ...
Добавлено: 9 октября 2023 г.
Анализ текстов сообществ социальных сетей
Аванесян Н. Л., Зенькова В. В., Чеповский А. А. и др., Успехи кибернетики 2023 Т. 4 № 2 С. 33–39
В настоящей работе авторы приводят описание методики статистического анализа текстов Telegram-каналов, основанной на сравнении методами корреляционного анализа автоматически сформированных частотных словарей. Рассматриваются коэффициенты попарной ранговой корреляции для сравнения частотных характеристик текстов различных неявных сообществ на естественном языке. Метод предлагается для оценки качества выделения неявных сообществ на графе, полученном при импорте данных из сети каналов мессенджера ...
Добавлено: 19 июля 2023 г.
Применение методов корпусной лингвистики к анализу текстов Telegram
Асеева Я. О., Фокина А. И., В кн.: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием, Москва, РУДН, 17–21 апреля 2023 г.: М.: Российский университет дружбы народов, 2023. С. 290–294.
За последнее время число пользователей мессенджера Telegram во всем мире превысило 700 миллионов человек в ежемесячном измерении и продолжает расти каждый день. Telegram используется не только для обмена личными сообщениями, но он также стал ведущей площадкой политических, культурных и новостных каналов — альтернативы традиционным СМИ. Цель данной работы — исследовать выборку текстов, взятую из Telegram, ...
Добавлено: 8 июня 2023 г.
Effort versus performance tradeoff in lemmatisation for Uralic languages
Таерз Ф. М., Бибаева М. А., / Series 2020.iwclul-1.2 "Proceedings of the Sixth International Workshop on Computational Linguistics of Uralic Languages". 2020.
Добавлено: 20 апреля 2021 г.
Характеристики текстов сообществ социальных сетей
Аванесян Н. Л., Соловьев Ф. Н., Чеповский А. А., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2021 Т. 19 № 1 С. 5–14
Приводится описание методики статистического анализа текстов социальных сетей, основанной на сравнении методами корреляционного анализа автоматически сформированных частотных словарей. Рассматриваются психолингвистические характеристики и коэффициенты попарной ранговой корреляции для сравнения частотных характеристик текстов на естественном языке. ...
Добавлено: 14 апреля 2021 г.
Выявление значимых признаков противоправных текстов
Аванесян Н. Л., Соловьев Ф. Н., Тихомирова Е. А. и др., Вопросы кибербезопасности 2020 № 4(38) С. 76–84
Разработана методика частотного анализа лексики противоправных текстов, которая  позволяет  по  частотным  словарям  сравнивать  различные  наборы  текстов  и  выявлять  дифференцирую-шие признаки; приведена методика вычисления коэффициента попарной ранговой корреляции для сравнения частотных словарей различных лексических характеристик; проведен сравнительный анализ различных по те-матике  коллекций  текстов  противоправной  направленности;  показана  возможность  использования  частотных лексических характеристик для исследования свойств текстов с целью ...
Добавлено: 4 декабря 2020 г.
PERSONAL BRANDS OF ESPORTS ATHLETES: AN EXPLORATION OF EVALUATION MECHANISMS
Мусабиров И. Л., Булыгин Д. И., Марченко Е. Ю., / Series WP BRP "Basic research program". 2019. No. 90.
Добавлено: 12 декабря 2019 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору