?
Применение платформы TXM для анализа текстов различного типа
С. 283–285.
Фокина А. И., Бурба А. В.
В работе рассматриваются результаты исследования текстов на основе метода анализа соответствий платформы корпусного анализа TXM. Исследованы не связанные между собой корпусы противоправных и поэтических текстов для проверки применимости и эффективности методики на несходных наборах текстов. В результате выявлена результативность применения анализа соответствий для корпусов различного типа. Сделан вывод о возможности применения данного инструмента платформы TXM для оценки качества составления какого-либо корпуса и его дальнейшего применения в качестве обучающей выборки для решения задач машинного обучения.
Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38
На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...
Добавлено: 19 ноября 2025 г.
Куликова В. А., Человек: образ и сущность. Гуманитарные аспекты 2026 № 1 С. 64–81
Исследуется вербальная репрезентация города на материале 993 контекстов, содержащих описание города в открытках дореволюционного, советского и постсоветского периодов. Объектом анализа выступает фрейм-структура ГОРОД, а предметом – особенности ее вербализации в корпусе текстов почтовой переписки. Исследование сочетает методы концептуального моделирования и корпусные методы. В результате построена модель фрейма ГОРОД, состоящая из 6 вершинных узлов со слотами. ...
Добавлено: 2 ноября 2025 г.
Кирина М. А., Родионов Р. А., В кн.: Векторы. Сборник тезисов XXIII международной конференции молодых учёных (10‒13. 04. 2025 г.).: М.: МВШСЭН, 2025. С. 11–17.
Добавлено: 31 июля 2025 г.
Пермякова Т. М., Смирнова Е. А., Вестник Пермского университета. Серия: История 2024 № 4(67) С. 84–98
Представлен риторический анализ корпуса советских агитационных брошюр, опубликованных с 1952 по 1966 г. с целью побудить людей переселяться в колхозы и совхозы, расположенные в различных областях страны. Корпус составил 21 документ общим объемом 166 тысяч слов. Представлен анализ риторической структуры текстов, а также наиболее частотных многословных последовательностей из 4‒6 слов и их распределения по риторическим ...
Добавлено: 27 декабря 2024 г.
Фокина А. И., Чеповский А. М., В кн.: Труды международной конференции «Корпусная лингвистика — 2023», 21–23 июня 2023 г., Санкт-Петербург.: СПб.: Издательство Санкт-Петербургского университета, 2024. С. 224–231.
В работе рассматриваются результаты анализа соответствий на основе платформы корпусного анализа TXM. Исследован корпус поэзии Серебряного века, в состав которого входят подкорпуса, соответствующие основным течениям и авторам данного периода ...
Добавлено: 2 декабря 2024 г.
Колмогорова А. В., В кн.: XV Конгресс МАПРЯЛ. Избранные доклады.: СПб.: МАПРЯЛ, 2024. Гл. 8 С. 1683–1690.
Добавлено: 29 ноября 2024 г.
Статья посвящена исследованию корреляции эмоциональной тональности жеста с его локализацией путем проведения контент-анализа жестов, представленных в мультимедийном подкорпусе устного русского языка, проаннотированного Е.А.Гришиной и состоящего из видеофрагментов позднесоветсткого кинематографа. Целью статьи является определение превалирующей эмоциональной тональности жеста в зависимости от его телесной локализации. В рамках работы были проведены корпусный лингвистический анализ, сентимент-анализ и корреляционный анализ ...
Добавлено: 29 ноября 2024 г.
Gritsenko E.S, Kamou O.M., Russian Journal of Linguistics 2024 Vol. 28 No. 3 P. 615–632
Many studies addressing the differences in the use of lexical bundles in academic English by L1 and L2 writers interpret these differences as a deficiency or deviation that L2 writers need to eliminate. In this paper, we argue that this “deviant” use is not essentially the product of insufficient knowledge of English and/or Anglophone norms ...
Добавлено: 31 октября 2024 г.
Смирнова Е. А., Жанры речи 2026 Т. 21 № 1(49) С. 60–67
Статья посвящена количественному анализу использования средств снижения категоричности высказывания (хеджей) в корпусе научных статей по четырем точным (химия, физика, математика, машиностроение) и четырем гуманитарным (лингвистика, история, менеджмент, политология) наукам, объемом приблизительно 1,6 млн слов. Выдвигается гипотеза о том, что существуют значимые различия в употреблении хеджей между двумя группами дисциплин. Анализ основан на изучении 81 языковой ...
Добавлено: 26 октября 2024 г.
U. P. Strizhak, Russian Japanology Review 2024 Vol. 7 No. 1 P. 110–127
Добавлено: 16 августа 2024 г.
Аванесян Н. Л., Губина О. В., Чеповский А. М., Труды Института системного анализа Российской академии наук 2024 Т. 74 № 2 С. 25–32
Статья посвящена применению математических методов корпусного анализа для исследований литературных текстов русских писателей. Для исследований создан корпус прозаических текстов художественной литературы России XIX века, состоящий из пяти подкорпусов. Каждый подкорпус содержит тексты одного из авторов. На примере созданного корпуса продемонстрированы возможности применения метода анализа соответствий, интегрированного в корпусную платформу TXM в качестве одного из средств ...
Добавлено: 4 июля 2024 г.
Кирина М. А., Лукьянчикова А. С., В кн.: Русская и зарубежная филология в диалоге культур : материалы Всероссийской научно-практической конференции с международным участием (г. Ростов-на-Дону, 19–21 октября 2023 г.).: Издательство Южного федерального университета, 2024. С. 16–20.
Добавлено: 10 декабря 2023 г.
Фокина А. И., Чеповский А. А., Чеповский А. М., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2023 Т. 21 № 2 С. 29–38
При формировании графов взаимодействующих объектов, построенных при импорте данных из социальных
сетей и сетей мгновенного обмена сообщениями, в качестве атрибутов вершин выступают в том числе и тек-стовые данные. В настоящей работе авторы приводят описание методики исследования текстов, основанной на процедурах корпусного анализа. Целью данной статьи является проверка методологических средств, предо-ставляемых программным обеспечением TXM для сравнительного анализа текстов ...
Добавлено: 9 октября 2023 г.
Смирнова Е. А., Пермякова Т. М., Исмакаева И. Д., Вестник Томского государственного университета 2023 № 491 С. 40–48
В работе представлен анализ оценочной лексики в воспоминаниях переселенцев из разных частей Советского союза в Калининградскую область в период 1945–1950 гг. с использованием методов корпусной лингвистики и системно-функционального подхода. Исследование корпуса, основанное на модели анализа оценки (Appraisal Framework) Мартина и Уайта (2005), позволяет заключить, что процесс переселения и адаптации к новой жизни часто воспринимался переселенцами ...
Добавлено: 9 сентября 2023 г.
Асеева Я. О., Фокина А. И., В кн.: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием, Москва, РУДН, 17–21 апреля 2023 г.: М.: Российский университет дружбы народов, 2023. С. 290–294.
За последнее время число пользователей мессенджера Telegram во всем мире превысило 700 миллионов человек в ежемесячном измерении и продолжает расти каждый день. Telegram используется не только для обмена личными сообщениями, но он также стал ведущей площадкой политических, культурных и новостных каналов — альтернативы традиционным СМИ. Цель данной работы — исследовать выборку текстов, взятую из Telegram, ...
Добавлено: 8 июня 2023 г.
В управлении социальными системами организационная культура играет важную роль. Изучению организационной культуры посвящено большое количество исследований. Но проблематика организационной культуры в контексте проектно-ориентированного управления изучена в значительно меньшей степени, несмотря на высокую практическую значимость использования организационной культуры как одного из инструментов и элементов управления проектами. Еще больший дефицит обнаруживается в эмпирических исследованиях организационной культуры с ...
Добавлено: 30 августа 2019 г.
Лаврентьев А. М., Смирнов И. В., Соловьев Ф. Н. и др., Вопросы кибербезопасности 2019 № 4(32) С. 54–60
Цель исследования: разработка методики создания и автоматического анализа специальных корпусов текстов для последующего применения их в качестве обучающих выборок и определения дифференцирующих признаков в задачах классификации текстов.
Метод: применялись инструменты анализа корпусной платформы TXM, расширенной разработанными процедурами вычисления дополнительных характеристик текстов, таких как буквосочетания, псевдоосновы, именные группы, глагольные группы.
Полученные результаты: показано, что разработанные средства расширения ...
Добавлено: 10 августа 2019 г.
Лаврентьев А. М., Соловьев Ф. Н., Чеповский А. М., В кн.: Труды международной конференции "Корпусная лингвистика - 2019".: СПб.: Издательство Санкт-Петербургского университета, 2019. С. 55–62.
Представлен опыт расширения возможностей платформы TXM за счет инструментов автоматической обработки текста (выделение псевдооснов, именных групп, анализ глагольного управления). В сочетании со стандартными функциями TXM (факторный анализ соответствий, специфичность и т.д.) они позволяют более эффективно осуществлять анализ специализированных корпусов, нацеленных, в частности, на выявление противоправного дискурса. ...
Добавлено: 8 июля 2019 г.
Бочкарев А. Е., Вестник Санкт-Петербургского университета. Язык и литература 2019 Т. 16 № 1 С. 20–32
Предметом статьи является корпусное исследование чувства долга в плане концептуальной конфигурации в русском языковом сознании. Обращение к Национальному корпусу русского языка представляется в этой связи тем более оправданным, что содержание анализируемого концепта не представлено в «готовом виде» ни в одном из отдельно взятых контекстов употребления, а реконструируется из совокупности всех возможных употреблений. О специфичной конфигурации можно судить по дистрибутивным ...
Добавлено: 2 апреля 2019 г.