?
Анализ корпусов текстов террористической и антиправовой направленности
Вопросы кибербезопасности. 2019. № 4(32). С. 54-60.
Лаврентьев А. М., Соловьев Ф. Н., Chepovskiy A., В кн. : Труды международной конференции "Корпусная лингвистика - 2019". : СПб. : Издательство Санкт-Петербургского университета, 2019. С. 55-62.
Представлен опыт расширения возможностей платформы TXM за счет инструментов автоматической обработки текста (выделение псевдооснов, именных групп, анализ глагольного управления). В сочетании со стандартными функциями TXM (факторный анализ соответствий, специфичность и т.д.) они позволяют более эффективно осуществлять анализ специализированных корпусов, нацеленных, в частности, на выявление противоправного дискурса. ...
Added: July 8, 2019
Fokina A., Chepovskiy A., Chepovskiy A., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2023 Т. 21 № 2 С. 29-38
When forming graphs of interacting objects built when importing data from social networks and instant messaging
networks, text data also act as vertex attributes. In this paper, the authors describe a text research methodology based on corpus analysis procedures. The purpose of this article is to test the methodological tools provided by the TXM software for the ...
Added: October 9, 2023
Лаврентьев А. М., Соловьев Ф. Н., Суворова М. И. et al., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2018 Т. 16 № 3 С. 19-31
ПлатформаTXM предоставляет широкие возможности корпусного анализа, такие как анализ соответствий,
кластеризация, построение лексических таблиц, поиск сложных лексических конструкций, выделение подкорпу-сов по различным параметрам. По умолчанию платформа работает со словоупотреблениями в качестве структур-ных единиц анализа. Она интегрирована с единственным расширениемTreeTagger, позволяющим проводить лишь морфологический анализ и лемматизацию словоупотреблений. Однако пользователь может сопроводить каждое словоупотребление набором дополнительных характеристик, ...
Added: September 8, 2018
СПб. : Издательство Санкт-Петербургского университета, 2019
Сборние содержит материалы докладов, представленных на Международной научной конференции "Корпусная лингвистика-2019" 24-28 июня 2019 г. в Санкт-Петербурге. ...
Added: July 8, 2019
Аванесян Н. Л., Соловьев Ф. Н., Chepovskiy A., Вестник Новосибирского государственного университета. Серия: Информационные технологии 2021 Т. 19 № 1 С. 5-14
In this paper the authors describe the methodology for the statistical analysis of texts in social networks based on comparison of automatically generated frequency dictionaries by methods of correlation analysis. Psycholinguistic characteristics and coefficients of pairwise rank correlation are considered for comparing the frequency characteristics of texts in natural language ...
Added: April 14, 2021
Arkhangelskiy T., Гильмуллин Р. А., Невзорова О. А. et al., Научно-техническая информация. Серия 2: Информационные процессы и системы 2013
В статье описывается электронный корпус татарского языка, созданный в рамках программы фундаментальных исследований Президиума РАН "Корпусная лингвистика", и методы, использованные авторами для создания этого корпуса. В частности, описываются текстовый состав и жанровая структура корпуса, принятые авторами решения о выделении морфологических характеристик, автоматическая морфологическая разметка текстов с помощью двухуровневой модели морфологии и анализатора PC-KIMMO и размещение ...
Added: October 25, 2013
Аванесян Н. Л., Соловьев Ф. Н., Тихомирова Е. А. et al., Вопросы кибербезопасности 2020 № 4(38) С. 76-84
Разработана методика частотного анализа лексики противоправных текстов, которая позволяет по частотным словарям сравнивать различные наборы текстов и выявлять дифференцирую-шие признаки; приведена методика вычисления коэффициента попарной ранговой корреляции для сравнения
частотных словарей различных лексических характеристик; проведен сравнительный анализ различных по те-матике коллекций текстов противоправной направленности; показана возможность использования частотных лексических характеристик для исследования свойств текстов с целью ...
Added: December 4, 2020
Voznesenskaya T., Леднов Д. А., Машинное обучение и анализ данных 2018 Т. 4 № 4 С. 266-279
This paper is toward the system of automatic text summarization developed by «DC – Systems» company in cooperation with the faculty of computer science at HSE. The summary is a concise description of the text in terms of its content and meaning, i.e. from the point of view of its semantics. The purpose of the ...
Added: October 5, 2018
Marseille : Association pour le Traitement Automatique des Langues, 2014
Dans la suite du premier atelier TALAf qui s'est tenu le 8 juin 2012 à Grenoble, lors de la conférence JEP-TALN-RECITAL 2012 (voir les actes : http://aclweb.org/anthology//W/W12/#1300), nous proposons une nouvelle édition de cet atelier lors de la conférence TALN 2014 le premier juillet à Marseille.
Cette deuxième édition montre l'intérêt d'un atelier francophone sur le traitement ...
Added: March 26, 2015
Lavrentiev A. M., Sherstinova T., Chepovskiy A. et al., Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya 2021 Vol. 70 P. 69-89
The purpose of this paper is to test the methodological tools provided by TXM platform for research on dynamics of vocabulary and punctuation marks in diachronic corpora. TXM is a powerful text analysis software which provides both quantitative and qualitative features in a transparent open-source implementation. In this paper, we demonstrate how it can be ...
Added: June 24, 2021
Асеева Я. О., Fokina A., В кн. : Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием, Москва, РУДН, 17–21 апреля 2023 г. : М. : Российский университет дружбы народов, 2023. С. 290-294.
Recently, the number of Telegram messenger users worldwide has exceeded 700 million people in monthly terms and continues to grow every day. Telegram is used not only to exchange personal messages, but it has also become a leading platform for political, cultural and news channels — an alternative to traditional media. The purpose of this ...
Added: June 8, 2023
Bonch-Osmolovskaya A. A., Компьютерная лингвистика и интеллектуальные технологии 2015 Т. 1 № 14(21) С. 80-95
The paper proposes new approaches to the problem of Russian dative subjects in predicative and adjective constructions. The core idea of the research is to study the distribution of dative subject constructions with predicative and adjective forms that potentially can be used in such constructions. The methodological novelty of the approach is manifested in the ...
Added: April 15, 2015
M. : Russian State University for the Humanitie, 2019
The book includes 64 papers submitted to the International conference in computer linguistics and intellectual technologies Dialogue 2019 and presents a broad spectrum of theoretical and applied research of natural language description, language simulation, and creation of applied computer technologies. ...
Added: October 16, 2019
Издательство Санкт-Петербургского государственного университета, 2019
Сборник содержит материалы докладов, представленных на Международной научной конференции «Корпусная лингвистика-2019» 24–28 июня 2019 г. в Санкт-Петербурге. Создание корпусов текстов является одним из приоритетных направлений в современной лингвистике. Проведение конференции по данной тематике знакомит ученых с современными разработками и новыми технологическими решениями в этой области, а также способствует обобщению опыта научных исследований по корпусной лингвистике. ...
Added: November 1, 2020
М. : Изд-во РГГУ, 2017
The 16th issue of the annual report “Computational Linguistics and Intellectual Technologies” contains the selected materials of the 23rd international conference “Dialogue”. The presented works reflect the areas of research in computational modelling and analysis of natural language that are traditionally represented at the conference. ...
Added: March 15, 2017
Болховитянов А. В., Chepovskiy A., Информационные технологии 2012 № 2 С. 25-29
In this paper, we propose two mathematical models intended for analyzing the russian sentence to detect noun phrases and participial clauses. Algorithm for participial clause identification is based on the concept of syntactic relation between verb and dependent syntactic units in the russian language. Considered algorithms designed on the basis of the proposed models can ...
Added: September 6, 2012
Sibirtseva V., Khomenko A., Baranova J., Образовательные технологии и общество 2013 Т. 16 № 3 С. 508-521
The article reports about the students and teachers research group of National Research University Higher School of Economics entitled "Corplingui (Nizhny Novgorod-Moscow)"development. This work is about the research in the field of computer and corpus linguistics. Development primarily focuses on the creation of interactive resources based on the materials of The Russian National Corpus. The ...
Added: October 4, 2013
Пономарева М. А., Дроганова К. А., Smurov I. et al., Florence : Association for Computational Linguistics, 2019
This paper provides a comprehensive overview of the gapping dataset for Russian that consists of 7.5k sentences with gapping (as well as 15k relevant negative sentences) and comprises data from various genres: news, fiction, social media and technical texts. The dataset was prepared for the Automatic Gapping Resolution Shared Task for Russian (AGRR-2019) - a ...
Added: September 5, 2019
Скифия-принт, 2021
Сборник содержит материалы докладов, представленных на Международной научной конференции «Корпусная лингвистика-2021» 1–3 июля 2021 г. в Санкт-Петербурге. ...
Added: October 31, 2021
M. : Russian State University for the Humanitie, 2015
Added: April 28, 2015
Kitov V. V., Научные труды Вольного экономического общества России 2014 Т. 186 С. 228-235
This paper describes the application of well-known «transformation-based learning» algorithm of automatic rule generation for the task of part-of-speech tagging. Algorithm is applied to corpora of annotated Russian texts and accuracy as well as most significant rules are shown. ...
Added: March 16, 2016
Politsyna E., Балакирев Н. Е., Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии 2013 № 1 С. 162-168
The article reveals the necessity of creating new user-level text analysis tools which
should provide facilities for the open text analysis system for extending its functionality by users.
The article shows details of the open text analysis system and used text analyses approaches which
it is based on. A script language is suggested as an expandable tool for ...
Added: November 5, 2015
Matkin N. A., Культура и технологии 2021 Т. 6 № 1 С. 26-32
There were a lot of changes during 2019 and 2020 in Perm such as transport reform, zoo construction, change of governor and mayor. All changes reflect on the image of the city, which is constructing in the residents’ mind. From one hand the image of the city is formed by media, on the other hand ...
Added: October 23, 2021
Аванесян Н. Л., Зенькова В. В., Chepovskiy A. et al., Успехи кибернетики 2023 Т. 4 № 2 С. 33-39
In this paper the authors describe the methodology for the statistical analysis of texts in the network of Telegram channels based on comparison of automatically generated frequency dictionaries by methods of correlation analysis. Coefficients of pairwise rank correlation are considered for comparing the frequency characteristics of texts in natural language. The method is proposed to ...
Added: July 19, 2023