?
Single-sentence Readability Prediction in Russian
Ch. 436. P. 91-100.
Karpov N., Vitugin F., Baranova J.
In an effort to make reading more accessible, an automated readability formula can help students to retrieve appropriate material for their language level. This study attempts to discover and analyze a set of possible features that can be used for single-sentence readability prediction in Russian. We test the influence of syntactic features on predictability of structural complexity. The readability of sentences from SynTagRus corpus was marked up manually and used for evaluation.
Keywords: компьютерная лингвистикаНациональный корпус русского языкаnational corpus of Russian languagemachine learningмашинное обучение и разработка данных (data mining)computational linguistics
Publication based on the results of:
In book
Vol. 436: 3rd International Conference on Analysis of Images, Social networks, and Texts. , NY : Springer, 2014
Bonch-Osmolovskaya A. A., Вопросы языкознания 2016 № 2 С. 100-120
Статья посвящена обзору работ последних лет, в которых теоретическая исследовательская задача решается с помощью методов или инструментов, используемых в компьютерной лингвистике. В обзоре проводится подробный анализ того, как именно с помощью применения того или иного инструмента или метода можно получить новые знания о природе языка. В частности, выделяются два основных направления, развитие которых в рамках ...
Added: April 14, 2015
Smetanin S., , in : Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.). Issue 19(26): дополнительный том.: -, 2020. P. 1149-1159.
Added: November 30, 2020
Сергей Кузнецов, Денис Турдаков, Коршунов А. В. et al., Труды Института системного программирования РАН 2014 Т. 26 № 1 С. 439-456
В статье описаны основные компоненты разработанного в ИСП РАН стека технологий для анализа пользовательских данных из социальных сетей. Особое внимание уделяется задачам, методам и приложениям анализа сетевых (социальные связи между пользователями) и текстовых (сообщения и профили пользователей) данных: определение демографических атрибутов пользователей, поиск описаний событий в корпусах сообщений, идентификация пользователей различных сетей, поиск сообществ пользователей ...
Added: November 25, 2017
Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. et al., Труды Института системного программирования РАН 2014 Т. 26 С. 421-438
he paper presents a framework for fast text analytics developed during the Texterra project. Texterra is a technology for multilingual text mining based on novel text processing methods that exploit knowledge extracted from user-generated content. It delivers a fast scalable solution for text mining without the expensive customization. Depending on use-cases Texterra could be utilized ...
Added: November 6, 2017
Sibirtseva V., Khomenko A., Baranova J., Образовательные технологии и общество 2013 Т. 16 № 3 С. 508-521
The article reports about the students and teachers research group of National Research University Higher School of Economics entitled "Corplingui (Nizhny Novgorod-Moscow)"development. This work is about the research in the field of computer and corpus linguistics. Development primarily focuses on the creation of interactive resources based on the materials of The Russian National Corpus. The ...
Added: October 4, 2013
Toldova S., Lyashevskaya O., Вопросы языкознания 2014 № 1 С. 120-145
This paper is an overview of the current issues and tendencies in Computational linguistics. The overview is based on the materials of the conference on computational linguistics COLING’2012. The modern approaches to the traditional NLP domains such as pos-tagging, syntactic parsing, machine translation are discussed. The highlights of automated information extraction, such as fact extraction, ...
Added: October 15, 2013
Bonch-Osmolovskaya A. A., В кн. : Современный русский язык в Интернете. : М. : Языки славянских культур, 2014. Гл. 4. С. 297-310.
В статье анализируется специфика морфосинтаксических конструкций, используемых в общедоступных поисковых системах, в частности рассматривается проблема рассогласования внутри именных групп. ...
Added: September 12, 2014
Kolmogorova A., Terra Linguistica 2023 Т. 14 № 1 С. 7-10
The publication is devoted to the analysis of the current state of engineering linguistics, its main directions and research challenges. The definition of language technologies and their typology are formulated according to the criterion of the tasks solved with their help. It is noted that the national school of engineering linguistics manages to maintain a ...
Added: October 31, 2023
Kuzmina A., Лифшиц М. А., Kostenko V., Современная зарубежная психология 2022 Т. 11 № 1 С. 104-115
The use of modern methods of computational linguistics in psychological research opens up new possibilities both for the study of personality and language and for the development of psychodiagnostics methods. This article discusses the main possible directions of such research, as well as non-obvious nuances that are important in their planning. Maximum use of the ...
Added: April 18, 2022
Kirina M., Человек: образ и сущность. Гуманитарные аспекты 2023
The article focuses on the application of opinion mining techniques to evaluate user experience on the Hyperskill educational platform, using Python, Java, and Kotlin programming projects as the basis of analysis. The study utilizes sentiment analysis and keyword extraction methods to gauge users' attitudes towards the platform, learning process, and topics covered. To achieve this, ...
Added: December 9, 2023
Association for Computational Linguistics, 2014
Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics held 26–30 April 2014 in Gothenburg, Sweden. ...
Added: October 24, 2013
[б.и.], 2023
Сборник включает 54 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2023», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Added: August 26, 2023
Montpellier : AVL Diffusion, 2011
The book contains the proceedigs of the 18th International Conference on Automatic Processing of Natural Langage (France, Montpellie, 27th June - 1st July 2011). ...
Added: March 22, 2013
Valletta : ELRA, 2010
Added: December 17, 2012
Рысаков С. В., Системный администратор 2015 № 10(155) С. 92-95
The article provides a review of modern methods of morphological ambiguity resolution. We considered such methods as statistical disambiguation, Brill’s automatically generated rules, decision trees and their modifications. For the comparison, the article provides numerical results obtained on two open corpora: OpenCorpora and SynTagRus. ...
Added: November 25, 2015
S.D. Kuznetsov, D.Yu. Turdakov, Астраханцев Н. А. et al., Programming and Computer Software 2014 Vol. 40 No. 5 P. 288-295
A framework for fast text analysis, which is developed as a part of the Texterra project, is described. Texterra provides a scalable solution for the fast text processing on the basis of novel methods that exploit knowledge extracted from the Web and text documents. For the developed tools, details of the project, use cases, and ...
Added: November 26, 2017
М. : Изд-во РГГУ, 2020
Papers from the Annual International Conference “Dialogue” (2020). Issue 19 ...
Added: June 26, 2020
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
The book includes 64 papers submitted to the International conference in computer linguistics and intellectual technologies Dialogue 2019 and presents a broad spectrum of theoretical and applied research of natural language description, language simulation, and creation of applied computer technologies. ...
Added: October 16, 2019
M. : Russian State University for the Humanitie, 2015
Added: April 28, 2015
Богданова-Бегларян Н. В., Blinova O. V., Sherstinova T. et al., В кн. : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 16–19 июня 2021 г.). Issue 20.: Russian State University for the Humanitie, 2021. С. 119-126.
Added: October 31, 2021
Tagiew R., Ignatov D. I., Amroush F., , in : 2013 IEEE 13th International Conference on Data Mining Workshops. : Los Alamitos : IEEE Computer Society, 2013. P. 445-451.
In this paper, we want to introduce experimental economics to the field of data mining and vice versa. It continues related work on mining deterministic behavior rules of human subjects in data gathered from experiments. Game-theoretic predictions partially fail to work with this data. Equilibria also known as game-theoretic predictions solely succeed with experienced subjects ...
Added: June 9, 2014
Smetanin S., IEEE Access 2020 Vol. 8 P. 110693-110719
Sentiment analysis has become a powerful tool in processing and analysing expressed opinions on a large scale. While the application of sentiment analysis on English-language content has been widely examined, the applications on the Russian language remains not as well-studied. In this survey, we comprehensively reviewed the applications of sentiment analysis of Russian-language content and ...
Added: June 24, 2020
[б.и.], 2020
Доклады студенческой сессии. ...
Added: September 16, 2020
M. : ., 2020
Дополнительный том включает доклады Международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2020», не вошедших в основной сборник. Доклады представляют широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий.
Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Added: July 3, 2020