?
Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных
.
Максименко П. И.
The work examines the popular phenomenon of mass amateur online literature - fan fiction. The creation of an electronic database is described, which includes more than 135 thousand texts posted on the largest Russian-language fan fiction resource “Fan Fiction Book” (ficbook.net). Quantitative analysis of metadata included in the electronic database allows us to explore the phenomenon of fan fiction in the Russian-speaking environment and identify its significant features.
In book
Сибирский федеральный университет, 2023.
Кульков А. Н., Tsvetkova M. V., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Added: May 10, 2026
Чурбанов Р. Р., Правовая информатика 2025 № 3 С. 79–89
The article describes an integrated solution for automated collection of detailed data on apartment listings in the primary and secondary housing markets of Moscow and their analytical processing. The solution combines web scraping tools (parsing HTML code of real estate websites using Python) with a data warehouse based on Microsoft SQL Server and an interactive ...
Added: August 28, 2025
F. M. Grozovskiy, I. V. Loginova, Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 4 P. 269–278
The paper proposes an approach to the automated extraction and structuring of information from
text, combining web scraping for data collection from online sources with a large language model for subsequent
data mining. As a case study, texts from news publications on technology readiness levels from the
CNews website were chosen to test the developed methodology in a ...
Added: August 25, 2025
Grozovskiy F., Loginova I., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 8 С. 27–36
Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической ...
Added: August 11, 2025
Darina Valiakhmetova, Diana Shchelkanova, Oxana Mikhaylova, Transformative Works and Cultures 2025 Vol. 46
This study investigates the motives and reading practices of fanfiction among female university students aged 18–25 in Moscow, utilizing a quantitative survey of 178 participants. The research examines socio-demographic characteristics, reading habits, and motivational drivers, offering an expanded classification of motives informed by existing literature and participant responses. Key motives include fandom engagement, hobby and ...
Added: June 19, 2025
Zhuchkova S., Девятников В. Ю., Kazun A. et al., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 2 С. 170–192
The development of empirical legal studies in Russia is restricted by the lack of sources of disaggregated data on law enforcement available to social researchers. One of the potential sources of such data, which is still insufficiently used in Russian research, is the publicly available texts of court verdicts, in particular court sentences. This article ...
Added: May 8, 2025
Максименко П. И., В кн.: «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность : материалы научной конференции молодых ученых.: Иркутск: Издательство ИГУ, 2024. С. 89–95.
Описываются результаты применения сентимент-анализа к текстам, вхо-дящим в русскоязычную электронную базу фанфикшн, которая включает в себя более 135 тыс. работ, опубликованных на специализированном ресурсе «Книга Фанфиков» (ficbook.net). Дан-ные, полученные в результате применения моделей анализа тональности RuBERT и Dostoevsky, сопоставляются с метаданными о текстах, входящих в базу, в частности с информацией о тематических тегах, присвоенных работам ...
Added: November 29, 2024
Валиахметова Д. Р., Щелканова Д. В., Mikhaylova O., В кн.: Подросток в мегаполисе: поиск вопросов и ответов. Сборник трудов XVI международной научно-практической конференции.: Национальный исследовательский университет "Высшая школа экономики", 2023. С. 25–28.
Added: April 16, 2023
СПб.: Институт русской литературы (Пушкинский Дом) РАН, 2023.
Репозиторий открытых данных по русской литературе и фольклору — это ресурс для хранения и публикации научных данных, которые авторы предоставляют в свободный доступ другим исследователям. Задачи репозитория — повысить видимость и доступность данных, способствовать расширению количественных исследований в литературоведении и поддерживать культуру цитирования данных. Объявления о новых публикациях — в блоге репозитория.
Публикуемые в репозитории данные ...
Added: February 17, 2023
Новикова А. В., Mylnikov L., Научно-техническая информация. Серия 2: Информационные процессы и системы 2017 Т. 15 № 9 С. 26–36
В статье рассмотрены практические аспекты, связанные с проблемой искажения смыслов при переводе с одного языка общения на другой с использованием существующих систем машинного перевода и лежащего в их основе подхода, основанного на пословномпереводе, на примере текстов деловой коммуникации. Следуя основному положению теории «смысл-текст» применительно к машинному переводу о том, что переход от смыслов к текстам и обратно осуществляется за счет моделирования языковых познаний говорящих, лежащих в основе актов речевого общения, авторы предлагают комплексный функциональный метод ...
Added: February 1, 2023
Mamedli M., Умнов А. В., Вопросы экономики 2022 № 12 С. 118–136
The paper considers the application of the web scrapping and machine learning algorithms for the assessment of the real estate price on the secondary housing market in Moscow. For this, we collect and process the data from the CIAN website and the data from “Reforma GKH”. To evaluate real estate objects, we consider such machine ...
Added: January 11, 2023
Mamay E., International Journal of Open Information Technologies 2022 Т. 10 № 11 С. 87–104
The article discusses the use of digital technologies in law enforcement through the prism of the balance of public and private interests. The author analyses the system of legal regulation, studies the normative legal acts regulating digital relations and the use of information and communication technologies. Empirical ground of the study constitutes of more than ...
Added: November 3, 2022
Zhuchkova S., Линделл Д., Мониторинг общественного мнения: Экономические и социальные перемены 2022 № 5 С. 347–372
The paper pilots a new approach to measuring the communicative capacity of nonprofit organizations’ (NGOs) websites. The analysis relies on technical data of nearly 10,000 Russian NGOs websites collected nonreactively using web scraping. The communicative capacity is measured following Michael L. Kent and Maureen Taylor’s model, according to which a site should have a simple ...
Added: July 8, 2022
Romanenko K., Философия. Журнал Высшей школы экономики 2022 Т. 6 № 2 С. 166–188
To understand the transformation of canons and the struggle with them, we may productively explore fanfiction, a particular reader’s, viewer’s, and author’s practice, within non-professional and non-commercial texts based on the plots and heroes of other people’s works. Fanfiction is a paradoxical phenomenon: it is wholly based on a specific canon— collectively selected film and ...
Added: July 1, 2022
Scherbakova A., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
The paper focuses on the task of clustering essays produced by ESL (English as a Second Language) learners. The data was taken from a learner corpus REALEC. The division of texts by certain characteristics can be useful to speed up the analysis of a single corpus or access to the necessary sections of a large ...
Added: September 30, 2021
Bessonov V. A., Вопросы статистики 2021 Т. 28 № 4 С. 5–22
The article discusses two groups of problems in Russian statistics that still have no viable solutions. The first one - the state of the statistics interface – is the set of channels through which users obtain statistical information. The second – metadata status – is the information on how the indicators are constructed. The ...
Added: September 14, 2021