• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • HSE University
  • Publications
  • Book chapter
  • Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Priority areas
  • business informatics
  • economics
  • engineering science
  • humanitarian
  • IT and mathematics
  • law
  • management
  • mathematics
  • sociology
  • state and public administration
by year
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • More
Subject
News
June 5, 2026
Neural Network Maps as a Method for Constructing Mathematical Models
Scientists from HSE University–Nizhny Novgorod and the Institute of Physics Belgrade, Serbia, are jointly exploring the application of machine learning techniques and neural networks to the study of nonlinear dynamics. Natalya Stankevich, Leading Research Fellow at the Laboratory of Topological Methods in Dynamics of the Faculty of Informatics, Mathematics, and Computer Science at HSE University–Nizhny Novgorod, spoke to the HSE News Service about this international project.
June 5, 2026
‘In the Age of Technology, It Is Interesting to Look into the Past and Think about What We Can Take from It
Polina Tabakova decided to apply for a Philology degree at HSE in Nizhny Novgorod because she grew up in Mari El and did not want to move far away from the Russian forests. In an interview for the Young Scientists of HSE University project, she spoke about the genre of the campus novel, the existential drama of Kolobok, and a blackout version of Eugene Onegin.
June 5, 2026
HSE Scientists Develop Method to Compress Large Language Models Without Losing Quality
Researchers from the AI and Digital Science Institute at the HSE Faculty of Computer Science have developed a new compression method for large language models such as GPT and LLaMA that reduces their size by 25–36% without additional training or significant loss of accuracy. This is the first approach to use mathematical transformations—specifically, rotations of model weights—to make models more amenable to compression with structured matrices. The study results have been published in ACL Findings 2025. The code is available on GitHub.

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!

Publications
  • Books
  • Articles
  • Chapters of books
  • Working papers
  • Report a publication
  • Research at HSE

?

Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных

.
Максименко П. И.

The work examines the popular phenomenon of mass amateur online literature - fan fiction. The creation of an electronic database is described, which includes more than 135 thousand texts posted on the largest Russian-language fan fiction resource “Fan Fiction Book” (ficbook.net). Quantitative analysis of metadata included in the electronic database allows us to explore the phenomenon of fan fiction in the Russian-speaking environment and identify its significant features.

Language: Russian
Full text
Keywords: метаданныеmetadataфанфикшнweb scrapingвеб-скрейпингэлектронная база данныхelectronic databaseFanfiction
Publication based on the results of:
Текст как Big Data: моделирование конвергентных процессов в языке и речи цифровыми методами (2023)

In book

Информационные технологии в гуманитарных исследованиях: Материалы Международной научно-практической конференции, Красноярск, 25–28 сентября 2023 г.
Сибирский федеральный университет, 2023.
Similar publications
«Плоский мир» Т. Пратчетта глазами русскоязычного фандома
Кульков А. Н., Tsvetkova M. V., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Added: May 10, 2026
АВТОМАТИЗАЦИЯ СБОРА ДАННЫХ С САЙТОВ НЕДВИЖИМОСТИ И АНАЛИЗ МОСКОВСКОГО РЫНКА ЖИЛЬЯ С ИСПОЛЬЗОВАНИЕМ ЛОКАЛЬНОЙ СРЕДНЕЙ ЦЕНЫ КВАДРАТНОГО МЕТРА
Чурбанов Р. Р., Правовая информатика 2025 № 3 С. 79–89
The article describes an integrated solution for automated collection of detailed data on apartment listings in the primary and secondary housing markets of Moscow and their analytical processing. The solution combines web scraping tools (parsing HTML code of real estate websites using Python) with a data warehouse based on Microsoft SQL Server and an interactive ...
Added: August 28, 2025
Developing an Approach for Automated Data Collection and Mining Using Web Scraping Techniques and Large Language Models: A Case Study on Extracting Technology Readiness Level Assessments
F. M. Grozovskiy, I. V. Loginova, Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 4 P. 269–278
The paper proposes an approach to the automated extraction and structuring of information from text, combining web scraping for data collection from online sources with a large language model for subsequent data mining. As a case study, texts from news publications on technology readiness levels from the CNews website were chosen to test the developed methodology in a ...
Added: August 25, 2025
О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
Grozovskiy F., Loginova I., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 8 С. 27–36
Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической ...
Added: August 11, 2025
Young women and fan fiction: Motives, reading practices, and reader types
Darina Valiakhmetova, Diana Shchelkanova, Oxana Mikhaylova, Transformative Works and Cultures 2025 Vol. 46
This study investigates the motives and reading practices of fanfiction among female university students aged 18–25 in Moscow, utilizing a quantitative survey of 178 participants. The research examines socio-demographic characteristics, reading habits, and motivational drivers, offering an expanded classification of motives informed by existing literature and participant responses. Key motives include fandom engagement, hobby and ...
Added: June 19, 2025
Тексты судебных приговоров как источник данных для эмпирических исследований права в России
Zhuchkova S., Девятников В. Ю., Kazun A. et al., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 2 С. 170–192
The development of empirical legal studies in Russia is restricted by the lack of sources of disaggregated data on law enforcement available to social researchers. One of the potential sources of such data, which is still insufficiently used in Russian research, is the publicly available texts of court verdicts, in particular court sentences. This article ...
Added: May 8, 2025
Калейдоскоп чувств: исследование эмоциональности любительской массовой литературы (на материале русскоязычной электронной базы фанфикшн)
Максименко П. И., В кн.: «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность : материалы научной конференции молодых ученых.: Иркутск: Издательство ИГУ, 2024. С. 89–95.
Описываются результаты применения сентимент-анализа к текстам, вхо-дящим в русскоязычную электронную базу фанфикшн, которая включает в себя более 135 тыс. работ, опубликованных на специализированном ресурсе «Книга Фанфиков» (ficbook.net). Дан-ные, полученные в результате применения моделей анализа тональности RuBERT и Dostoevsky, сопоставляются с метаданными о текстах, входящих в базу, в частности с информацией о тематических тегах, присвоенных работам ...
Added: November 29, 2024
Пилотный анализ мотивов чтения фанфикшн-литературы среди московской студенческой молодежи
Валиахметова Д. Р., Щелканова Д. В., Mikhaylova O., В кн.: Подросток в мегаполисе: поиск вопросов и ответов. Сборник трудов XVI международной научно-практической конференции.: Национальный исследовательский университет "Высшая школа экономики", 2023. С. 25–28.
Added: April 16, 2023
Репозиторий открытых данных по русской литературе и фольклору
СПб.: Институт русской литературы (Пушкинский Дом) РАН, 2023.
Репозиторий открытых данных по русской литературе и фольклору — это ресурс для хранения и публикации научных данных, которые авторы предоставляют в свободный доступ другим исследователям. Задачи репозитория — повысить видимость и доступность данных, способствовать расширению количественных исследований в литературоведении и поддерживать культуру цитирования данных. Объявления о новых публикациях — в блоге репозитория. Публикуемые в репозитории данные ...
Added: February 17, 2023
Вопросы реализации машинного перевода текстов деловой коммуникации для языковой пары «русский язык - английский язык»
Новикова А. В., Mylnikov L., Научно-техническая информация. Серия 2: Информационные процессы и системы 2017 Т. 15 № 9 С. 26–36
В статье рассмотрены практические аспекты, связанные с проблемой искажения смыслов при переводе с одного языка общения на другой с использованием существующих систем машинного перевода и лежащего в их основе подхода, основанного на пословномпереводе, на примере текстов деловой коммуникации. Следуя основному положению теории «смысл-текст» применительно к машинному переводу о том, что переход от смыслов к текстам и обратно осуществляется за счет моделирования языковых познаний говорящих, лежащих в основе актов речевого общения, авторы предлагают комплексный функциональный метод ...
Added: February 1, 2023
Оценка стоимости недвижимости на основе больших данных
Mamedli M., Умнов А. В., Вопросы экономики 2022 № 12 С. 118–136
The paper considers the application of the web scrapping and machine learning algorithms for the assessment of the real estate price on the secondary housing market in Moscow. For this, we collect and process the data from the CIAN website and the data from “Reforma GKH”. To evaluate real estate objects, we consider such machine ...
Added: January 11, 2023
Цифровые технологии в правоохранительной деятельности: критерии правомерного сочетания публичных и частных интересов
Mamay E., International Journal of Open Information Technologies 2022 Т. 10 № 11 С. 87–104
The article discusses the use of digital technologies in law enforcement through the prism of the balance of public and private interests. The author analyses the system of legal regulation, studies the normative legal acts regulating digital relations and the use of information and communication technologies. Empirical ground of the study constitutes of more than ...
Added: November 3, 2022
Оценка коммуникативного потенциала сайтов российских НКО на основе анализа нереактивных данных
Zhuchkova S., Линделл Д., Мониторинг общественного мнения: Экономические и социальные перемены 2022 № 5 С. 347–372
The paper pilots a new ap­proach to measuring the communica­tive capacity of non­profit organizations’ (NGOs) websites. The analysis relies on technical data of nearly 10,000 Russian NGOs websites collected non­reactively using web scraping. The communicative capacity is measured following Michael L. Kent and Maureen Taylor’s model, according to which a site should have a simple ...
Added: July 8, 2022
Трансформация канона, борьба с каноном, пересоздание канона как основания культуры фанфикшна
Romanenko K., Философия. Журнал Высшей школы экономики 2022 Т. 6 № 2 С. 166–188
To understand the transformation of canons and the struggle with them, we may productively explore fanfiction, a particular reader’s, viewer’s, and author’s practice, within non-professional and non-commercial texts based on the plots and heroes of other people’s works. Fanfiction is a paradoxical phenomenon: it is wholly based on a specific canon— collectively selected film and ...
Added: July 1, 2022
Кластеризация данных, извлечение ключевых слов и лексическое разнообразие в текстах эссе учебного корпуса
Scherbakova A., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
The paper focuses on the task of clustering essays produced by ESL (English as a Second Language) learners. The data was taken from a learner corpus REALEC. The division of texts by certain characteristics can be useful to speed up the analysis of a single corpus or access to the necessary sections of a large ...
Added: September 30, 2021
Две проблемы российской статистики: взгляд пользователя
Bessonov V. A., Вопросы статистики 2021 Т. 28 № 4 С. 5–22
The article discusses two groups of problems in Russian statistics that still have no viable solutions. The first one - the state of the statistics interface – is the set of channels through which users obtain statistical information. The second – metadata status – is the information on how the indicators are constructed. The ...
Added: September 14, 2021
  • About
  • About
  • Key Figures & Facts
  • Sustainability at HSE University
  • Faculties & Departments
  • International Partnerships
  • Faculty & Staff
  • HSE Buildings
  • HSE University for Persons with Disabilities
  • Public Enquiries
  • Studies
  • Admissions
  • Programme Catalogue
  • Undergraduate
  • Graduate
  • Exchange Programmes
  • Summer University
  • Summer Schools
  • Semester in Moscow
  • Business Internship
  • Research
  • International Laboratories
  • Research Centres
  • Research Projects
  • Monitoring Studies
  • Conferences & Seminars
  • Academic Jobs
  • Yasin (April) International Academic Conference on Economic and Social Development
  • Media & Resources
  • Publications by staff
  • HSE Journals
  • Publishing House
  • iq.hse.ru: commentary by HSE experts
  • Library
  • Economic & Social Data Archive
  • Video
  • HSE Repository of Socio-Economic Information
  • HSE1993–2026
  • Contacts
  • Copyright
  • Privacy Policy
  • Site Map
Edit