• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
2 июня 2026 г.
Человеческий капитал перевешивает социальный: исследование факторов трудовой мобильности в России
Образование и здоровье оказываются важнее связей, блата и знакомств для мобильности российских работников на рынке труда. К такому выводу пришли ученые НИУ ВШЭ, проанализировав данные лонгитюдного обследования домохозяйств «Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ» (РМЭЗ НИУ ВШЭ) за 2016–2019 годы. Главный фактор, который влияет на карьерную мобильность россиян, — получение высшего образования и улучшение самооценки здоровья.
1 июня 2026 г.
Ученые ВШЭ объяснили, как эмоции человека влияют на отношение к цифровому государству
Сегодня взаимодействие человека с государством все чаще происходит через цифровые платформы: порталы госуслуг, электронные сервисы, системы на основе искусственного интеллекта и алгоритмы принятия решений. Однако до сих пор такие технологии в основном рассматривались как технические инструменты, эффективность которых оценивают по скорости работы и удобству интерфейсов. Авторы нового исследования предлагают смотреть на цифровое управление шире — как на эмоциональный опыт, который напрямую влияет на доверие граждан к государству.
28 мая 2026 г.
«Мне нравятся самосбывающиеся пророчества»
Андрей Ворчик изучает счастье, читает научпоп-лекции и хочет, чтобы наука занималась в том числе общественными проблемами. В интервью проекту «Молодые ученые Вышки» он рассказал о том, как эмоции влияют на принятие решений, Бермудском треугольнике из ванной, холодильника и кровати и идеальной формуле образования.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных

.
Максименко П. И.

В работе рассматривается популярный феномен массовой любительской сетевой литературы — фанфикшн. Описывается создание электронной базы, включающей в себя более 135 тыс. текстов, размещенных на крупнейшем русскоязычном фанфикшн-ресурсе «Книга Фанфиков» (ficbook.net). Квантитативный анализ метаданных, входящих в электронную базу, позволяет исследовать явление фанфикшн в русскоязычной среде и выявить его значимые особенности.

Язык: русский
Полный текст
Ключевые слова: метаданныеmetadataфанфикшнweb scrapingвеб-скрейпингэлектронная база данныхelectronic databaseFanfiction
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Текст как Big Data: моделирование конвергентных процессов в языке и речи цифровыми методами (2023)

В книге

Информационные технологии в гуманитарных исследованиях: Материалы Международной научно-практической конференции, Красноярск, 25–28 сентября 2023 г.
Сибирский федеральный университет, 2023.
Похожие публикации
«Плоский мир» Т. Пратчетта глазами русскоязычного фандома
Кульков А. Н., Цветкова М. В., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Добавлено: 10 мая 2026 г.
АВТОМАТИЗАЦИЯ СБОРА ДАННЫХ С САЙТОВ НЕДВИЖИМОСТИ И АНАЛИЗ МОСКОВСКОГО РЫНКА ЖИЛЬЯ С ИСПОЛЬЗОВАНИЕМ ЛОКАЛЬНОЙ СРЕДНЕЙ ЦЕНЫ КВАДРАТНОГО МЕТРА
Чурбанов Р. Р., Правовая информатика 2025 № 3 С. 79–89
В статье описывается интегрированное решение для автоматизированного сбора детализированных данных о предложениях квартир на первичном и вторичном рынках жилья Москвы и их аналитической обработки. Решение объединяет программные средства веб-скрейпинга (парсинг HTML-кода сайтов недвижимости с помощью Python) с хранилищем данных на базе Microsoft SQL Server и системой интерактивной визуализации в Microsoft Power BI. Основной аналитический показатель ...
Добавлено: 28 августа 2025 г.
Developing an Approach for Automated Data Collection and Mining Using Web Scraping Techniques and Large Language Models: A Case Study on Extracting Technology Readiness Level Assessments
F. M. Grozovskiy, I. V. Loginova, Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 4 P. 269–278
Добавлено: 25 августа 2025 г.
О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
Грозовский Ф. М., Логинова И. В., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 8 С. 27–36
Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической ...
Добавлено: 11 августа 2025 г.
Young women and fan fiction: Motives, reading practices, and reader types
Darina Valiakhmetova, Diana Shchelkanova, Oxana Mikhaylova, Transformative Works and Cultures 2025 Vol. 46
Добавлено: 19 июня 2025 г.
Тексты судебных приговоров как источник данных для эмпирических исследований права в России
Жучкова С. В., Девятников В. Ю., Казун А. П. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 2 С. 170–192
Развитие эмпирических исследований права в России во многом сдерживается дефицитом доступных источников данных о правоприменении. Один из таких источников, до сих пор недостаточно используемый в российских исследованиях, — публикуемые в открытом доступе тексты судебных решений, в частности судебных приговоров. Цель статьи — предложить подход к использованию текстов судебных приговоров как источника данных, который может быть ...
Добавлено: 8 мая 2025 г.
Калейдоскоп чувств: исследование эмоциональности любительской массовой литературы (на материале русскоязычной электронной базы фанфикшн)
Максименко П. И., В кн.: «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность : материалы научной конференции молодых ученых.: Иркутск: Издательство ИГУ, 2024. С. 89–95.
Описываются результаты применения сентимент-анализа к текстам, вхо-дящим в русскоязычную электронную базу фанфикшн, которая включает в себя более 135 тыс. работ, опубликованных на специализированном ресурсе «Книга Фанфиков» (ficbook.net). Дан-ные, полученные в результате применения моделей анализа тональности RuBERT и Dostoevsky, сопоставляются с метаданными о текстах, входящих в базу, в частности с информацией о тематических тегах, присвоенных работам ...
Добавлено: 29 ноября 2024 г.
Пилотный анализ мотивов чтения фанфикшн-литературы среди московской студенческой молодежи
Валиахметова Д. Р., Щелканова Д. В., Михайлова О. Р., В кн.: Подросток в мегаполисе: поиск вопросов и ответов. Сборник трудов XVI международной научно-практической конференции.: Национальный исследовательский университет "Высшая школа экономики", 2023. С. 25–28.
Добавлено: 16 апреля 2023 г.
Репозиторий открытых данных по русской литературе и фольклору
СПб.: Институт русской литературы (Пушкинский Дом) РАН, 2023.
Репозиторий открытых данных по русской литературе и фольклору — это ресурс для хранения и публикации научных данных, которые авторы предоставляют в свободный доступ другим исследователям. Задачи репозитория — повысить видимость и доступность данных, способствовать расширению количественных исследований в литературоведении и поддерживать культуру цитирования данных. Объявления о новых публикациях — в блоге репозитория. Публикуемые в репозитории данные ...
Добавлено: 17 февраля 2023 г.
Вопросы реализации машинного перевода текстов деловой коммуникации для языковой пары «русский язык - английский язык»
Новикова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2017 Т. 15 № 9 С. 26–36
В статье рассмотрены практические аспекты, связанные с проблемой искажения смыслов при переводе с одного языка общения на другой с использованием существующих систем машинного перевода и лежащего в их основе подхода, основанного на пословномпереводе, на примере текстов деловой коммуникации. Следуя основному положению теории «смысл-текст» применительно к машинному переводу о том, что переход от смыслов к текстам и обратно осуществляется за счет моделирования языковых познаний говорящих, лежащих в основе актов речевого общения, авторы предлагают комплексный функциональный метод ...
Добавлено: 1 февраля 2023 г.
Оценка стоимости недвижимости на основе больших данных
Мамедли М. О., Умнов А. В., Вопросы экономики 2022 № 12 С. 118–136
Рассматриваются применение данных официальной статистики и онлайнпорталов по продаже недвижимости, а также алгоритмы машинного обучения для оценки стоимости квартир вторичного рынка жилья Москвы. Для этого осуществлен сбор и проведена обработка данных портала ЦИАН с помощью технологии веб-скрейпинга и портала «Реформа ЖКХ». Для оценки объектов недвижимости были рассмотрены алгоритмы машинного обучения Elastic Net, Random Forest и Gradient Boosting, а для интерпретации результатов black-box алгоритмов использовался ...
Добавлено: 11 января 2023 г.
Цифровые технологии в правоохранительной деятельности: критерии правомерного сочетания публичных и частных интересов
Мамай Е. А., International Journal of Open Information Technologies 2022 Т. 10 № 11 С. 87–104
В статье рассматривается использование цифровых технологий в правоохранительной деятельности сквозь призму соотношение публичных и частных интересов. Проанализирована система нормативного и правоприменительного регулирования, изучены нормативные правовые акты, регламентирующие отношения, складывающиеся в сфере использования информационно-телекоммуникационных технологий, изучено более 30 постановлений, определений и иных решений, принятых различными судебными инстанциями в России, а также более 20 решений Европейского суда ...
Добавлено: 3 ноября 2022 г.
Оценка коммуникативного потенциала сайтов российских НКО на основе анализа нереактивных данных
Жучкова С. В., Линделл Д., Мониторинг общественного мнения: Экономические и социальные перемены 2022 № 5 С. 347–372
В исследовании предлагается и апробируется подход к измерению коммуникативного потенциала сайтов некоммерческих организаций (НКО). Анализ строится на данных о технических характеристиках сайтов почти 10 000 российских НКО, собранных авторами самостоятельно с помощью процедуры веб-скрейпинга. Коммуникативный потенциал оценивается в соответствии с принципами, предложенными М. Кентом и М. Тейлор, согласно которым сайт должен обладать простым интерфейсом, предоставлять ...
Добавлено: 8 июля 2022 г.
Трансформация канона, борьба с каноном, пересоздание канона как основания культуры фанфикшна
Романенко К. Р., Философия. Журнал Высшей школы экономики 2022 Т. 6 № 2 С. 166–188
Для понимания трансформации канонов, борьбы с канонами, обсуждения канонов продуктивно исследовать фанфикшн— особую читательскую, зрительскую и авторскую практику, в рамках которой активно создаются непрофессиональные и некоммерческие тексты, основанные на сюжетах и героях чужих произведений. Фанфикшн устроен парадоксально: он зиждется на специфичном каноне— коллективно отобранных кино- и литературных текстах, — движется поклонением, эмоциональной привязанностью и вниманием, ...
Добавлено: 1 июля 2022 г.
Кластеризация данных, извлечение ключевых слов и лексическое разнообразие в текстах эссе учебного корпуса
Щербакова А. М., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
В статье основное внимание уделяется задаче кластеризации эссе, написанных учащимися, изучающими английский язык в качестве иностранного. Данные были взяты из учебного корпуса REALEC. Разделение текстов по определенным характеристикам может быть полезно для быстрого анализа отдельного корпуса или доступа к нужным разделам большого количества документов. В исследовании обсуждаются не только некоторые существующие подходы к кластеризации текстовых ...
Добавлено: 30 сентября 2021 г.
Две проблемы российской статистики: взгляд пользователя
Бессонов В. А., Вопросы статистики 2021 Т. 28 № 4 С. 5–22
В статье обсуждаются два блока проблем российской статистики, не нашедшие до сих пор приемлемого решения. Это – состояние интерфейса статистики, то есть совокупности каналов, посредством которых пользователи получают статистическую информацию, и состояние метаданных, то есть информации о том, как строятся показатели. Проблемы рассматриваются с позиций потребителей статистической информации, решающих задачи анализа экономической динамики.    Сделан ...
Добавлено: 14 сентября 2021 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору