?
Русскоязычная электронная база фанфикшн-текстов: принципы создания и анализ метаданных
.
В работе рассматривается популярный феномен массовой любительской сетевой литературы — фанфикшн. Описывается создание электронной базы, включающей в себя более 135 тыс. текстов, размещенных на крупнейшем русскоязычном фанфикшн-ресурсе «Книга Фанфиков» (ficbook.net). Квантитативный анализ метаданных, входящих в электронную базу, позволяет исследовать явление фанфикшн в русскоязычной среде и выявить его значимые особенности.
Язык:
русский
Ключевые слова: метаданныеmetadataфанфикшнweb scrapingвеб-скрейпингэлектронная база данныхelectronic databaseFanfiction
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
В книге
Сибирский федеральный университет, 2023.
Кульков А. Н., Цветкова М. В., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Добавлено: 10 мая 2026 г.
Чурбанов Р. Р., Правовая информатика 2025 № 3 С. 79–89
В статье описывается интегрированное решение для автоматизированного сбора детализированных данных о предложениях квартир на первичном и вторичном рынках жилья Москвы и их аналитической обработки. Решение объединяет программные средства веб-скрейпинга (парсинг HTML-кода сайтов недвижимости с помощью Python) с хранилищем данных на базе Microsoft SQL Server и системой интерактивной визуализации в Microsoft Power BI. Основной аналитический показатель ...
Добавлено: 28 августа 2025 г.
F. M. Grozovskiy, I. V. Loginova, Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 4 P. 269–278
Добавлено: 25 августа 2025 г.
Грозовский Ф. М., Логинова И. В., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 8 С. 27–36
Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической ...
Добавлено: 11 августа 2025 г.
Darina Valiakhmetova, Diana Shchelkanova, Oxana Mikhaylova, Transformative Works and Cultures 2025 Vol. 46
Добавлено: 19 июня 2025 г.
Жучкова С. В., Девятников В. Ю., Казун А. П. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 2 С. 170–192
Развитие эмпирических исследований права в России во многом сдерживается дефицитом доступных источников данных о правоприменении. Один из таких источников, до сих пор недостаточно используемый в российских исследованиях, — публикуемые в открытом доступе тексты судебных решений, в частности судебных приговоров. Цель статьи — предложить подход к использованию текстов судебных приговоров как источника данных, который может быть ...
Добавлено: 8 мая 2025 г.
Максименко П. И., В кн.: «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность : материалы научной конференции молодых ученых.: Иркутск: Издательство ИГУ, 2024. С. 89–95.
Описываются результаты применения сентимент-анализа к текстам, вхо-дящим в русскоязычную электронную базу фанфикшн, которая включает в себя более 135 тыс. работ, опубликованных на специализированном ресурсе «Книга Фанфиков» (ficbook.net). Дан-ные, полученные в результате применения моделей анализа тональности RuBERT и Dostoevsky, сопоставляются с метаданными о текстах, входящих в базу, в частности с информацией о тематических тегах, присвоенных работам ...
Добавлено: 29 ноября 2024 г.
Валиахметова Д. Р., Щелканова Д. В., Михайлова О. Р., В кн.: Подросток в мегаполисе: поиск вопросов и ответов. Сборник трудов XVI международной научно-практической конференции.: Национальный исследовательский университет "Высшая школа экономики", 2023. С. 25–28.
Добавлено: 16 апреля 2023 г.
СПб.: Институт русской литературы (Пушкинский Дом) РАН, 2023.
Репозиторий открытых данных по русской литературе и фольклору — это ресурс для хранения и публикации научных данных, которые авторы предоставляют в свободный доступ другим исследователям. Задачи репозитория — повысить видимость и доступность данных, способствовать расширению количественных исследований в литературоведении и поддерживать культуру цитирования данных. Объявления о новых публикациях — в блоге репозитория.
Публикуемые в репозитории данные ...
Добавлено: 17 февраля 2023 г.
Новикова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2017 Т. 15 № 9 С. 26–36
В статье рассмотрены практические аспекты, связанные с проблемой искажения смыслов при переводе с одного языка общения на другой с использованием существующих систем машинного перевода и лежащего в их основе подхода, основанного на пословномпереводе, на примере текстов деловой коммуникации. Следуя основному положению теории «смысл-текст» применительно к машинному переводу о том, что переход от смыслов к текстам и обратно осуществляется за счет моделирования языковых познаний говорящих, лежащих в основе актов речевого общения, авторы предлагают комплексный функциональный метод ...
Добавлено: 1 февраля 2023 г.
Мамедли М. О., Умнов А. В., Вопросы экономики 2022 № 12 С. 118–136
Рассматриваются применение данных официальной статистики и онлайнпорталов по продаже недвижимости, а также алгоритмы машинного обучения для оценки стоимости квартир вторичного рынка жилья Москвы. Для этого осуществлен сбор и проведена обработка данных портала ЦИАН с помощью технологии веб-скрейпинга и портала «Реформа ЖКХ». Для оценки объектов недвижимости были рассмотрены алгоритмы машинного обучения Elastic Net, Random Forest и Gradient Boosting, а для интерпретации результатов black-box алгоритмов использовался ...
Добавлено: 11 января 2023 г.
Мамай Е. А., International Journal of Open Information Technologies 2022 Т. 10 № 11 С. 87–104
В статье рассматривается использование цифровых технологий в правоохранительной деятельности сквозь призму соотношение публичных и частных интересов. Проанализирована система нормативного и правоприменительного регулирования, изучены нормативные правовые акты, регламентирующие отношения, складывающиеся в сфере использования информационно-телекоммуникационных технологий, изучено более 30 постановлений, определений и иных решений, принятых различными судебными инстанциями в России, а также более 20 решений Европейского суда ...
Добавлено: 3 ноября 2022 г.
Жучкова С. В., Линделл Д., Мониторинг общественного мнения: Экономические и социальные перемены 2022 № 5 С. 347–372
В исследовании предлагается и апробируется подход к измерению коммуникативного потенциала сайтов некоммерческих организаций (НКО). Анализ строится на данных о технических характеристиках сайтов почти 10 000 российских НКО, собранных авторами самостоятельно с помощью процедуры веб-скрейпинга. Коммуникативный потенциал оценивается в соответствии с принципами, предложенными М. Кентом и М. Тейлор, согласно которым сайт должен обладать простым интерфейсом, предоставлять ...
Добавлено: 8 июля 2022 г.
Романенко К. Р., Философия. Журнал Высшей школы экономики 2022 Т. 6 № 2 С. 166–188
Для понимания трансформации канонов, борьбы с канонами, обсуждения канонов продуктивно исследовать фанфикшн— особую читательскую, зрительскую и авторскую практику, в рамках которой активно создаются непрофессиональные и некоммерческие тексты, основанные на сюжетах и героях чужих произведений. Фанфикшн устроен парадоксально: он зиждется на специфичном каноне— коллективно отобранных кино- и литературных текстах, — движется поклонением, эмоциональной привязанностью и вниманием, ...
Добавлено: 1 июля 2022 г.
Щербакова А. М., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
В статье основное внимание уделяется задаче кластеризации эссе, написанных учащимися, изучающими английский язык в качестве иностранного. Данные были взяты из учебного корпуса REALEC. Разделение текстов по определенным характеристикам может быть полезно для быстрого анализа отдельного корпуса или доступа к нужным разделам большого количества документов. В исследовании обсуждаются не только некоторые существующие подходы к кластеризации текстовых ...
Добавлено: 30 сентября 2021 г.
Бессонов В. А., Вопросы статистики 2021 Т. 28 № 4 С. 5–22
В статье обсуждаются два блока проблем российской статистики, не нашедшие до сих пор приемлемого решения. Это – состояние интерфейса статистики, то есть совокупности каналов, посредством которых пользователи получают статистическую информацию, и состояние метаданных, то есть информации о том, как строятся показатели. Проблемы рассматриваются с позиций потребителей статистической информации, решающих задачи анализа экономической динамики.
Сделан ...
Добавлено: 14 сентября 2021 г.