• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Text Mining Scientific Papers: A Survey on FCA-Based Information Retrieval Research
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Text Mining Scientific Papers: A Survey on FCA-Based Information Retrieval Research

P. 273–287.
Пульманс Й., Игнатов Д. И., Виене С., Дедене Г., Кузнецов С. О.

Formal Concept Analysis (FCA) is an unsupervised clustering technique and many scientific papers are devoted to applying FCA in Information Retrieval (IR) research. We collected 103 papers published between 2003-2009 which mention FCA and information retrieval in the abstract, title or keywords. Using a prototype of our FCA-based toolset CORDIET, we converted the pdf-files containing the papers to plain text, indexed them with Lucene using a thesaurus containing terms related to FCA research and then created the concept lattice shown in this paper. We visualized, analyzed and explored the literature with concept lattices and discovered multiple interesting research streams in IR of which we give an extensive overview. The core contributions of this paper are the innovative application of FCA to the text mining of scientific papers and the survey of the FCA-based IR research.

Язык: английский
Полный текст
Текст на другом сайте
Ключевые слова: анализ текстовинформационный поисканализ формальных понятийFormal Concept Analysisбиблиометрияtext mininginformation retrievalbibliometry

В книге

Advances in Data Mining. Applications and Theoretical Aspects. 12th Industrial Conference, ICDM 2012, Berlin, Germany, July 13-20, 2012. Proceedings
Advances in Data Mining. Applications and Theoretical Aspects. 12th Industrial Conference, ICDM 2012, Berlin, Germany, July 13-20, 2012. Proceedings
Vol. 7377. , Berlin, Heidelberg: Springer, 2012.
Похожие публикации
Перспективы медиа-мониторинга в исследованиях общественного мнения (на примере доверия президенту)
Анкудинов И. А., Социология: методология, методы, математическое моделирование 2025 № 61 С. 165–203
Изменчивые политические настроения россиян — постоянный предмет интереса социологических фондов. С развитием интернета привычные анкетные исследования стали дополняться онлайн-опросами и, несмотря на некоторый скепсис, «майнингом» социальных сетей. В настоящей статье предпринимается попытка скорректировать стихийную интернет-выборку так, чтобы приблизить ее оценки к репрезентативным омнибусам. Мы используем показатели доверия Президенту РФ в сети и в опросах с ...
Добавлено: 22 апреля 2026 г.
SMMR: Sampling-Based MMR Reranking for Faster, More Diverse, and Balanced Recommendations and Retrieval
Liakhnovich K., Lashinin O., Babkin A. и др., Proceedings of the 48th International ACM SIGIR Conference on Research and Development in Information Retrieval 2025 P. 2754–2758
Добавлено: 3 февраля 2026 г.
Is Canfield Right? On the Asymptotic Coefficients for the Maximum Antichain of Partitions and Related Counting Inequalities
Игнатов Д. И., , in: 11th International Conference, AIST 2023, Yerevan, Armenia, September 28–30, 2023, Revised Selected Papers. Analysis of Images, Social Networks and Texts. Lecture Notes in Computer Science (LNCS, volume 14486).: Cham: Springer, 2024. P. 349 – 361.
Добавлено: 23 января 2026 г.
Исследования тюркско-русского билингвизма в русскоязычном научном поле: контрастивный библиометрический анализ
Колмогорова А. В., Налобина П. А., Урало-алтайские исследования 2025 № 3 С. 56–83
Статья посвящена библиометрическому анализу российских публикаций по тюркско-русскому билингвизму за 2014—2024 гг. на фоне двух англоязычных публикационных полей: по тюркско-национальному билингвизму и билингвизму в целом. Использованы три корпуса данных: 159 русскоязычных статей из агрегаторов научных статей Elibrary и Cyberleninka, 1453 англоязычных публикации по тюркско-национальному билингвизму и 5500 работ по билингвизму вообще из реферативной базы данных ...
Добавлено: 12 ноября 2025 г.
Substantive Criteria for Referring Statements from Texts to Events and Factors
I. V. Loginova, A. S. Piekalnits, E. A. Sabidaeva и др., Scientific and Technical Information Processing 2025 Vol. 52 No. 6 P. 738–751
Добавлено: 18 июля 2025 г.
Advances in Information Retrieval: 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6–10, 2025, Proceedings, Part I
Springer, 2025.
Добавлено: 17 апреля 2025 г.
Advances in Information Retrieval: 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6–10, 2025, Proceedings, Part IV
Springer, 2025.
Добавлено: 10 апреля 2025 г.
Библиометрические признаки как символические маркеры дисциплинарных границ: социологическая перспектива
Иванов Д. В., Девятко И. Ф., Мониторинг общественного мнения: Экономические и социальные перемены 2024 № 6 С. 27–51
С помощью символических маркеров ученые способны сравнительно быстро ориентироваться в растущем корпусе публикаций, тем самым определяя, пересекая и воспроизводя границы научных дисциплин. Для изучения дисциплинарных границ в наукометрии обычно используется библиометрический анализ, который позволяет наблюдать некоторые квантифицируемые характеристики предполагаемых границ. Однако такой подход не дает возможности оценить, насколько соответствующие признаки субъективно заметны для самих ученых. ...
Добавлено: 27 января 2025 г.
Обзор современных методов и технологий для оценки результативности научных исследований в библиометрии. (Часть 2)
Земсков А. И., Телицына А. Ю., Научные и технические библиотеки 2024 № 11 С. 48–61
Настоящий обзор представляет значимые изменения в области традиционной библиометрии, а также существенные инновации, происходящие в данной сфере. Одно из наиболее значимых направлений развития – продвижение электронных публикаций и увеличение роли систем открытого доступа. Представлен материал о новых подходах к обеспечению доступа к исходным научным данным. Внимание российских государственных органов к оценкам публикационной активности, а также созданию ...
Добавлено: 14 декабря 2024 г.
Информационные технологии, компьютерные системы и издательская продукция для библиотек. Сборник докладов двадцать седьмой Международной конференции и выставки «LIBCOM-2023»
[б.и.], 2024.
В Конференции приняло участие около 400 участников из России, Абхазии, Беларуси и Индии, а за четыре дня работы "LIBCOM-2023" прошло более 30 профессиональных мероприятий. В рамках программы конференции с успехом состоялись: седьмая отраслевая конференция "Книгоиздание и библиотеки: векторы взаимодействия" памяти Б. В. Ленского; центральная дискуссионная площадка "На пути к формированию новой государственной системы научно-технической информации"; ...
Добавлено: 26 ноября 2024 г.
Machine Learning and Knowledge Discovery in Databases. Applied Data Science Track. European Conference, ECML PKDD 2024, Vilnius, Lithuania, September 9–13, 2024, Proceedings, Part X. LNCS, volume 14950
Cham: Springer, 2024.
Добавлено: 22 ноября 2024 г.
Обзор современных методов и технологий для оценки результативности научных исследований в библиометрии. (Часть 1)
Зэмсков А., Телицына А. Ю., Научные и технические библиотеки 2024 № 10 С. 84–101
Настоящий обзор представляет значимые изменения в области традиционной библиометрии, а также существенные инновации, происходящие в данной сфере. Одно из наиболее значимых направлений развития – продвижение электронных публикаций и увеличение роли систем открытого доступа. Представлен материал о новых подходах к обеспечению доступа к исходным научным данным. Внимание российских государственных органов к оценкам публикационной активности, а также созданию ...
Добавлено: 29 октября 2024 г.
Патриотический дискурс в Рунете: до и после 24 февраля 2022 г.
Анкудинов И. А., Мониторинг общественного мнения: Экономические и социальные перемены 2024 № 2 С. 153–177
Зафиксированный после 24 февраля 2022 г. патриотический подъем нашел своеобразное отражение в русскоязычном сегменте интернета. Хотя социологи почти единодушны в том, что социальное самочувствие граждан и их отношение к властям улучшились, цифровые следы этих изменений не так заметны: невооруженным взглядом видна только усилившаяся поляризация по линии «за — против». В работе измеряется непосредственный (краткосрочный) эффект, ...
Добавлено: 7 сентября 2024 г.
Влияние международной помощи на политические риски для прямых иностранных инвестиций
Бартенев В. И., Вестник МГИМО Университета 2023 Т. 16 № 5 С. 155–188
В последнее десятилетие на первый план в международном дискурсе вышел вопрос о расширении участия частного бизнеса в достижении целей устойчивого развития, в том числе в юрисдикциях с высоким уровнем риска. Эта задача может решаться с применением как инновационных инструментов мобилизации ресурсов частного сектора (квалифицируемых в настоящее время в ОЭСР как официальная помощь развитию (ОПР)), так ...
Добавлено: 14 ноября 2023 г.
Литературное наследие XIX–XX веков: классификация растровых изображений для интеллектуального анализа и тематического моделирования корпуса рукописных текстов
Пенская Е. Н., Хачатурян Л. В., Филологические науки. Научные доклады высшей школы 2023 № 5 С. 160–165
Рассмотренысовременные тенденции работыс цифровыми формами рукописного наследия по истории русской литературы второй половины XIX — середины ХХ в. Проанализирован процесс формирования виртуальных архивов как постепенное накопление big data научных исследований — нераспознанного информационного массива растровых документов, содержащего десятки тысяч цифровых форм архивных документов.Предложеныновые подходык классификации растровых изображений рукописных документов для работы в системах интеллектуального анализа, экспериментальные ...
Добавлено: 30 октября 2023 г.
On the Number of Maximal Antichains in Boolean Lattices for 𝑛 up to 7
Игнатов Д. И., Lobachevskii Journal of Mathematics 2023 No. 44 P. 137–146
Добавлено: 13 июня 2023 г.
Cognitive load measurement during navigation and information retrieval in digital text
Леднева Т. С., Kovalev A., Procedia Computer Science 2021 Vol. 192 P. 2720–2730
Добавлено: 27 апреля 2023 г.
АНАЛИЗ СТРУКТУРЫ ВРЕМЕННЫХ РЯДОВ КОЛИЧЕСТВА ДЕЛ В СУДЕ
Лукьянченко П. П., Громов В. А., Бесчастнов Ю. Н. и др., Вестник кибернетики 2022 Т. 4 № 48 С. 37–48
Проведен анализ временных рядов количества новых дел в административных судах РФ двумя методами группировки временных рядов с учетом хаотичности, случайности и регулярности их структуры. Первая модель основана на плоскости «энтропия – сложность», вторая – граф «атрибут – объект». Выведено четыре группы временных рядов: регулярные, регулярные-хаотические, строго хаотические и хаотические-стохастические, из которых хаотические-стохастические оказались в большинстве, что свойственно реальным ...
Добавлено: 20 марта 2023 г.
Применение методов анализа формальных понятий для анализа временных рядов тока крови для гемодиализных больных
Громов В. А., Урманцева Н. Р., [б.и.], 2021.
В докладе рассматриваются подходы к прогнозированию на основе кластеризации, опирающиеся на методологию анализа формальных понятий. Методология применяется для кластеризации участков временного ряда с целью выделения характерных участков (мотивов), отвечающих больным с различной степенью засорённости фистулы. ...
Добавлено: 30 января 2023 г.
Введение
Полухина Е. В., В кн.: Практики анализа качественных данных в социальных науках.: М.: Издательский дом НИУ ВШЭ, 2023. С. 8–12.
Введение в книгу "Практики анализа качественных данных в социальных науках" (2023) ...
Добавлено: 27 января 2023 г.
Ensemble Techniques for Lazy Classification Based on Pattern Structures
Ilya Semenkov, Sergei O. Kuznetsov, , in: Proceedings of the 9th International Workshop "What can FCA do for Artificial Intelligence?" (FCA4AI 2021)Vol. 2972.: CEUR-WS, 2021. P. 105–112.
Добавлено: 19 декабря 2022 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору