• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Система поиска документов, релевантных заданному тексту
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.
14 мая 2026 г.
<a>Ученые ФКН ВШЭ представили работы в сфере ИИ и биоинформатики на ICLR 2026
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭи студенты трека «ИИ360: Инженерия искусственного интеллекта» бакалаврской программы «Прикладная математика и информатика» приняли участие в международной конференции ICLR — одном из самых авторитетных мировых форумов в области машинного обучения и представления данных. В этом году конференция состоялась в Рио-де-Жанейро (Бразилия).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Система поиска документов, релевантных заданному тексту

С. 266–269.
Полушин Г. В.
Статья посвящена вопросам автоматизации процесса поиска документов релевантных заданному тексту. Поиск актуальной литературы является нетривиальной задачей, так как требует временных затрат и предъявляет определенные требования к читателю. В данной работе предложены методы, позволяющие минимизировать трудозатраты при поиске релевантной литературыи автоматизировать весь процесс, произведен анализ существующих программных решений по извлечению ключевых слов из текстов на русском языке. Описан способ извлечения ключевых фраз из текста на русском языке с использованием метрики TFIDF. Также описан способ автоматизированного поиска актуальных документов по извлеченным ключевым словам с использованием бесплатной поисковой системы по полным текстам научных публикаций всех форматов и дисциплин GoogleScholar. На практике система может быть использована студентами, преподавателями и всеми, кто занимается научной деятельностью.   Ключевые слова: извлечение ключевых слов, автоматизированный поиск, обработка текста
Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: keywords extractionautomatic searchtext processingизвлечение ключевых словавтоматизированный поискобработка текста

В книге

Математика и междисциплинарные исследования – 2016
Пермь: Пермский государственный национальный исследовательский университет, 2016.
Похожие публикации
Processing Verbal Texts and Infographics: Evidence from Russian
Земскова Т. А., Риехакайнен Е. И., Алексеева-Нилова (Петрова) Т. Е. и др., , in: The Fourth Saint Petersburg Winter Workshop on Experimental Studies of Speech and Language (Night Whites 2018).: Saint Petersburg State University, 2018. P. 115–115.
Сборник издается по итогам Четвертого Санкт-Петербургского зимнего симпозиума по экспериментальным исследованиям языка и речи, который прошел 26–27 февраля 2018 г. на факультете свободных искусств и наук СанктПетербургского государственного университета. Симпозиум собрал более 150 участников из различных городов России и из других стран. Представленные устные и стендовые доклады относились к междисциплинарной научной проблематике, связанной с экспериментальным ...
Добавлено: 30 марта 2025 г.
Ранжирование результатов поиска с учетом предпочтений пользователя в условиях отсутствия персонализированной статистики
Свитек А. С., Мыльников Л. А., Информационные технологии 2024 Т. 30 № 6 С. 307–317
Рассмотрен алгоритм ранжирования результатов поиска по соответствию ожиданиям пользователя за счет обратной связи на данных предварительной выдачи результатов поиска, позволяющий сократить время поиска нужной информации. Описывается численный эксперимент, направленный на оценку эффективности предлагаемого подхода на примере объектов недвижимости. В качестве данных были использованы агрегированные данные объявлений об объектах недвижимости, а для оценки соответствия рассматривали результаты ...
Добавлено: 11 июня 2024 г.
Think about what you’ve learned: анализ тональности для моделирования пользовательского опыта в сфере онлайн-образования
Кирина М. А., Человек: образ и сущность. Гуманитарные аспекты 2024 № 2(58) С. 176–204
В статье рассматриваются способы автоматического анализа мнений для оценки пользовательского опыта применительно к отзывам на проекты в рамках онлайн-курсов по программированию на Python, Java и Kotlin, представленных на англоязычной образовательной платформе Hyperskill. В исследовании описывается подход с опорой на методы анализа тональности и извлечения ключевых слов для характеристики отношения пользователей к изучаемым темам, образовательному процессу ...
Добавлено: 9 декабря 2023 г.
Сентимент частных инвесторов в объяснении различий в биржевых характеристиках акций российского рынка
Теплова Т. В., Соколова Т. В., Томтосов А. Ф. и др., Журнал Новой экономической ассоциации 2022 Т. 1 № 53 С. 53–84
Аннотация. В нашей работе впервые исследовано влияние настроений инвесторов в социальных сетях на биржевые характеристики акций российского рынка и показаны нелинейные эффекты. Месячная доходность и объемы торгов анализируются под контролем финансовых показателей и индикаторов качества корпоративного управления эмитентов акций, а также меняющейся внешней среды на отрезке с 2013 по 2020 г. Выборка для разнообразных метрик ...
Добавлено: 5 апреля 2022 г.
Кластеризация данных, извлечение ключевых слов и лексическое разнообразие в текстах эссе учебного корпуса
Щербакова А. М., В кн.: Межкультурное пространство: лингвистический и дидактический аспекты. Материалы секций "Межкультурная лингвистика", "Межкультурная транслатология" и студенческого научного форума. Пленарное заседание и секция «Межкультурная дидактика».Ч. 2.: Издательство ПетрГУ, 2021.
В статье основное внимание уделяется задаче кластеризации эссе, написанных учащимися, изучающими английский язык в качестве иностранного. Данные были взяты из учебного корпуса REALEC. Разделение текстов по определенным характеристикам может быть полезно для быстрого анализа отдельного корпуса или доступа к нужным разделам большого количества документов. В исследовании обсуждаются не только некоторые существующие подходы к кластеризации текстовых ...
Добавлено: 30 сентября 2021 г.
Автоматическое выделение ключевых слов и словосочетаний из русскоязычных корпусов текстов с помощью алгоритма RAKE
Москвина А. Д., Митрофанова О. А., Ерофеева А. Р. и др., В кн.: Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017».: СПб.: Издательство СПбГУ, 2017. С. 268–275.
В работе представлены результаты работы по модификации алгоритма RAKE, используемого для быстрого извлечения ключевых слов и словосочетаний. В качестве источника информации о границах синтаксических групп в RAKE предлагаются правила грамматики синтаксического анализатора для русского языка на основе NLTK (NLTK4RUSSIAN). Для определения эффективности работы алгоритма с русскоязычными текстами были проведены эксперименты на материале представительных корпусов. ...
Добавлено: 29 сентября 2020 г.
Семантический сетевой подход: возможности и ограничения (пример образа инфляции в СМИ)
Пашков С. Г., Социологический журнал 2020 Т. 26 № 2 С. 8–30
В статье акцентируется потребность в инструментарии, который позволил бы облегчить построение системы кодирования и анализа информации новостных сообщений. Материалом для исследования послужили экономические новости, изобилующие специфическими терминами, интерпретациями, экспертизой и метафоричным описанием событий. Во многих случаях можно фиксировать, что содержание подобных текстов усложнено, в результате чего «классический» контентанализ может потребовать дополнительных итераций и усиленного внимания ...
Добавлено: 1 июля 2020 г.
Методы построения социо-демографических профилей пользователей сети Интернет
С.Д. Кузнецов, Гомзин А. Г., Труды Института системного программирования РАН 2015 Т. 27 № 4 С. 129–144
Работа посвящена методам построения социально-демографического профиля пользователей Интернета. Примерами демографических атрибутов являются пол, возраст, политические и религиозные взгляды, район проживания, состояние отношений с другими людьми. Эта работа представляет собой обзор методов, которые обнаруживают демографические атрибуты из профиля пользователя и сообщений. Большинство известных работ посвящены выявлению пола. Возраст, политические взгляды и области также интересуют исследователей. Самыми популярными ...
Добавлено: 23 января 2018 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору