• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
13 мая 2026 г.
Исследователи Вышки - о бездомности, психологии смысла, курении и правах пациентов
В конце апреля в культурном центре Community состоялся третий полуфинал девятого сезона «Научных боев». Четыре исследователя пробирались через импровизированные джунгли социальных проблем, медицинских прав и психологических лабиринтов. У каждого было 10 минут, никаких презентаций — только реквизит, харизма и истории, от которых захватывало дух.
12 мая 2026 г.
Женщины избегают новостей не из-за «второй смены»
Женщины чаще мужчин избегают политических и экономических новостей, однако причины этого поведения связаны не столько со структурным неравенством или семейной нагрузкой, сколько с личными установками и эмоциональным восприятием новостного контента. К такому выводу пришли ученые НИУ ВШЭ, проанализировав данные масштабного опроса более 10 тысяч жителей 61 региона России. Результаты исследования опубликованы в журнале «Женщина в российском обществе».
8 мая 2026 г.
«Все время посвящается работе над диссертацией»
Илья Венедиктов окончил магистратуру Московского института электроники и математики ВШЭ по единому треку «магистратура — аспирантура» и обучается в аспирантской школе ВШЭ по техническим наукам. В настоящее время он проходит длительную стажировку в Китайском университете науки и технологий в городе Хэфэй, занимаясь подготовкой диссертации. Чем стажировка отличается от программы мобильности, какова научная тема Ильи и как проходят будни российского аспиранта в Китае, он рассказал в интервью.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)

Научно-техническая информация. Серия 2: Информационные процессы и системы. 2025. № 8. С. 27–36.
Грозовский Ф. М., Логинова И. В.

Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической готовности составила 84–85%, что сопоставимо с аналогичными результатами в других, менее специализированных задачах.

Научное направление: Компьютерные науки Экономика и менеджмент
Язык: русский
Полный текст
DOI
Ключевые слова: автоматизацияизвлечение информациитекстовые данныевеб-скрейпингБольшие языковые модели (LLMs)уровень готовности технологий (TRL)
Похожие публикации
QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks
Neal N. X., Weiqing L., Dacheng H. и др., Algorithms 2026 Vol. 19 No. 5 P. 1–22
Добавлено: 13 мая 2026 г.
Размышления о спасении тонущего ребёнка: эффективный альтруизм и социальные институты
Балашов Д. В., Антиномии 2026 Т. 26 № 1 С. 27–48
Движение эффективного альтруизма, набравшее популярность в начале XXI в., является одной из новых форм философии утилитаризма, оказавшей сильное влияние на англо-американскую философию в XIX–XX вв. Одним из отличительных признаков эффективного альтруизма является его практическая ориентированность. Движение позиционирует себя как то, что способно оказать влияние на окружающий мир и изменить его к лучшему. Для этого требуется ...
Добавлено: 13 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
Игры на сетях с линейным наилучшим ответом: модели и методы управления
Петров И. В., Автоматика и телемеханика 2026 № 6 С. 82–118
Системам связанных агентов и сетевому управлению посвящено большое число отечественных и зарубежных исследований. Исторически, наибольший интерес в теории управления возникал к усредняющим системам и, в частности, к задаче консенсуса. Однако сетевое взаимодействие может характеризоваться более специфическими функциями, отражающими зависимость от действий соседей по сети, что особенно явно проявляется в моделях стратегического взаимодействия на сети, которое ...
Добавлено: 12 мая 2026 г.
Интегрированная среда моделирования для верификации и валидации программ управления подключенными и высокоавтоматизированными транспортными средствами
Степанянц В. Г., Долгов И. М., Хорошилов Г. С. и др., Труды Института системного программирования РАН 2026 Т. 38 № 3 С. 95–110
На рынок постепенно выходят высокоавтоматизированные и подключенные транспортные средства (ТС). В настоящее время предлагаются решения, позволяющие использовать эти технологии для совместного управления дорожным движением, что может значительно повысить его безопасность. В статье анализируются требования к интегрированной среде моделирования подключенных и высокоавтоматизированных ТС и совместной автоматизации управления дорожным движением с высокодетализированным учетом влияния окружающих объектов. Проанализированы ...
Добавлено: 12 мая 2026 г.
Connected and Automated Vehicle Scenario Manager Graphical User Interface
Тихонов Р. А., Efendiev M. T., Fedotenkov A. A., 2026 International Russian Smart Industry Conference (SmartIndustryCon) 2026 P. 542–547
Добавлено: 11 мая 2026 г.
The Hidden Signals in Corporate Ribbon-Cutting Ceremonies
Гурков И. Б., Paulas R., Pacific Standard (USA) 2017
Добавлено: 11 мая 2026 г.
Proceedings 2026 IEEE 11th International Conference on Smart Cloud SmartCloud 2026 8-10 May 2026
Los Alamitos: IEEE Computer Society, 2026.
Добавлено: 10 мая 2026 г.
Социально-экономическая география зарубежных стран: материалы к курсу. Часть 1. Основные концепции региональной наук
Замятина Н. Ю., Русаков Д. С., Вдовкин Е. И., Издательские решения, 2022.
Десятилетиями социально‑экономическая география зарубежных стран представляла собой по большей части сбор данных о размещении отраслей хозяйства — с довольно слабой концептуальной базой соответствующих процессов. Это не удивительно, если вспомнить, что отечественная экономическая география занималась размещением хозяйства в условиях социализма. Сама возможность применения отечественных концепций к «зарубежным капиталистическим странам» вызывала жаркие споры в профессиональной среде отечественных экономгеографов — многие представители старшего поколения помнят, как ломались копья в дискуссии о том, например, возможны ли территориально‑производственные комплексы в условиях капитализма. Между тем параллельно в «зарубежных капиталистических странах» формировались целые группы научных школ в сфере изучения размещения хозяйства и регионального развития, зачастую на стыке региональной экономики и собственно экономической географии (за рубежом всё чаще используется обобщающее наименование — региональная наука, или региональные исследования: regional science/regional studies). Анализируя экономико‑географические проблемы зарубежных стран, современные исследователи используют широкий набор понятий, сложившихся в последние примерно три десятилетия, и пока ещё, к сожалению, довольно слабо знакомых отечественным географам (от «перетоков знания» до «тройной спирали»). Часть зарубежных разработок — вроде теории кластерного развития — вошли и в отечественную науку; однако нередко зарубежные концепции используются в несколько суженной и искажённой трактовке (как правило, в силу инерции парадигм мышления, чуждых используемым концепциям). Зачастую исследователи, наоборот, не видят потенциал применения тех или иных концепций на нетрадиционном материале. Институт регионального консалтинга (ИРК), в котором начинали свой путь в профессиональную аналитику уже десятки выпускников кафедры социально‑экономической географии зарубежных стран географического факультета МГУ, принял решение способствовать овладению актуальными концепциями в сфере региональной науки как студентами указанной кафедры, так и всеми российскими исследователями в сфере экономической географии и регионального развития. При финансовой и организационной поддержке ИРК уже подготовлена серия учебных пособий «Институт регионального консалтинга — студентам». Ранее вышедшее пособие «Эволюционное страноведение: материалы к курсу. Часть 1. Смета траектории регионального и странового развития: разбор примеров» призвано продемонстрировать спектр возможностей применения актуальных концепций региональной науки в страноведении и анализе развития отдельных регионов России и зарубежных стран (в 2022 году подготовлено второе издание пособия, исправленное и дополненное). Для нового пособия по социально‑экономической географии зарубежных стран отобраны ключевые (на взгляд редактора) направления, необходимые современному специалисту для понимания развития мировой региональной науки. В абсолютном большинстве это концепции актуальной экономической географии; кроме того, добавлены экономические понятия, без знания которых затруднено понимание мейнстрима региональной науки (так, например, тема убывающей и возрастающей отдачи является ключевой для понимания направления так называемой «новой экономической географии» в экономике), а также системы популярных прикладных мер в региональном развитии («новая промышленная политика», понятие «зависимости от колеи» и др.). Разумеется, это не исчерпывающий спектр концепций и подходов экономической географии (не говоря уже о том, что в пособии совсем не затронуты концепции социальной и других направлений общественной географии); работа над подготовкой новых материалов продолжается. Появлению пособия в немалой степени поспособствовал труд магистранта кафедры социально‑экономической географии зарубежных стран географического факультета МГУ имени М. В. Ломоносова Фёдора Чернецкого в рамках прохождения производственной практики в Институте регионального консалтинга. Авторами разделов стали студенты указанной кафедры. В ходе практической части курса «Социально‑экономическая география зарубежных стран» они выполняли задание не только тщательно описывать методологический контекст и суть той или иной концепции, но и продемонстрировать её работу на конкретном примере — российском или зарубежном. Разработка задания и общая редакция проведена Надеждой Замятиной, их преподавателем и одновременно заместителем директора Института регионального консалтинга. Коллектив авторов надеется, что представленные материалы будут полезны как студентам, специализирующимся в области социально‑экономической географии и смежных дисциплин, так и всем, чья профессиональная деятельность связана с анализом и планированием пространственного развития экономики, регионального развития, государственным и муниципальным управлением и т. п. ...
Добавлено: 9 мая 2026 г.
От неизвестности к прозрачности: обзор технологий объяснимого ИИ (XAI)
Авдошин С. М., Песоцкая Е. Ю., Информационные технологии 2026 Т. 32 № 4 С. 185–194
С развитием ИИ, и в особенности глубокого обучения, появились модели, способные давать крайне точные прогнозы. Однако их внутренняя логика остается трудной для понимания — и это серьезная проблема, особенно в сферах, где от корректности алгоритма зависят критиче ски важные решения. Одним из перспективных путей ее решения считается направление Explainable Artificial Intelligence (XAI) — разработка подходов, позволяющих прояснять ...
Добавлено: 8 мая 2026 г.
Международный транспортный коридор «Север – Юг» в условиях переориентации торговых потоков РФ в страны Глобального Юга
Дегтерева Е. А., Бирюкова О. В., Сабанцев А. И., Вестник МГИМО Университета 2026 Т. 19 № 2 С. 149–171
В условиях структурной трансформации внешней торговли России МТК «Север – Юг» выступает потенциальным инструментом для переориентации торговых потоков. Однако существует проблема разрыва между декларируемым потенциалом маршрута и его реальной грузовой базой, обеспечение которой ограничивается как инфраструктурными («жёсткими»), так и нефизическими («мягкими») барьерами МТК. Целью исследования является систематизация барьеров развития МТК «Север – Юг» на основе анализа торгового ...
Добавлено: 8 мая 2026 г.
Explainable AI for Industry 5.0: Shedding light on the black box
Авдошин С. М., Песоцкая Е. Ю., Business Informatics 2026 Vol. 20 No. 1 P. 7–28
Добавлено: 8 мая 2026 г.
Зачем (и как) измерять экономическое поведение домашних хозяйств: о проекте НИУ ВШЭ «Экономическое поведение домашних хозяйств»
Кузьминов Я. И., Овчарова Л. Н., Радаев В. В., Вопросы экономики 2026 № 5 С. 5–16
Это введение к специальному выпуску журнала «Вопросы экономики», посвященному теме экономического поведения домашних хозяйств и результатам проекта «Экономическое поведение домашних хозяйств», реализуемого в НИУ ВШЭ. Данный проект осуществляется с 2023 г., имеет полевую часть (сбор социологических данных) и аналитическую компоненту (анализ собранных данных, их систематизация, обобщение и сравнение с другими источниками данных). Авторы статьи – ...
Добавлено: 8 мая 2026 г.
Российские разработчики о создании и востребованности отечественного индустриального ПО: результаты пилотного обследования
Шашнов С. А., Богданов Т. В., Абдрахманова Г. И., Вопросы статистики 2026 Т. 33 № 2 С. 58–68
В статье представлены результаты исследования рынка российского индустриального программного обеспечения (ПО). Актуальность темы обусловлена значимостью этого сегмента для технологического суверенитета и комплексной цифровизации отраслей промышленности и экономики в целом. Целью исследования являлся сбор и анализ первичных данных, отражающих позиции, приоритеты и оценки компаний‑разработчиков. Для изучения ключевых направлений отечественных разработок индустриального ПО был подготовлен понятийный аппарат, сформирована ...
Добавлено: 8 мая 2026 г.
Comparative Analysis of Students’ Perceptions of Programming Puzzles: Parson’s and Wordle-Like
Варнавский А. Н., IEEE Access 2026 Vol. 14 P. 37487–37508
Добавлено: 7 мая 2026 г.
Towards performance analysis of GPU-aware MPI over Angara interconnect
Ismagilov T., Mukosey A., Смирнов Ф. А. и др., International Journal of High Performance Computing Applications 2026 Vol. 40 No. 2 P. 240–253
Добавлено: 7 мая 2026 г.
Стратегии управления капиталом и потребительские паттерны высокодоходных россиян: эмпирический анализ
Кручинская Е. В., Груздев И. А., Вопросы экономики 2026 № 5 С. 96–114
Проанализирован экономический профиль представителей высокодоходного населения России – группы, которая, несмотря на статус значимого игрока в экономике, во многом формирующего спрос на товары и услуги, а также задающего потребительские тренды на него, остается недостаточно исследованной. Это общемировая научная лакуна, имеющая особую актуальность в российском контексте с учетом уровня неоднородности распределения богатства в сегменте наиболее обеспеченных. ...
Добавлено: 7 мая 2026 г.
Employer branding, employee experience and performance-relevant outcomes: a data-driven study of employee reviews
Махар Д. Х., Волкова Н. В., Journal of Organizational Effectiveness 2026
Добавлено: 7 мая 2026 г.
Inclusive Growth of Russian Companies as a Driver of Socio-Economic Development: Insights from the Metallurgical Sector
Ивашковская И. В., Гришунин С. В., Макеева Е. Ю. и др., International Journal of Financial Studies 2026 Vol. 14 No. 5 P. 120–146
Добавлено: 6 мая 2026 г.
XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025)
СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025.
Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием КИИ-2025 продолжает традицию советских (российских) конференций, организуемых Российской ассоциацией искусственного интеллекта. В первом томе трудов публикуются пленарные доклады и доклады участников конференции, представленные на следующих секциях: Секция 1 «Инженерия знаний», Секция 2 «Интеллектуальный анализ данных», Секция 3 «Моделирование рассуждений», Секция 4 «Интеллектуальный анализ текстов, большие ...
Добавлено: 15 февраля 2026 г.
Generating and Debugging Java Code using LLMs based on Associative Recurrent Memory
Василевский В. И., Александров Д. В., Proceedings of the Institute for System Programming of the RAS 2025 Vol. 37 No. 5 P. 173–182
Автоматическая генерация кода большими языковыми моделями (LLM) достигла значительных успехов, однако все еще сталкивается с проблемами при работе со сложными и объемными кодовыми базами, особенно на таких языках, как Java. Ограничения контекстного окна LLM и сложность отладки сгенерированного кода являются ключевыми препятствиями. В данной статье представлен подход, направленный на улучшение генерации и отладки Java-кода. Мы ...
Добавлено: 26 декабря 2025 г.
Искусственный интеллект как симулякр смысла
Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173
В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...
Добавлено: 7 декабря 2025 г.
SIGNAL: Dataset for Semantic and Inferred Grammar Neurological Analysis of Language
Комиссаренко А. А., Voloshina E., Чевелева А. Н. и др., Scientific data 2025 Vol. 12 No. 1 Article 1687
Добавлено: 18 ноября 2025 г.
MADD: Multi-Agent Drug Discovery Orchestra
Solovev G. V., Zhidkovskaya A. B., Orlova A. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. Ch. 367 P. 6956–6998.
Добавлено: 16 ноября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору