• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
4 июня 2026 г.
«Я хочу, чтобы люди больше доверяли науке»
Выбирая специальность «фундаментальная и прикладная лингвистика», Татьяна Еремичева думала, что это про изучение языков, а оказалось — про помощь людям. В интервью проекту «Молодые ученые Вышки» она рассказала о науке как инструменте приятия этого мира, бильярде как варианте тимбилдинга и о том, как иногда непросто научиться читать.
4 июня 2026 г.
Социологи ВШЭ: среди российского среднего класса преобладают консерваторы
Российский средний класс нельзя считать единой и одинаково устойчивой социальной группой. За схожим уровнем доходов скрываются совершенно разные финансовые стратегии, образ жизни и степень стабильности. К такому выводу пришли социологи Высшей школы экономики. Исследование опубликовано в журнале «Вопросы экономики».
2 июня 2026 г.
НИУ ВШЭ представил исследования и проекты зеркальной лаборатории с УрФУ на USBEREIT
В мае в Екатеринбурге, Москве и Астане прошла Урало-Сибирская конференция IEEE по биомедицинской инженерии, радиоэлектронике и информационным технологиям (USBEREIT). Ученые из НИУ ВШЭ представили результаты своих исследований и проекты зеркальной лаборатории с Уральским федеральным университетом, в частности экспериментальный стенд модульного центра обработки данных и новый подход, системно объединяющий данные и физические законы.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)

Научно-техническая информация. Серия 2: Информационные процессы и системы. 2025. № 8. С. 27–36.
Грозовский Ф. М., Логинова И. В.

Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической готовности составила 84–85%, что сопоставимо с аналогичными результатами в других, менее специализированных задачах.

Научное направление: Компьютерные науки Экономика и менеджмент
Язык: русский
Полный текст
DOI
Ключевые слова: автоматизацияизвлечение информациитекстовые данныевеб-скрейпингБольшие языковые модели (LLMs)уровень готовности технологий (TRL)
Похожие публикации
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
How Universal is the Cool Water Effect? Evidence from the Unlikely Case of Russia
Кравцова М. В., Мусаев А. У., Вельцель К. П., / Series "SSRN Working Paper Series". 2026.
Добавлено: 3 июня 2026 г.
Влияние доминирующего бизнеса на развитие цифровых экосистем в России
Блохин А. А., Ларионов А. В., Вестник Российской академии наук 2026 Т. 96 № 6 С. 564–574
В исследовании подтверждена значимость институциональных факторов в формировании цифровых экосистем. Преимущество последних для участников заключается в создании общей среды со сниженными транзакционными издержками. Такое преимущество создаёт доминирующий в среде крупный бизнес, организующий экосистему на основе доступа к информационным массивам, широкой сети клиентов, инвестициям в платформенные технологические решения, иным ресурсам. Компании среднего уровня, используя полученные институциональные ...
Добавлено: 3 июня 2026 г.
Public Procurement as a Platform: An Ecosystem Capability Framework
Стырин Е. М., Санина А. Г., Атаева А. Г. и др., Public administration and development 2026 P. 1–18
Digital public procurement is increasingly implemented through e-procurement platforms, yet evidence on the governance capabilities needed to deliver transparency, coordination and organisational learning remains limited outside high-capacity contexts. This article reframes public procurement as a socio-technical platform ecosystem and develops an ecosystem capability framework that links three tiers (government, platform operators and users) to three ...
Добавлено: 2 июня 2026 г.
Bricolage Strategy and SME Performance: The Paradoxical Role of Organizational Ambidexterity and Entrepreneurial Leadership
Широкова Г. В., Bystrov Arsenii, Tyutneva Anna, Foresight and STI Governance 2026 Vol. 20 No. 2 Article 31636
Добавлено: 2 июня 2026 г.
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
The effects of ECB's monetary policy on growth: a sovereign bonds pricing approach
Ринкон Эрнандес К. Х., Journal of Economic Studies 2026 P. 1–18
Добавлено: 2 июня 2026 г.
Экономические драйверы потребления табака: анализ региональных данных
Бирюкова А. И., Засимова Л. С., Вопросы статистики 2026 Т. 33 № 2 С. 40–57
В статье исследуется изменение экономической доступности сигарет в российских регионах в 2011–2023 гг. С помощью моделей с фиксированными эффектами проанализировано влияние цен, доходов и  показателя доступности сигарет (отношение среднедушевых доходов к цене) на три ключевых  показателя: розничные продажи сигарет на душу населения, расходы взрослого населения на приобретение табачной продукции и доля этих  расходов в потребительских расходах домохозяйств. В исследовании отмечается перелом долгосрочного тренда: после снижения потребления табака в 2011–2021 гг. в 2022–2023 ...
Добавлено: 1 июня 2026 г.
К вопросу о новом порядке отбора получателей субсидий из бюджета субъектов Российской Федерации
Саакян Т. В., Региональная экономика и управление: электронный научный журнал 2023 № 4 (76) Статья 41
Статья посвящена анализу условий, влияющих на выбор подхода к регулированию порядка отбора получателей субсидий в целях оказания им государственной поддержки из бюджета. Рассмотрены результаты анализа возможных действий субнациональных органов власти и органов местного самоуправления при переходе на новый порядок отбора получателей субсидий в соответствии с внесенными в декабре 2022 года изменениями в Бюджетный кодекс Российской ...
Добавлено: 1 июня 2026 г.
Эволюция подходов к контролю за предоставлением и использованием средств из бюджетов: правовые основы и практические аспекты
Саакян Т. В., Финансовые рынки и банки 2024 № 4 С. 92–100
В публикации представлены результаты исследования, предметом которого являлись правовые основы и практические аспекты государственного финансового контроля в Российской Федерации. Особое внимание уделено анализу правового регулирования контрольной и экспертно-аналитической деятельности, направленной на оценку соблюдения требований законодательства участниками отношений, возникающих в процессе предоставления из бюджетов субсидий юридическим лицам. Целью исследования являлось определение роли государственного финансового контроля как ...
Добавлено: 1 июня 2026 г.
Предоставление средств из бюджетов публично-правовых образований юридическим лицам: 25 лет развития правовых норм в России
Саакян Т. В., Финансовые рынки и банки 2024 № 8 С. 52–64
Статья посвящена обзору действующих в разные годы нашего столетия норм законодательных и нормативных правовых актов, предметом регулирования которых являлись вопросы предоставления средств из бюджетов бюджетной системы Российской Федерации юридическим лицам (создание правовых оснований, определение условий и порядков предоставления, контроль за использованием) и анализу направлений их развития в ретроспективе. Указанный период выбран в связи с вступлением ...
Добавлено: 1 июня 2026 г.
Особенности российского законодательства в сфере заключения договоров аренды объектов федерального имущества
Саакян Т. В., Тихонова А. С., Человек. Социум. Общество 2024 № 11 С. 179–191
В соответствии с российским законодательством, регулирующим отношения в сфере недвижимости, для определения начальной (минимальной) цены объекта торгов на право заключения договора аренды обязательным условием является привлечение независимого оценщика. Применяемая в настоящее время процедура определения стоимости арендной платы объектов недвижимости не обеспечивает должный уровень эффективности. Авторами статьи проанализированы нормативные правовые и иные акты, регулирующие отношения в ...
Добавлено: 1 июня 2026 г.
Зеленое финансирование: перспективы оптимизации рыночных и государственных основ
Саакян Т. В., Ключников О. И., Ученые записки Международного банковского института 2024 № 2(48) С. 129–143
Предмет. Зеленые финансы как новый рыночно-государственный механизм оптимизации взаимодействий человека с природой. Цель статьи. Изучение механизма рыночного развития и государственного регулирования с позиции особенностей ценообразования зеленых финансовых продуктов. Метод. В исследовании использовалась контекстуальный анализ, а также сравнения. Результаты. По сравнению с имеющейся литературой, в этом исследовании основное внимание обращается на вопросы классификации рынка с позиции ценообразования ...
Добавлено: 1 июня 2026 г.
Государственные субсидии хозяйственным субъектам: подходы к концептуализации
Ключников И. К., Саакян Т. В., Ученые записки Международного банковского института 2024 № 4 С. 125–150
Предмет. Субсидии как фискальный инструмент, используемый для стабилизации уровня внутренних цен и поддержки социально-экономически значимых производств. Целью исследования является разработка подходов к теоретико-методологическому обоснованию принципов оценки эффективности государственных субсидий хозяйственным субъектам. Результаты. Обоснована возможность использования функции социального благосостояния и функции социального выбора для оценки адресной эффективности государственной помощи. Разработаны подходы к теоретическому освещению государственной финансовой помощи ...
Добавлено: 1 июня 2026 г.
Нормативно-методическое обеспечение мониторинга достижения результатов НИОКР, осуществляемых за счет субсидий из федерального бюджета
Саакян Т. В., Финансовый журнал 2024 Т. 16 № 4 С. 24–40
В статье рассмотрены подходы к нормативно-методическому обеспечению мониторинга достижения результатов научно-исследовательских, опытно-конструкторских и технологических работ гражданского назначения (НИОКР), осуществляемых за счет субсидий, в том числе грантов в форме субсидий, предоставленных из федерального бюджета на выполнение научно-исследовательских (опытно-конструкторских) работ юридическим лицам (за исключением государственных (муниципальных) учреждений), индивидуальным предпринимателям, физическим лицам - производителям товаров, работ и услуг, ...
Добавлено: 1 июня 2026 г.
Сборник материалов XXIV Международной научно-практической конференции «Смирновские чтения – 2025»
СПб.: Издательство МБИ имени Анатолия Собчака, 2025.
Статья посвящена вопросам предоставления субсидий из федерального бюджета коммерческим организациям в условиях санкционных ограничений. Целью исследования является определение особенностей практики предоставления указанных субсидий в контексте процесса, направлений и объектов субсидирования. Результатом исследования является вывод о корректировке системы субсидирования коммерческих организаций, взаимосвязанной по целеполаганию, объемам и временному периоду с иными мерами стимулирования экономического роста в условиях ...
Добавлено: 1 июня 2026 г.
Подходы к оценке эффективности бюджетных расходов на предоставление из федерального бюджета субсидий бюджетам субъектов Российской Федерации
Саакян Т. В., Кондратенко А. П., Финансовые рынки и банки 2025 № 10 С. 181–185
Эффективное использование бюджетных средств - ключевой аспект государственной финансовой политики, так как напрямую влияет на социально-экономическое развитие страны, обеспечивая баланс между государственными расходами и доходами. Одним из инструментов бюджетной политики является предоставление из федерального бюджета бюджетам субъектов РФ межбюджетных трансфертов в форме субсидий. Субсидии играют существенную роль в обеспечении сбалансированного развития субъектов РФ за счет ...
Добавлено: 1 июня 2026 г.
XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025)
СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025.
Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием КИИ-2025 продолжает традицию советских (российских) конференций, организуемых Российской ассоциацией искусственного интеллекта. В первом томе трудов публикуются пленарные доклады и доклады участников конференции, представленные на следующих секциях: Секция 1 «Инженерия знаний», Секция 2 «Интеллектуальный анализ данных», Секция 3 «Моделирование рассуждений», Секция 4 «Интеллектуальный анализ текстов, большие ...
Добавлено: 15 февраля 2026 г.
Generating and Debugging Java Code using LLMs based on Associative Recurrent Memory
Василевский В. И., Александров Д. В., Proceedings of the Institute for System Programming of the RAS 2025 Vol. 37 No. 5 P. 173–182
Автоматическая генерация кода большими языковыми моделями (LLM) достигла значительных успехов, однако все еще сталкивается с проблемами при работе со сложными и объемными кодовыми базами, особенно на таких языках, как Java. Ограничения контекстного окна LLM и сложность отладки сгенерированного кода являются ключевыми препятствиями. В данной статье представлен подход, направленный на улучшение генерации и отладки Java-кода. Мы ...
Добавлено: 26 декабря 2025 г.
Искусственный интеллект как симулякр смысла
Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173
В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...
Добавлено: 7 декабря 2025 г.
SIGNAL: Dataset for Semantic and Inferred Grammar Neurological Analysis of Language
Комиссаренко А. А., Voloshina E., Чевелева А. Н. и др., Scientific data 2025 Vol. 12 No. 1 Article 1687
Добавлено: 18 ноября 2025 г.
MADD: Multi-Agent Drug Discovery Orchestra
Solovev G. V., Zhidkovskaya A. B., Orlova A. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. Ch. 367 P. 6956–6998.
Добавлено: 16 ноября 2025 г.
3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark
Sviridov I., Miftakhova A., Tereshchenko A. и др., , in: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP).: Association for Computational Linguistics, 2025. Ch. 1353 P. 26625–26665.
Добавлено: 16 ноября 2025 г.
Автоматизация обновления карт дорожной сети с использованием GPS-трекера
Чашкин Л. Б., Маршутина Е. Н., Подкопаева П. О., В кн.: Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов имени Е.В. Арменского. Москва, 2024.: М.: ООО "Издательский дом Медиа паблишер", 2024. С. 119–122.
В работе предлагается решение важной в картографии задачи - актуализация геоданных дорожной сети. В работе предлагается использование программно-аппаратного комплекса с применением GPS-трекеров. Спроектирована система, позволяющая осуществлять сбор и обработку геоданных двумя способами, а также принимать решение об актуализации данных карты с помощью web-интерфейса. ...
Добавлено: 24 октября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору