• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.
2 июня 2026 г.
От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем
Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.

4 июня 2026 г.
«Я хочу, чтобы люди больше доверяли науке»
Выбирая специальность «фундаментальная и прикладная лингвистика», Татьяна Еремичева думала, что это про изучение языков, а оказалось — про помощь людям. В интервью проекту «Молодые ученые Вышки» она рассказала о науке как инструменте приятия этого мира, бильярде как варианте тимбилдинга и о том, как иногда непросто научиться читать.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)

Научно-техническая информация. Серия 2: Информационные процессы и системы. 2025. № 8. С. 27–36.
Грозовский Ф. М., Логинова И. В.

Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической готовности составила 84–85%, что сопоставимо с аналогичными результатами в других, менее специализированных задачах.

Научное направление: Компьютерные науки Экономика и менеджмент
Язык: русский
Полный текст
DOI
Ключевые слова: автоматизацияизвлечение информациитекстовые данныевеб-скрейпингБольшие языковые модели (LLMs)уровень готовности технологий (TRL)
Похожие публикации
Закрытые по разным причинам: что показывает анализ выживаемости МСП на больших данных?
Казун А. П., Вопросы экономики 2026 № 6 С. 5–30
Проанализированы факторы выживаемости малого и среднего предпринимательства в России на данных о 5,22 млн юридических лиц на основании реестра МСП, финансовой отчетности RFSD и сведений ЕГРЮЛ о собственности и управлении. Прекращение деятельности разделено на четыре типа: реорганизация, вероятное банкротство, исключение ФНС и прочая ликвидация. Модели Кокса дают два результата. Во-первых, кажущееся преимущество малых и средних ...
Добавлено: 6 июня 2026 г.
Научно-техническая политика: практики ведущих стран
Гершман М. А., Брамбила Мартинес Ф. Х., Бредихин С. В. и др., М.: ИСИЭЗ ВШЭ, 2026.
В монографии представлены итоги комплексного анализа трендов научно-технической политики, а также стратегий и практик государственного управления в этой сфере в зарубежных странах, выполненного Институтом статистических исследований и экономики знаний (ИСИЭЗ) Национального исследовательского университета «Высшая школа экономики». Выявлены актуальные тренды мировой научно-технической политики по итогам мониторинга интернет-сайтов профильных органов власти 40 стран с применением уникальной системы интеллектуального анализа больших данных iFORA. Рассмотрен ...
Добавлено: 5 июня 2026 г.
Not more appropriate when unpunishable: normative expectations resist institutional change
Журавлева Т. Л., Афанасьев К. О., Journal of Economic Interaction and Coordination 2026 P. 1–23
Добавлено: 5 июня 2026 г.
Субституты нефтяного моторного топлива в легковом дорожном транспорте: риски для мирового спроса на нефть
Синицын М. В., Весь мир, 2025.
Мировой транспортный сектор переживает масштабную трансформацию, связанную с переходом к низкоуглеродной экономике и расширением использования альтернативных нефти энергоресурсов. В последние десятилетия ускорился процесс замещения нефтяных моторных топлив их субститутами – прежде всего, биотопливом и электроэнергией (электромобилями) – в легковом дорожном транспорте. Государственная политика на национальном, субнациональном и локальном уровнях является главным фактором опережающего предложения субститутов ...
Добавлено: 5 июня 2026 г.
Год планеты: ежегодник. Вып. 2025 г.: экономика, политика, безопасность
Идея-Пресс, 2026.
2025 год прошел под знаком углубления противоречий между ведущими державами в мировой политике и экономике. Доминирующей парадигмой становится переход основных игроков, прежде всего США, к неприкрытой, жёсткой конкуренции в целях продвижения и реализации национальных интересов. В этом контексте во многих странах мира выросла политическая поляризация и обострилась внутриполитическая борьба. Книга содержит материалы по наиболее актуальным ...
Добавлено: 5 июня 2026 г.
Станут ли автомобили на водородном топливе новым стимулом для развития рынков углерода?
Синицын М. В., Экономика строительства 2025 № 10 С. 265–268
В статье анализируются последние тенденции на мировом рынке водородных автомобилей на топливных элементах: снижение объемов продаж; ослабление государственного стимулирования; поддержка Китаем развития грузовых водородных автомобилей. Показано, что стоимость покупки и топливные затраты водородных автомобилей выше, чем дизельных автомобилей и электромобилей. Эмиссия парниковых газов у водорода из угля и природного газа выше, чем у дизельного топлива. ...
Добавлено: 5 июня 2026 г.
Выбросы парниковых газов в течение жизненного цикла: электромобили и автомобили с двигателем внутреннего сгорания
Синицын М. В., Анализ и прогноз. Журнал ИМЭМО РАН 2025 № 3 С. 25–35
В статье проведена оценка выбросов парниковых газов в течение жизненного цикла автомобилей с двигателем внутреннего сгорания и электромобилей (только с электродвигателем) с учетом выбросов при производстве, эксплуатации, обслуживании, замене батареи и утилизации. Автор на основе данных по углеродоемкости генерации электроэнергии в странах – лидерах мирового энергоперехода – США, Европейском союзе и Китае – оценивает выбросы ...
Добавлено: 5 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
How Universal is the Cool Water Effect? Evidence from the Unlikely Case of Russia
Кравцова М. В., Мусаев А. У., Вельцель К. П., / Series "SSRN Working Paper Series". 2026.
Добавлено: 3 июня 2026 г.
Влияние доминирующего бизнеса на развитие цифровых экосистем в России
Блохин А. А., Ларионов А. В., Вестник Российской академии наук 2026 Т. 96 № 6 С. 564–574
В исследовании подтверждена значимость институциональных факторов в формировании цифровых экосистем. Преимущество последних для участников заключается в создании общей среды со сниженными транзакционными издержками. Такое преимущество создаёт доминирующий в среде крупный бизнес, организующий экосистему на основе доступа к информационным массивам, широкой сети клиентов, инвестициям в платформенные технологические решения, иным ресурсам. Компании среднего уровня, используя полученные институциональные ...
Добавлено: 3 июня 2026 г.
Public Procurement as a Platform: An Ecosystem Capability Framework
Стырин Е. М., Санина А. Г., Атаева А. Г. и др., Public administration and development 2026 P. 1–18
Digital public procurement is increasingly implemented through e-procurement platforms, yet evidence on the governance capabilities needed to deliver transparency, coordination and organisational learning remains limited outside high-capacity contexts. This article reframes public procurement as a socio-technical platform ecosystem and develops an ecosystem capability framework that links three tiers (government, platform operators and users) to three ...
Добавлено: 2 июня 2026 г.
Bricolage Strategy and SME Performance: The Paradoxical Role of Organizational Ambidexterity and Entrepreneurial Leadership
Широкова Г. В., Bystrov Arsenii, Tyutneva Anna, Foresight and STI Governance 2026 Vol. 20 No. 2 Article 31636
Добавлено: 2 июня 2026 г.
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
Экономические драйверы потребления табака: анализ региональных данных
Бирюкова А. И., Засимова Л. С., Вопросы статистики 2026 Т. 33 № 2 С. 40–57
В статье исследуется изменение экономической доступности сигарет в российских регионах в 2011–2023 гг. С помощью моделей с фиксированными эффектами проанализировано влияние цен, доходов и  показателя доступности сигарет (отношение среднедушевых доходов к цене) на три ключевых  показателя: розничные продажи сигарет на душу населения, расходы взрослого населения на приобретение табачной продукции и доля этих  расходов в потребительских расходах домохозяйств. В исследовании отмечается перелом долгосрочного тренда: после снижения потребления табака в 2011–2021 гг. в 2022–2023 ...
Добавлено: 1 июня 2026 г.
XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025)
СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025.
Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием КИИ-2025 продолжает традицию советских (российских) конференций, организуемых Российской ассоциацией искусственного интеллекта. В первом томе трудов публикуются пленарные доклады и доклады участников конференции, представленные на следующих секциях: Секция 1 «Инженерия знаний», Секция 2 «Интеллектуальный анализ данных», Секция 3 «Моделирование рассуждений», Секция 4 «Интеллектуальный анализ текстов, большие ...
Добавлено: 15 февраля 2026 г.
Generating and Debugging Java Code using LLMs based on Associative Recurrent Memory
Василевский В. И., Александров Д. В., Proceedings of the Institute for System Programming of the RAS 2025 Vol. 37 No. 5 P. 173–182
Автоматическая генерация кода большими языковыми моделями (LLM) достигла значительных успехов, однако все еще сталкивается с проблемами при работе со сложными и объемными кодовыми базами, особенно на таких языках, как Java. Ограничения контекстного окна LLM и сложность отладки сгенерированного кода являются ключевыми препятствиями. В данной статье представлен подход, направленный на улучшение генерации и отладки Java-кода. Мы ...
Добавлено: 26 декабря 2025 г.
Искусственный интеллект как симулякр смысла
Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173
В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...
Добавлено: 7 декабря 2025 г.
SIGNAL: Dataset for Semantic and Inferred Grammar Neurological Analysis of Language
Комиссаренко А. А., Voloshina E., Чевелева А. Н. и др., Scientific data 2025 Vol. 12 No. 1 Article 1687
Добавлено: 18 ноября 2025 г.
MADD: Multi-Agent Drug Discovery Orchestra
Solovev G. V., Zhidkovskaya A. B., Orlova A. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. Ch. 367 P. 6956–6998.
Добавлено: 16 ноября 2025 г.
3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark
Sviridov I., Miftakhova A., Tereshchenko A. и др., , in: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP).: Association for Computational Linguistics, 2025. Ch. 1353 P. 26625–26665.
Добавлено: 16 ноября 2025 г.
Автоматизация обновления карт дорожной сети с использованием GPS-трекера
Чашкин Л. Б., Маршутина Е. Н., Подкопаева П. О., В кн.: Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов имени Е.В. Арменского. Москва, 2024.: М.: ООО "Издательский дом Медиа паблишер", 2024. С. 119–122.
В работе предлагается решение важной в картографии задачи - актуализация геоданных дорожной сети. В работе предлагается использование программно-аппаратного комплекса с применением GPS-трекеров. Спроектирована система, позволяющая осуществлять сбор и обработку геоданных двумя способами, а также принимать решение об актуализации данных карты с помощью web-интерфейса. ...
Добавлено: 24 октября 2025 г.
Transformers and State-Space Models: Fine-Tuning Techniques for Solving Differential Equations
Игнатенко В. В., Сурков А. Ю., Zakharov V. и др., Sci 2025 Vol. 7 No. 3 Article 130
Добавлено: 10 октября 2025 г.
Application of Large Language Models to Solving Differential Equations: Constructing Baseline Models with LSTM and GRU
Сурков А. Ю., Захаров В. Ю., Sergei Koltcov и др., , in: Smart Technologies, Systems and Applications: 4th International Conference, SmartTech-IC 2024, Quito, Ecuador, December 2–4, 2024, Revised Selected Papers, Part IIVol. 2: Revised Selected Papers, Part II.: Springer, 2025. P. 239–252.
Добавлено: 11 сентября 2025 г.
Artificial Intelligence, Media and International Security
Cham: Springer, 2025.
Добавлено: 27 июля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору