• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
26 июня 2026 г.
«Культурологи пытаются увидеть, что скрывается за поверхностью обычных вещей»
Максим Жиганов много лет исследует разные стороны звука — сначала в привязке к своей родной Перми, а затем в более глобальных масштабах. В интервью проекту «Молодые ученые Вышки» он рассказал о звуковых картах, тематическом номере журнала «Логос» и о том, зачем делать привычное менее понятным и очевидным.
26 июня 2026 г.
В НИУ ВШЭ разработали приложение для диагностики фонологической обработки у детей
Специалисты Центра языка и мозга НИУ ВШЭ представили новый цифровой инструмент для оценки навыков фонологической обработки у детей — батарею тестов «ЗАРЯ» («Звуковой анализ русского языка»). Это первое в России стандартизированное приложение, позволяющее быстро и надежно выявлять нарушения способности различать звуки речи, удерживать их в оперативной памяти и проводить фонематический анализ. Программа работает на планшетах и смартфонах с операционной системой Android, доступна для скачивания в RuStore. Детали валидации теста опубликованы в Journal of Speech, Language, and Hearing Research.
24 июня 2026 г.
Древняя чашекрания - новый вид брахиопод с необычной формой раковины и образом жизни
Российские ученые из Высшей школы экономики, МГУ имени М.В. Ломоносова и Таллинского технического университета изучили ископаемый вид древних брахиопод (плеченогих), который обитал в теплом море на севере современной Эстонии более 445 миллионов лет назад. Древняя брахиопода росла в форме чашки со «шляпкой», чтобы защититься от зарастания. Исследование опубликовано в журнале Palaeogeography, Palaeoclimatology, Palaeoecology.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)

Научно-техническая информация. Серия 2: Информационные процессы и системы. 2025. № 8. С. 27–36.
Грозовский Ф. М., Логинова И. В.

Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической готовности составила 84–85%, что сопоставимо с аналогичными результатами в других, менее специализированных задачах.

Научное направление: Компьютерные науки Экономика и менеджмент
Язык: русский
Полный текст
DOI
Ключевые слова: автоматизацияизвлечение информациитекстовые данныевеб-скрейпингБольшие языковые модели (LLMs)уровень готовности технологий (TRL)
Похожие публикации
An effective interest rate cap: a clarification
Соколов М. В., Annals of Finance 2026 Vol. 22 No. 2 Article 10
Добавлено: 25 июня 2026 г.
ВЗАИМОВЛИЯНИЕ ПРОМЫШЛЕННОГО КЛАСТЕРА И СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙ СРЕДЫ РЕГИОНА: СИСТЕМНО-ПРОСТРАНСТВЕННЫЙ ПОДХОД
Кощеев Д. А., Миролюбова Т. В., Пермь: Пермский государственный национальный исследовательский университет, 2026.
Монография посвящена теоретико-методическим аспектам исследования актуальных вопросов взаимовлияния промышленного кластера и социально-экономической среды региона. Представлена авторская концепция эволюции теории кластеров и предложен авторский системно-пространственный подход к исследованию взаимовлияния региона и промышленного кластера. На основе применения комплекса количественных и качественных методов предложена авторская системно-пространственная методика, позволяющая реализовать оценку влияния промышленного кластера на социально-экономическое развитие региона с учетом ответного воздействия социально-экономической среды ...
Добавлено: 25 июня 2026 г.
Logrolling and the power of single-mindedness
Самсонов А. Д., Sole Olle A., Xefteris D., Journal of Economic Behavior and Organization 2026 Vol. 248 Article 107642
Добавлено: 24 июня 2026 г.
Моделирование полностью роботизированного склада со стеллажами глубокого хранения
Гаджимирзаев Ш. М., Хельвас А. В., Computer Research and Modeling 2026 Vol. 18 No. 2 P. 423–438
В данной статье рассматривается модель полностью роботизированного склада с глубо кими стеллажами, предназначенного для хранения коробочных товаров. Основное внимание уделено оптимизации работы склада за счет дискретного мультиагентного моделирования дви жения шаттлов, выполняющих задачи по отгрузке и размещению коробок. Авторы исследуют различные стратегии размещения товаров в зонах склада, включая алгоритмы NCPA (Nearest Channel Positioning Algorithm), MECGP (Most Empty Channel Group Placement) ...
Добавлено: 24 июня 2026 г.
A machine learning dataset on winter roads of Krasnoyarsk Krai, Russia for the forestry and infrastructural projects
Подольская Е. С., Sinitsina A., European Journal of Forest Engineering 2026 Vol. 12 No. 1 P. 7–21
Добавлено: 24 июня 2026 г.
ГИГ-ЭКОНОМИКА В США: ЦИФРОВАЯ ТРАНСФОРМАЦИЯ ТРУДА И ЕЁ СОЦИАЛЬНЫЕ ПОСЛЕДСТВИЯ
Петровская Н. Е., США и Канада: экономика, политика, культура 2026 № 3 С. 30–45
Гиг-экономика представляет собой динамично развивающийся сектор американского рынка труда, опосредованный цифровыми платформами, предлагающими краткосрочные, гибкие и зачастую нестабильные формы занятости. За последние десятилетия она стала важным структурным элементом американской экономики, охватывая миллионы работников в сферах логистики, фриланса, ухода, образования и цифрового контента. На основе американских источников анализируются масштабы гиг-занятости, её структура и стратификация населения по ...
Добавлено: 24 июня 2026 г.
США ПРИ ВТОРОЙ АДМИНИСТРАЦИИ Д.ТРАМПА: АНАЛИЗ ОСНОВНЫХ ТЕНДЕНЦИЙ РАЗВИТИЯ
Петровская Н. Е., Кислицын С. В., Васильев В. С. и др., М.: Весь мир, 2025.
Исследование посвящено анализу ключевых тенденций и вызовов, с которыми столкнутся США во второй половине 2020-х гг. Его задача – предоставить читателю общее понимание тех процессов, которые будут оказывать влияние на динамику развития Северной Америки в период работы второй администрации Дональда Трампа. Для этого в работе были выделены такие направления исследований как экономика и общество США, ...
Добавлено: 24 июня 2026 г.
ДВЕ АМЕРИКИ ДОНАЛЬДА ТРАМПА И ЗОХРАНА МАМДАНИ: ФЕДЕРАЛЬНЫЙ КАПИТАЛИЗМ И МУНИЦИПАЛЬНЫЙ СОЦИАЛИЗМ
Петровская Н. Е., Финансовый бизнес 2025 № 12 С. 213–216
В статье анализируется формирующийся в США политико-экономический раскол на примере противостояния федеральной администрации 47-го президента США Дональда Трампа и муниципальной администрации Нью-Йорка во главе с Зохраном Мамдани. Цель исследования - выявить различия между федеральной и муниципальной моделями социально-экономического развития. Методологической основой выступает сравнительный анализ экономической и социальной политики. Показано, что данные модели формируют структурный конфликт ...
Добавлено: 24 июня 2026 г.
ЭВОЛЮЦИЯ КИТАЙСКОЙ ИММИГРАЦИИ В США: ИСТОРИЧЕСКИЕ И СОВРЕМЕННЫЕ АСПЕКТЫ
Петровская Н. Е., Черных М. А., Вестник Российской академии наук 2025 Т. 95 № 7 С. 43–54
Статья посвящена эволюции китайской иммиграции в США в прошлом и в настоящее время. Определены внутренние и внешние факторы первой массовой волны китайской иммиграции, предложена авторская периодизация китайской иммиграции в США с учётом социальных, политических и экономических факторов. Выявлены особенности китайской иммиграции в разные периоды времени. Раскрыты, с одной стороны, черты антикитайского движения в США, с ...
Добавлено: 24 июня 2026 г.
Актуальная практика применения законодательства в сфере закупок (44-ФЗ и 223-ФЗ). Книга третья
М.: РГ-Пресс, 2026.
Настоящий сборник подготовлен юристами и экономистами, сотрудниками антимонопольных органов, научными работниками, профессионально занимающимися вопросами применения закупочного законодательства. Законодательство и практика приведены по состоянию на май 2026 г. с отдельными исключениями. Для бизнеса, государственных и муниципальных заказчиков, организаторов торгов, практикующих юристов, специалистов в сфере закупок, работников судов, антимонопольных и иных органов власти, научных работников, студентов и аспирантов образовательных ...
Добавлено: 23 июня 2026 г.
Искусственный интеллект как институциональный вызов: диагностика дисфункций системы образования и науки и возможные регуляторные ответы
Капитонов И. А., Москвитин О. А., Современное профессиональное образование 2026 № 5 С. 55–57
В статье рассматривается проблема институциональной неготовности российской системы образования и науки к массовому распространению генеративного искусственного интеллекта. Авторы фиксируют парадоксальную асимметрию: студенты и аспиранты активно применяют ИИ для делегирования текстопроизводства, тогда как научно-педагогические работники в большинстве своём не используют его как исследовательский инструмент. Показано, что в основе этой асимметрии лежит не «злой умысел» участников, а ...
Добавлено: 23 июня 2026 г.
Об отсутствии правовых оснований для включения в РНП участника закупки, занявшего второе место и реализовавшего свое право не заключать контракт после расторжения заказчиком контракта с победителем торгов
Москвитин О. А., Капитонов И. А., Корниенко А. С., Закон и власть 2026 № 5 С. 112–114
Включение информации о хозяйствующих субъектах, их руководителях и учредителях в реестр недобросовестных поставщиков (РНП) является одним из основных инструментов противодействия нарушениям при заключении и исполнении государственных контрактов и договоров по Федеральному закону № 44-ФЗ. При этом данная публичная санкция исключает (ограничивает) право поставщиков участвовать в соответствующих закупках на два года. Соответственно, споры о включении в ...
Добавлено: 23 июня 2026 г.
The state and prospects of using virtual reality technologies in sports: a brief review
Atlasov B., Сельский А. К., Russian Journal of Information Technology in Sports 2025 Vol. 2 No. 1 P. 13–21
В статье рассматривается текущее состояние глобального рынка технологий виртуальной и дополненной реальности (VR/AR) в спорте, отмечается его рост, хотя и более медленный, чем ожидалось ранее. Особое внимание уделено российскому рынку, где развитие VR-технологий в спорте отстает от мировых лидеров, таких как США, страны ЕС и Китай, но при этом имеет значительный потенциал для роста. Проведен ...
Добавлено: 23 июня 2026 г.
Тенденции и потенциал развития технологичных видов спорта в студенческой среде
Жданович Д. О., Сельский А. К., Троицкая Э. В. и др., Физическое воспитание и студенческий спорт 2024 Т. 3 № 2 С. 123–128
Развитие современных технологий ведет к трансформации всех сфер жизни общества, в том числе и спортивной. Одним из трендов последних лет стало появление и быстрое распространение высокотехнологичных (инновационных) видов спорта, где цифровые технологии плотно интегрированы в соревновательный процесс – таких как фиджитал-спорт (функционально-цифровой спорт), гонки дронов (беспилотных летательных аппаратов), спортивное программирование и другие. Эти виды спорта ...
Добавлено: 23 июня 2026 г.
Цифровая трансформация и инновационные технологии в спортивной индустрии: анализ глобальных тенденций и российских практик рынка спорттех
Сельский А. К., Российский журнал информационных технологий в спорте 2024 Т. 1 № 2 С. 34–45
В статье рассматривается термин «спорттех», обозначающий совокупность высокотехнологичных проектов в спортивной сфере. Проводится анализ текущего состояния и перспектив развития этого направления в мире и в России. В целях исследования проведено 202 структурированных интервью с представителями отрасли, проанализированы вторичные данные из открытых источников, российские практики сопоставлены с международными. Российский рынок спорттех представляет собой перспективное направление для ...
Добавлено: 23 июня 2026 г.
Нормативные изменения для цифровой трансформации государственного управления: пример физической культуры и спорта
Сельский А. К., Экономика и управление в спорте 2025 Т. 5 № 2 С. 159–178
В эпоху цифровой трансформации большое внимание уделяется внедрению современных технологий в государственном секторе, включая развитие электронного правительства и построение цифрового государственного управления. Важной составляющей здесь является нормативное регулирование, которое способно как ускорить процесс цифровизации, так и воспрепятствовать ему. В статье правовой аспект цифровой трансформации рассматривается на примере российской сферы физической культуры и спорта. Результаты анализа ...
Добавлено: 23 июня 2026 г.
Клиентоцентричность российских IT-компаний в условиях цифровой трансформации бизнеса
Староверова И. И., Черногорцева С. В., Снегирев А. Ю. и др., Российский журнал менеджмента 2026 Т. 24 № 1 С. 93–113
Цель исследования: определить ключевые элементы клиентоцентричного подхода в управлении российскими IT-компаниями в условиях цифровой трансформации бизнеса. Методология исследования: исследование основано на смешанной методологии, сочетающей количественные методы анализа больших данных (семантический анализ), качественные методы (глубинные экспертные интервью) и кабинетное исследование. Результаты исследования: определены десять тематических кластеров, которые описывают специфику клиентоцентричности российских IT-компаний. Выявлены особенности и недостатки практик количественного оценивания уровня клиентоцентричности, ...
Добавлено: 23 июня 2026 г.
Цифровая клиентоцентричность. Как современные технологии помогают компаниям и государству сделать шаг навстречу потребителям
Колбин Е. И., Кубанцева Е. В., Сельский А. К. и др., М.: ИСИЭЗ ВШЭ, 2026.
Монография представляет собой комплексное междисциплинарное исследование, посвященное концептуальному анализу клиентоцентричности, выявлению современных трендов и перспектив ее развития в условиях интенсивной цифровой трансформации. В книге представлен целостный взгляд на многообразную проблематику клиентоцентричности в корпоративном и государственном управлении с фокусом на современных технологиях. Монография основана на результатах масштабного исследования, сочетающего интеллектуальный анализ больших данных с качественным анализом экспертных ...
Добавлено: 23 июня 2026 г.
2025 9th International Conference on Information, Control, and Communication Technologies (ICCT-2025)
IEEE, 2026.
Добавлено: 23 июня 2026 г.
Proceedings of the 4th Workshop on NLP for Music and Audio (NLP4MusA 2026)
Бузаев Ф. А., Mullakhmetov R., Bogachev R. и др., Association for Computational Linguistics, 2026.
Добавлено: 22 июня 2026 г.
XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025)
СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025.
Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием КИИ-2025 продолжает традицию советских (российских) конференций, организуемых Российской ассоциацией искусственного интеллекта. В первом томе трудов публикуются пленарные доклады и доклады участников конференции, представленные на следующих секциях: Секция 1 «Инженерия знаний», Секция 2 «Интеллектуальный анализ данных», Секция 3 «Моделирование рассуждений», Секция 4 «Интеллектуальный анализ текстов, большие ...
Добавлено: 15 февраля 2026 г.
Generating and Debugging Java Code using LLMs based on Associative Recurrent Memory
Василевский В. И., Александров Д. В., Proceedings of the Institute for System Programming of the RAS 2025 Vol. 37 No. 5 P. 173–182
Автоматическая генерация кода большими языковыми моделями (LLM) достигла значительных успехов, однако все еще сталкивается с проблемами при работе со сложными и объемными кодовыми базами, особенно на таких языках, как Java. Ограничения контекстного окна LLM и сложность отладки сгенерированного кода являются ключевыми препятствиями. В данной статье представлен подход, направленный на улучшение генерации и отладки Java-кода. Мы ...
Добавлено: 26 декабря 2025 г.
Искусственный интеллект как симулякр смысла
Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173
В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...
Добавлено: 7 декабря 2025 г.
SIGNAL: Dataset for Semantic and Inferred Grammar Neurological Analysis of Language
Комиссаренко А. А., Voloshina E., Чевелева А. Н. и др., Scientific data 2025 Vol. 12 No. 1 Article 1687
Добавлено: 18 ноября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору