• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
24 июня 2026 г.
Древняя чашекрания - новый вид брахиопод с необычной формой раковины и образом жизни
Российские ученые из Высшей школы экономики, МГУ имени М.В. Ломоносова и Таллинского технического университета изучили ископаемый вид древних брахиопод (плеченогих), который обитал в теплом море на севере современной Эстонии более 445 миллионов лет назад. Древняя брахиопода росла в форме чашки со «шляпкой», чтобы защититься от зарастания. Исследование опубликовано в журнале Palaeogeography, Palaeoclimatology, Palaeoecology.
23 июня 2026 г.
<a><a><a>НИУ ВШЭ и Positive Technologies наградили проекты молодых ученых по оценке последствий кибератак
Молодые исследователи из ведущих вузов страны представили проекты по прогнозированию и оценке последствий кибератак. Защита идей прошла 22 июня в Москве в рамках междисциплинарного научного конкурса, организованного Институтом мировой военной экономики и стратегии НИУ ВШЭ и Positive Technologies. Победителями стали команды Военно-космической академии имени Можайского, НИУ ВШЭ и университета «Сириус» — они разделят грантовый фонд в три миллиона рублей и продолжат свои разработки под руководством научных наставников.
23 июня 2026 г.
Дрожь земли: ученые ВШЭ научились отслеживать опасные подземные вибрации в реальном времени
Исследователи из МИЭМ ВШЭ и ИПКОН РАН разработали новую математическую модель мониторинга, которая позволяет фиксировать источник опасных подземных вибраций в реальном времени. Технология поможет снизить риск повреждения зданий, дорог и другой инфраструктуры рядом с карьерами и шахтами. Работа ученых опубликована в журнале «Горная промышленность».

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)

Научно-техническая информация. Серия 2: Информационные процессы и системы. 2025. № 8. С. 27–36.
Грозовский Ф. М., Логинова И. В.

Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической готовности составила 84–85%, что сопоставимо с аналогичными результатами в других, менее специализированных задачах.

Научное направление: Компьютерные науки Экономика и менеджмент
Язык: русский
Полный текст
DOI
Ключевые слова: автоматизацияизвлечение информациитекстовые данныевеб-скрейпингБольшие языковые модели (LLMs)уровень готовности технологий (TRL)
Похожие публикации
Mapping research on competency management in the age of AI: a bibliometric and systematic review
Асемота М. О., Journal of Organizational Effectiveness 2026 P. 1–26
Добавлено: 22 июня 2026 г.
Миссия-ориентированные инновации в Японии: сравнительный анализ научно-исследовательских партнерств
Брамбила Мартинес Ф. Х., Грибкова Д. Е., Проблемы Дальнего Востока 2026 № 3 С. 123–139
Современные исследования японской научно-технической политики фокусируются на ограничениях государственных инициатив в преодолении стагнации национального развития, но упускают из виду уникальные институциональные и политические особенности взаимодействия государственного и частного секторов. Это ограничивает понимание механизмов управления, ориентированных на спрос. Представленное исследование предлагает комплексный сравнительный анализ японских крупно- и среднемасштабных научно-исследовательских партнерств, их эволюции, структурных особенностей и результатов ...
Добавлено: 22 июня 2026 г.
Zα and Zβ Localize ADAR1 to Flipons That Modulate Innate Immunity, Alternative Splicing, and Nonsynonymous RNA Editing
Herbert A., Cherednichenko O., Lybrand T. и др., International Journal of Molecular Sciences 2025 Vol. 26 No. 6 Article 2422
Добавлено: 22 июня 2026 г.
Квазинезависимые директора в российских публичных компаниях: постановка проблемы и оценка ее масштаба
Муравьев А. А., Камбаралиева К. М., Экономическая политика 2026 Т. 21 № 3 С. 112–151
Количество/доля независимых директоров — ключевая характеристика совета директоров, регулируемая в большинстве юрисдикций. С концептуальной точки зрения независимыми являются директора, не имеющие (помимо членства в совете директоров) никаких отношений с компанией, ее акционерами и контрагентами. На практике концепция независимости представляет собой перечень запретов — требований к тому, кем независимый директор не может быть, и этот перечень, ...
Добавлено: 21 июня 2026 г.
Международная конференция «Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологи- ях искусственного интеллекта», приуроченная к 205-й годовщине со дня его рождения» : Материалы конференции. / (Обнинск, 14–16 мая 2026 г.): Материалы конференции. Под ред. акад. В.Б. Бетелина. — Калуга: Калужский печатный двор, 2026. — 232 с.
Калужский печатный двор, 2026.
Сборник трудов конференции "Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологиях искусственного интеллекта» ...
Добавлено: 20 июня 2026 г.
ИНТЕГРАЦИЯ ТЕХНОЛОГИИ ГЕНЕРАТИВНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ОБРАЗОВАТЕЛЬНЫЙ ВИДЕОКОНТЕНТ
Стогниева О. Н., Чеснокова Н. Е., Отечественная и зарубежная педагогика 2026 Т. 1 № 3 (115) С. 123–131
Внедрение генеративных инструментов искусственного интеллекта в образовательную практику актуализирует проблему педагогически обоснованного использования данных технологий при создании образовательного видеоконтента, который всё чаще применяется в языковом и профессионально-ориентированном обучении. Цель статьи — провести сравнительный анализ образовательного видеоконтента, созданного с применением генеративных ИИ-инструментов, с позиций теории когнитивной нагрузки и принципов педагогического дизайна, а также выявить дидактические условия повышения ...
Добавлено: 20 июня 2026 г.
Benchmarking DNA large language models on quadruplexes
Cherednichenko O., Herbert A., Попцова М. С., Computational and Structural Biotechnology Journal 2025 Vol. 27 P. 992–1000
Добавлено: 19 июня 2026 г.
Kolmogorov–Arnold networks for genomic tasks
Попцова М. С., Briefings in Bioinformatics 2025 Vol. 26 No. 2 P. 1–11
Добавлено: 19 июня 2026 г.
Рейтинги ответственного бизнеса: особенности и тенденции развития
Вукович Н. А., Аверина А. О., Стефанова К. А., Анализ и прогноз. Журнал ИМЭМО РАН 2026 № 1 С. 26–39
Ответственное ведение бизнеса и политика в области охраны окружающей среды, социальной защиты и управления (environmental, social, governance – ESG) играют решающую роль в продвижении глобальной повестки в области устойчивого развития. Поскольку компании по всему миру интегрируют устойчивое развитие в свои стратегические рамки, рейтинги ESG служат ключевыми инструментами для оценки корпоративной ответственности и принятия инвестиционных решений. ...
Добавлено: 19 июня 2026 г.
Графовые паттерны в несогласованных декларативных моделях процессов
Анненков А. Н., Нестеров Р. А., Моделирование и анализ информационных систем 2026 Т. 33 № 2 С. 176–205
Декларативные модели процессов широко используются в process mining для гибкого описания поведения процессов с помощью наборов ограничений. Однако модели, автоматически извлекаемые из журналов событий, могут содержать несогласованные ограничения, что затрудняет их интерпретацию и делает их непригодными для исполнения, проверки соответствия или дальнейшего анализа. Существующие методы анализа согласованности либо опираются на автоматные конструкции с высокой асимптотической сложностью ...
Добавлено: 18 июня 2026 г.
Advances in Information Retrieval: 48th European Conference on Information Retrieval, ECIR 2026, Delft, The Netherlands, March 29 – April 2, 2026, Proceedings, Part II. (LNCS, volume 16484)
Cham: Springer Publishing Company, 2026.
Добавлено: 18 июня 2026 г.
Искусственный интеллект как роза научной деятельности: исследование Тимоти Гауэрса
Поддьяков А. Н., Троицкий вариант. Наука 2026 № 12 С. 24–25
В научно-популярной заметке представлен обзор содержания поста филдсовского медалиста Тимоти Гауэрса о возможностях ИИ в математике и содержания комментариев под постом. Обзор сделан в основном чат-ботом DeepSeek. В заключение обсуждается возможность не только решения задач искусственным интеллектом, но и их постановки. ...
Добавлено: 18 июня 2026 г.
Exploring New Frontiers in Vertical Federated Learning: the Role of Saddle Point Reformulation
Beznosikov A., Kormakov G., Grigorievskiy A. и др., Journal of Optimization Theory and Applications 2026 Vol. 209 Article 18
Добавлено: 17 июня 2026 г.
Санкционная политика США и ее влияние на Экономическое развитие Китая
Воронина В., Ткачук А. Р., Финансовый менеджмент 2026 № 5 С. 128–134
В статье рассматривается влияние санкционных и торгово-экономических ограничений, введённых США в период администрации Дональда Трампа, на макроэкономическую динамику Китая и изменение его позиции в мировой экономике. Цель исследования состоит в оценке того, как внешнее давление отразилось на темпах роста валового внутреннего продукта, внешней торговле и инвестиционной активности, а также в выявлении изменений в экономической стратегии ...
Добавлено: 17 июня 2026 г.
Acting as Scientists under Uncertainty: Founder Resilience, Scientific Decision-Making, and New Venture Performance across Economies
Shirokova Galina, Veksler Kseniia, Dvorkina Daria и др., International Entrepreneurship and Management Journal 2026 Vol. 22 No. 3 Article 106
Добавлено: 17 июня 2026 г.
Supervised Learning in Critical Phenomena—Statistical and Systematic Accuracy
Chertenkov V. I., Щур Л. Н., Lobachevskii Journal of Mathematics 2026 Vol. 47 No. 2 P. 720–727
Добавлено: 16 июня 2026 г.
Enhancing Emotion Recognition in Speech Based on Self-Supervised Learning: Cross-Attention Fusion of Acoustic and Semantic Features
Deeb B., Andrey V. Savchenko, Макаров И. А., IEEE Access 2026 Vol. 13 P. 56283–56295
Добавлено: 16 июня 2026 г.
Automated detection of wolf howls using audio spectrogram transformers
Makarov N., Савченко А. В., Zemtsova I. и др., Scientific Reports 2025 Vol. 15 Article 26641
Добавлено: 16 июня 2026 г.
XXII национальная конференция по искусственному интеллекту с международным участием (КИИ-2025)
СПб.: Санкт-Петербургский Федеральный исследовательский центр РАН, 2025.
Двадцать вторая Национальная конференция по искусственному интеллекту с международным участием КИИ-2025 продолжает традицию советских (российских) конференций, организуемых Российской ассоциацией искусственного интеллекта. В первом томе трудов публикуются пленарные доклады и доклады участников конференции, представленные на следующих секциях: Секция 1 «Инженерия знаний», Секция 2 «Интеллектуальный анализ данных», Секция 3 «Моделирование рассуждений», Секция 4 «Интеллектуальный анализ текстов, большие ...
Добавлено: 15 февраля 2026 г.
Generating and Debugging Java Code using LLMs based on Associative Recurrent Memory
Василевский В. И., Александров Д. В., Proceedings of the Institute for System Programming of the RAS 2025 Vol. 37 No. 5 P. 173–182
Автоматическая генерация кода большими языковыми моделями (LLM) достигла значительных успехов, однако все еще сталкивается с проблемами при работе со сложными и объемными кодовыми базами, особенно на таких языках, как Java. Ограничения контекстного окна LLM и сложность отладки сгенерированного кода являются ключевыми препятствиями. В данной статье представлен подход, направленный на улучшение генерации и отладки Java-кода. Мы ...
Добавлено: 26 декабря 2025 г.
Искусственный интеллект как симулякр смысла
Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173
В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...
Добавлено: 7 декабря 2025 г.
SIGNAL: Dataset for Semantic and Inferred Grammar Neurological Analysis of Language
Комиссаренко А. А., Voloshina E., Чевелева А. Н. и др., Scientific data 2025 Vol. 12 No. 1 Article 1687
Добавлено: 18 ноября 2025 г.
MADD: Multi-Agent Drug Discovery Orchestra
Solovev G. V., Zhidkovskaya A. B., Orlova A. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. Ch. 367 P. 6956–6998.
Добавлено: 16 ноября 2025 г.
3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark
Sviridov I., Miftakhova A., Tereshchenko A. и др., , in: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP).: Association for Computational Linguistics, 2025. Ch. 1353 P. 26625–26665.
Добавлено: 16 ноября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору