• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Application of NLP Algorithms: Automatic Text Classifier Tool
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Application of NLP Algorithms: Automatic Text Classifier Tool

P. 310–323.
Романов А. Ю., Ekaterina Kozlova, Lomotin Konstantin
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: text analysisnatural language processingdecision treesupport vector machinessupervised learningMultilayer perceptronboostingdecision support system

В книге

Digital Transformation and Global Society. Third International Conference, DTGS 2018, St. Petersburg, Russia, 2018, Revised Selected Papers. Part II. Communications in Computer and Information Science 859
Issue 859. , Springer, 2018.
Похожие публикации
Перспективы медиа-мониторинга в исследованиях общественного мнения (на примере доверия президенту)
Анкудинов И. А., Социология: методология, методы, математическое моделирование 2025 № 61 С. 165–203
Изменчивые политические настроения россиян — постоянный предмет интереса социологических фондов. С развитием интернета привычные анкетные исследования стали дополняться онлайн-опросами и, несмотря на некоторый скепсис, «майнингом» социальных сетей. В настоящей статье предпринимается попытка скорректировать стихийную интернет-выборку так, чтобы приблизить ее оценки к репрезентативным омнибусам. Мы используем показатели доверия Президенту РФ в сети и в опросах с ...
Добавлено: 22 апреля 2026 г.
Алгоритм анализа новостной информации для принятия экономических решений
Раменская А. В., Чудинова О. С., Первицкая Л. А., Индустриальная экономика 2026 № 1 С. 65–78
Статья посвящена разработке алгоритма анализа новостной информации методами машинного обучения, реализованными в библиотеках Python. Обоснование выбора инструментов, применяемых на каждом этапе алгоритма, осуществляется с помощью расчета метрик качества решения соответствующих задач машинного обучения. Результаты работы алгоритма представлены классификацией региональных новостей, собранных за период с августа 2024 года по июнь 2025 года, по отраслям экономики и ...
Добавлено: 20 апреля 2026 г.
RuCLEVR: A Russian Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning
Biryukova K., Chelnokova D., Erkenova J. и др., Communications in Computer and Information Science 2024 Vol. 2364 CCIS P. 109 – 121
Добавлено: 25 февраля 2026 г.
Объективация болезни: феномен реификации в цифровой психиатрии
Углева А. В., Вопросы философии 2025 № 11 С. 112–123
Статья посвящена феномену реификации в цифровой психиатрии. Автор обращает внимание на то, что технологии ИИ усугубляют проблему перевода сложных культурно обусловленных психиатрических конструктов в формально-математические структуры, ведущие к созданию иллюзии объективности и препятствующие развитию персонифицированной медицинской помощи в этой области медицины. Основная цель статьи заключается в минимизации негативных последствий применения ИИ, способных нанести ущерб лицам ...
Добавлено: 6 ноября 2025 г.
Phase probabilities in first-order transitions using machine learning
Суховерхова Д. Д., Vyacheslav Mozolenko, Щур Л. Н., Physical Review E - Statistical, Nonlinear, and Soft Matter Physics 2025 Vol. 112 No. 4 Article 044128
Добавлено: 18 октября 2025 г.
The Impact of Alternative Data on Default Probability: Analyzing the Italian E-commerce Sector with NLP and Network Structures
Bernhardt B. D., Marciano C., Гуаррачино М. Р., Operations Research Forum 2025 Vol. 6 Article 47
Добавлено: 6 сентября 2025 г.
Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions
Чепиков И. А., Карпов И. А., , in: 26th International Conference, AIED 2025, Palermo, Italy, July 22–26, 2025, Proceedings, Part I. Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.
Добавлено: 4 сентября 2025 г.
Юсуф-Ходжа и его братья: О родстве Афанасия Никитина
Лифшиц А. Л., Slovĕne 2025 Т. 14 № 1 С. 300–312
В статье рассматриваются те эпизоды из записок Афанасия Никитина, которые позволяют усомниться в его купеческом статусе. На основании анализа грамматики, лексики и прагматики сообщений Афанасия делаются выводы, что по Волге и далее он путешествовал как глава небольшого сообщества людей и что он отличался от своих спутников по рангу. Подтверждаются предположения А. Г. Боброва, что Афанасий ...
Добавлено: 3 сентября 2025 г.
Predicting Systemic Risk in the Russian Financial Sector with Boosting Techniques
Щепелева М. А., Procedia Computer Science 2024 Vol. 242 P. 51–56
Добавлено: 17 июня 2025 г.
Automatic Morpheme Segmentation for Russian: Can an Algorithm Replace Experts?
Morozov D., Garipov T., Ляшевская О. Н. и др., Journal of Language and Education 2024 Vol. 10 No. 4 P. 71–84
Introduction: Numerous algorithms have been proposed for the task of automatic morpheme segmentation of Russian words. Due to the differences in task formulation and datasets utilized, comparing the quality of these algorithms is challenging. It is unclear whether the errors in the models are due to the ineffectiveness of algorithms themselves or to errors and inconsistencies ...
Добавлено: 7 января 2025 г.
Latent heat estimation with machine learning
Суховерхова Д. Д., Мозоленко В. К., Щур Л. Н., / Series arXiv "math". 2024. No. 2411.00733.
Добавлено: 4 ноября 2024 г.
Semantic Text Analysis Using Artificial Neural Networks Based on Neural-Like Elements with Temporal Signal Summation
Kharlamov Alexander, Eugeny S., Kuznetsov D. и др., Problems of Artificial Intelligence 2023 No. 3(30) P. 4–27
Текст как изображение анализируется в зрительном анализаторе человека. При этом изображение сканируется по точкам наибольшей информативности, которые являются перегибами контуров эквитекстурных областей, на которые грубо разбивается изображение. В случае анализа текста таким образом анализируются отдельные символы алфавита. Далее текст анализируется как повторяющиеся элементы языка различной сложности. Формируются словари уровнеобразующих элементов различной сложности, вершиной которых является ...
Добавлено: 20 октября 2024 г.
Cross-country analysis of science, technology and innovation policies: non-covid-19 related and Covid-19 specific STI policies in OECD countries
Russo M., Pavone P., Майснер Д. и др., Quality and Quantity 2025 Vol. 59 No. Suppl 1 P. S343–S367
In OECD countries, Science, Technology and Innovation (STI) policies were seen as key aspects of coping with the Covid-19 pandemic. Now that the pandemic is over, identifying which policy mix portfolios characterised countries in terms of their non-Covid-19 related and Covid-19 specific STI policies fills a knowledge gap on changes in STI policies induced by ...
Добавлено: 27 сентября 2024 г.
Parameter-Efficient Tuning of Transformer Models for Anglicism Detection and Substitution in Russian
Daniil Lukichev, Kryanina Darya, Anastasia Bystrova и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Вып. 22.Вып. 22.: [б.и.], 2023. P. 295–306.
Добавлено: 25 апреля 2024 г.
Системы поддержки принятия решений: учебник и практикум для вузов. 2-е издание, переработанное и дополненное
Кравченко Т. К., Исаев Д. В., Юрайт, 2024.
В учебнике рассматриваются вопросы информатизации процессов принятия решений: постановка задачи, типовые этапы, подходы к моделированию условий при­нятия решений, а также последствий выбора различных вариантов. Рассматривается роль экспертных оценок, которые используются: для определе­ния вероятностей возникновения проблемных ситуаций; определения коэффициен­тов компетентности экспертов, оценивающих альтернативы; формирования оценок рассматриваемых альтернатив. Выделяются особенности принятия групповых решений. Особое внимание уделено поддержке принятия решений на ...
Добавлено: 14 апреля 2024 г.
Machine learning approach for scientific and technical expertise
A. V. Belov, E. A. Egorova, Bulletin D. Serikbayev East Kazakhstan Technical University 2023 No. 4 P. 92–102
Добавлено: 9 марта 2024 г.
Use of Text Skeleton Structures for the Development of Semantic Search Methods
A. V. Mylnikova, V. A. Trusov, L. A. Mylnikov, Automatic Documentation and Mathematical Linguistics 2023 Vol. 57 No. 5 P. 301–307
This paper considers the problem of the generation of descriptors to reduce data volumes, text data resources, and search times through the use of the new factors of authorship, region, emotive meaning, and popularity, as well as a text category without special marks that can be used to generate descriptors. This approach allows the use ...
Добавлено: 29 февраля 2024 г.
Explainable Document Classification via Pattern Structures
Sergei O. Kuznetsov, Паракал Э. Д., Lecture Notes in Networks and Systems 2023 Vol. 776 P. 423–434
Добавлено: 5 февраля 2024 г.
Business Process Management Workshops. BPM 2023 International Workshops, Utrecht, The Netherlands, September 11–15, 2023, Revised Selected Papers
Switzerland: Springer, 2024.
Добавлено: 17 января 2024 г.
Проект Chekhov Digital: задачи и проблемы реализации семантической разметки текстов (на примере рассказа А. П. Чехова «Смерть чиновника»)
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211–222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
РАЗРАБОТКА СИСТЕМЫ ГЕНЕРАЦИИ ПОВСЕДНЕВНЫХ ДИАЛОГОВ НА РУССКОМ ЯЗЫКЕ: ПИЛОТНОЕ ИССЛЕДОВАНИЕ
Кругликова В. Г., В кн.: Анализ речи: теоретические и прикладные аспекты: сборник научных статей.: [б.и.], 2023.
В статье представлен сравнительный анализ различных языковых моделей, используемых для генерации текстов, и произведена оценка их эффективности для задачи генерации диалоговой речи. В сравнительном анализе участвуют модели GPT-3, BERT, LSTM. Данное исследование является частью проекта по разработке системы генерации диалогов на русском языке. В работе также описана архитектура разрабатываемой системы и предложены примеры её использования. ...
Добавлено: 10 декабря 2023 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору