• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Использование вероятностного распределения над множеством классов в задаче классификации арабских диалектов
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
24 июня 2026 г.
Древняя чашекрания - новый вид брахиопод с необычной формой раковины и образом жизни
Российские ученые из Высшей школы экономики, МГУ имени М.В. Ломоносова и Таллинского технического университета изучили ископаемый вид древних брахиопод (плеченогих), который обитал в теплом море на севере современной Эстонии более 445 миллионов лет назад. Древняя брахиопода росла в форме чашки со «шляпкой», чтобы защититься от зарастания. Исследование опубликовано в журнале Palaeogeography, Palaeoclimatology, Palaeoecology.
23 июня 2026 г.
<a><a><a>НИУ ВШЭ и Positive Technologies наградили проекты молодых ученых по оценке последствий кибератак
Молодые исследователи из ведущих вузов страны представили проекты по прогнозированию и оценке последствий кибератак. Защита идей прошла 22 июня в Москве в рамках междисциплинарного научного конкурса, организованного Институтом мировой военной экономики и стратегии НИУ ВШЭ и Positive Technologies. Победителями стали команды Военно-космической академии имени Можайского, НИУ ВШЭ и университета «Сириус» — они разделят грантовый фонд в три миллиона рублей и продолжат свои разработки под руководством научных наставников.
23 июня 2026 г.
Дрожь земли: ученые ВШЭ научились отслеживать опасные подземные вибрации в реальном времени
Исследователи из МИЭМ ВШЭ и ИПКОН РАН разработали новую математическую модель мониторинга, которая позволяет фиксировать источник опасных подземных вибраций в реальном времени. Технология поможет снизить риск повреждения зданий, дорог и другой инфраструктуры рядом с карьерами и шахтами. Работа ученых опубликована в журнале «Горная промышленность».

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Использование вероятностного распределения над множеством классов в задаче классификации арабских диалектов

Научно-технический вестник информационных технологий, механики и оптики. 2017. № 1(107). С. 110–116.
Дурандин О. В., Золотых Н. Ю., Хилал Н. Р., Стребков Д. Ю.

Предмет исследования. Предложен подход к решению задачи классификации, использующий информацию о распределении вероятностей на множестве классов в обучающей выборке. Алгоритм проиллюстрирован на одной из сложных задач автоматической обработки текстов на естественном языке – классификации арабских диалектов. Метод.Каждому объекту обучающей выборки сопоставляется распределение вероятностей над метками классов, вместо сопоставления единственной метки класса. Предлагаемый подход решает задачу с учетом распределения вероятностей над множеством классов для повышения качественных показателей работы классификатора. Основные результаты. Предложенный подход проиллюстрирован на примере задачи классификации арабских диалектов. Анализируемые данные,содержащие слова-метки,получены из социальной сети Twitter, относящиеся к шести арабским диалектам: саудовский, левантийский, алжирский, египетский, иракский, иорданский; использованы также сообщения на современном стандартном арабском языке (MSA). Показан рост качества классификации при учете вероятностного распределения над множеством классов в обучающей выборке. Показано, что даже относительно простой учет вероятностного распределения увеличивает точность предсказания с 44% до 67%. Практическая значимость.Предложенный подход и соответствующий алгоритм могут найти применение в случае, когда разметка данных экспертом требует значительных временных и финансовых ресурсов, но имеется возможность разработки эвристических правил. Реализация предложенного алгоритма позволит снизить затраты при подготовке данных без значительной потери точности классификации.

Научное направление: Компьютерные науки Математика Филология и лингвистика
Приоритетные направления: компьютерно-математическое математика
Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: аннотацияautomatic classificationавтоматическая классификацияклассификация текстовannotationclustering and classificationкластеризация и классификацияtext classification диалекты арабского языкаArabic dialects
Похожие публикации
Open r-spin theory II: The analogue of Witten's conjecture for r-spin disks
Буряк А. Ю., Clader E., Tessler R., Journal of Differential Geometry 2024 Vol. 128 No. 1 P. 1–75
Добавлено: 23 июня 2026 г.
Tautological relations and integrable systems
Буряк А. Ю., Shadrin S., Epijournal de Geometrie Algebrique 2024 Vol. 8
Добавлено: 23 июня 2026 г.
Counting meromorphic differentials on $CP^1$
Буряк А. Ю., Rossi P., Letters in Mathematical Physics 2024 Vol. 114 Article 97
Добавлено: 23 июня 2026 г.
Moduli spaces of residueless meromorphic differentials and the KP hierarchy
Буряк А. Ю., Rossi P., Zvonkine D., Geometry and Topology 2024 Vol. 28 P. 2793–2824
We prove that the cohomology classes of the moduli spaces of residueless meromorphic differentials, ie the closures, in the moduli space of stable curves, of the loci of smooth curves whose marked points are the zeros and poles of prescribed orders of a meromorphic differential with vanishing residues, form a partial cohomological field theory (CohFT) of ...
Добавлено: 23 июня 2026 г.
DR-иерархии: от пространств модулей кривых к интегрируемым системам
Буряк А. Ю., Труды Математического института им. В.А. Стеклова РАН 2024 Т. 325 С. 26–66
Основная цель работы -- показать, что DR-иерархии, введенные автором в более ранней работе, позволяют наиболее ясно установить связь между топологией компактификации Делиня-Мамфорда пространства модулей гладких алгебраических кривых рода g с n отмеченными точками и интегрируемыми системами математической физики. Также обсуждается перспективный подход, даваемый теорией DR-иерархий, к решению общей проблемы в области гипотез виттеновского типа, а именно к доказательству существования иерархии Дубровина-Чжана ...
Добавлено: 23 июня 2026 г.
Growth in noncommutative algebras and entropy in derived categories
Пионтковский Д. И., / Series arXiv "math". 2026.
Добавлено: 23 июня 2026 г.
Multilinear nilalgebras and the Jacobian theorem
Пионтковский Д. И., / Series arXiv "math". 2025.
Добавлено: 23 июня 2026 г.
The state and prospects of using virtual reality technologies in sports: a brief review
Atlasov B., Сельский А. К., Russian Journal of Information Technology in Sports 2025 Vol. 2 No. 1 P. 13–21
В статье рассматривается текущее состояние глобального рынка технологий виртуальной и дополненной реальности (VR/AR) в спорте, отмечается его рост, хотя и более медленный, чем ожидалось ранее. Особое внимание уделено российскому рынку, где развитие VR-технологий в спорте отстает от мировых лидеров, таких как США, страны ЕС и Китай, но при этом имеет значительный потенциал для роста. Проведен ...
Добавлено: 23 июня 2026 г.
Алжирская война и французская литература: случай Жоржа Перека
Кириченко В. В., Практики и интерпретации: журнал филологических, образовательных и культурных исследований, Россия 2026 Т. 11 № 1 С. 66–91
Статья посвящена малоизученному аспекту творчества французского писателя Жоржа Перека – влиянию Алжирской войны (1954–1962) на его литературное наследие. Несмотря на почти полное отсутствие прямых упоминаний войны в произведениях Перека, травматический исторический контекст значим для понимания тематики, структуры и стиля его текстов. Основное внимание уделяется анализу таких произведений, как «Вещи» (1965), «Что это за маленький мопед...» ...
Добавлено: 23 июня 2026 г.
Тезисы докладов Пятнадцатых Шмелёвских чтений
М.: Институт русского языка им. В.В. Виноградова РАН, 2026.
Сборник тезисов Пятнадцатых Шмелёвских чтений (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева) Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности. Охватывает разные аспекты современной русистики: от исторической лексикологии до современных трансформаций прагматики и семантики слов. ...
Добавлено: 23 июня 2026 г.
2025 9th International Conference on Information, Control, and Communication Technologies (ICCT-2025)
IEEE, 2026.
Добавлено: 23 июня 2026 г.
Proceedings of the 4th Workshop on NLP for Music and Audio (NLP4MusA 2026)
Бузаев Ф. А., Mullakhmetov R., Bogachev R. и др., Association for Computational Linguistics, 2026.
Добавлено: 22 июня 2026 г.
Кумранская версия текста одного библейского отрывка (Ис 42:1–9)
Битнер К. А., Индоевропейское языкознание и классическая филология 2025 Т. 29 № 1 С. 180–195
Статья посвящена интерпретации нескольких наиболее важных вариантов текста Ис 42:1–9, которые встречаются в Большом свитке Исайи (1QIsaa ), обнаруженном в Кумране. Данная рукопись является старейшим свидетельством древнееврейского текста библейской книги Исайи, датируется второй половиной II в. до н. э. В статье демонстрируется, что в большинстве случаев причиной появления разночтений являлась редакторская деятельность писца свитка. ...
Добавлено: 22 июня 2026 г.
Zα and Zβ Localize ADAR1 to Flipons That Modulate Innate Immunity, Alternative Splicing, and Nonsynonymous RNA Editing
Herbert A., Cherednichenko O., Lybrand T. и др., International Journal of Molecular Sciences 2025 Vol. 26 No. 6 Article 2422
Добавлено: 22 июня 2026 г.
Интерпретация эпиклезы византийской литургии в «Евхологии» Жака Гоара (1647)
Бернацкий М. М., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2026 № 83 С. 81–100
В публикации представлен комментированный перевод c латинского заметок Жака Гоара к тексту эпиклезы из его «Евхология» (1647). Перевод предваряется вступительной статьей, помещающей текст Гоара в историко-литературный контекст, связанный с греко-латинскими спорами о времени освящения даров, ключевым моментом которых стала полемика об эпиклезе на Флорентийском соборе 1439 г. Комментарии Гоара построены на основе итогов флорентийских дебатов, ...
Добавлено: 21 июня 2026 г.
Международная конференция «Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологи- ях искусственного интеллекта», приуроченная к 205-й годовщине со дня его рождения» : Материалы конференции. / (Обнинск, 14–16 мая 2026 г.): Материалы конференции. Под ред. акад. В.Б. Бетелина. — Калуга: Калужский печатный двор, 2026. — 232 с.
Калужский печатный двор, 2026.
Сборник трудов конференции "Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологиях искусственного интеллекта» ...
Добавлено: 20 июня 2026 г.
Численное решение уравнений Блэка–Шоулза и конвекции-диффузии с определением положения свободной границы
Джанбекова А. Р., Шведов А. С., Математическое моделирование 2026 Т. 38 № 3 С. 159–176
Краевые задачи для уравнения Блэка–Шоулза с частными производными, описывающего стоимость финансового инструмента, могут содержать условие на свободной границе, если предусмотрена возможность раннего исполнения финансового инструмента. В настоящей статье рассматриваются краевые задачи со свободной границей для уравнения Блэка–Шоулза и уравнения конвекции-диффузии. Для уравнения конвекции-диффузии представлена разностная схема, являющаяся обобщением известной разностной схемы второго порядка точности на ...
Добавлено: 20 июня 2026 г.
ИНТЕГРАЦИЯ ТЕХНОЛОГИИ ГЕНЕРАТИВНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ОБРАЗОВАТЕЛЬНЫЙ ВИДЕОКОНТЕНТ
Стогниева О. Н., Чеснокова Н. Е., Отечественная и зарубежная педагогика 2026 Т. 1 № 3 (115) С. 123–131
Внедрение генеративных инструментов искусственного интеллекта в образовательную практику актуализирует проблему педагогически обоснованного использования данных технологий при создании образовательного видеоконтента, который всё чаще применяется в языковом и профессионально-ориентированном обучении. Цель статьи — провести сравнительный анализ образовательного видеоконтента, созданного с применением генеративных ИИ-инструментов, с позиций теории когнитивной нагрузки и принципов педагогического дизайна, а также выявить дидактические условия повышения ...
Добавлено: 20 июня 2026 г.
Strong Approximations for Markov Chains Weakly Converging to Diffusions
Конаков В. Д., Кучер Д. А., Mammen E., / Series arXiv "math". 2026. No. 2606.11142v1.
Добавлено: 11 июня 2026 г.
ML-based Fast Simulation of FARICH Responses
Шипилов Ф. А., Barnyakov A., Ivanov A. и др., / Series Physics "arxiv.org". 2026.
Добавлено: 19 мая 2026 г.
Bifurcations and Structural Stability of Generic PC-HC Families
Доровский А. А., / Series arXiv "math". 2026.
Добавлено: 14 мая 2026 г.
On the minimum number of maximal distance-k independent sets in trees
Талецкий Д. С., / Series arXiv "math". 2026.
Добавлено: 1 мая 2026 г.
On Arithmetic Mirror Symmetry for smooth Fano fourfolds
Овчаренко М. А., / Series arXiv "math". 2026.
Добавлено: 30 апреля 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору