Использование вероятностного распределения над множеством классов в задаче классификации арабских диалектов

О. В. Дурандин; Н. Ю. Золотых; Хилал Н. Р.; Стребков Д. Ю.

doi:10.17586/2226-1494-2017-17-1-110-116

Публикации

?

Использование вероятностного распределения над множеством классов в задаче классификации арабских диалектов

Научно-технический вестник информационных технологий, механики и оптики. 2017. № 1(107). С. 110–116.

Дурандин О. В., Золотых Н. Ю., Хилал Н. Р., Стребков Д. Ю.

Предмет исследования. Предложен подход к решению задачи классификации, использующий информацию о распределении вероятностей на множестве классов в обучающей выборке. Алгоритм проиллюстрирован на одной из сложных задач автоматической обработки текстов на естественном языке – классификации арабских диалектов. Метод.Каждому объекту обучающей выборки сопоставляется распределение вероятностей над метками классов, вместо сопоставления единственной метки класса. Предлагаемый подход решает задачу с учетом распределения вероятностей над множеством классов для повышения качественных показателей работы классификатора. Основные результаты. Предложенный подход проиллюстрирован на примере задачи классификации арабских диалектов. Анализируемые данные,содержащие слова-метки,получены из социальной сети Twitter, относящиеся к шести арабским диалектам: саудовский, левантийский, алжирский, египетский, иракский, иорданский; использованы также сообщения на современном стандартном арабском языке (MSA). Показан рост качества классификации при учете вероятностного распределения над множеством классов в обучающей выборке. Показано, что даже относительно простой учет вероятностного распределения увеличивает точность предсказания с 44% до 67%. Практическая значимость.Предложенный подход и соответствующий алгоритм могут найти применение в случае, когда разметка данных экспертом требует значительных временных и финансовых ресурсов, но имеется возможность разработки эвристических правил. Реализация предложенного алгоритма позволит снизить затраты при подготовке данных без значительной потери точности классификации.

Научное направление: Компьютерные науки Математика Филология и лингвистика

Приоритетные направления: компьютерно-математическое математика

Язык: русский

Полный текст

DOI

Текст на другом сайте

Ключевые слова: аннотация automatic classification автоматическая классификация классификация текстов annotation clustering and classification кластеризация и классификация text classification диалекты арабского языка Arabic dialects

Произведения Масси и соотношения в когомологиях алгебр Стинрода

Попеленский Ф. Ю., Математический сборник 2026 Т. 217 № 2 С. 108–153

В недавней работе В. М. Бухштабера и автора была введена новая структура в когомологиях алгебр Хопфа в терминах спектральной последовательности Бухштабера (Bss). В классической алгебре Стинрода A2 имеется важная подалгебра Хопфа A(1), когомологии которой давно известны. В настоящей работе обсуждаемая структура на этих когомологиях полностью вычислена. В рамках демонстрации методов Bss решена обратная задача: получено новое ...

Добавлено: 28 июля 2026 г.

Three-dimensional magnetization textures as quaternionic functions

Metlov K., Bogatyrev Andrei B, Annalen der Physik 2026 Vol. 538 No. 6 Article 70234

Добавлено: 28 июля 2026 г.

Machine Learning-based Adaptive Reconstruction of Video Stream Fragments Taking into Account Scene Dynamics. Proceedings of the Institute for System Programming of the RAS

Думкин Н. А., Александров Д. В., Прозорский М. А., Труды Института системного программирования РАН 2026 Т. 38 № 1 С. 255–274

Предложен теоретически обоснованный подход к адаптивному восстановлению видеофрагментов на стороне клиента с использованием методов машинного обучения и анализа сцены. Метод включает формальную постановку задачи, модель конечного автомата для принятия решений, функцию стоимости восстановления, а также новый этап в подготовке видео – оценку динамики сцены с последующей записью признака в HLS-плейлист. Такой признак позволяет повысить точность выбора методов восстановления фрагментов видео. ...

Добавлено: 27 июля 2026 г.

Nonlinear Neumann eigenvalues in outward cuspidal domains with weighted measure

Меновщиков А. В., Ukhlov A., Rendiconti del Circolo Matematico di Palermo 2026 Vol. 75 Article 91

Добавлено: 27 июля 2026 г.

On the (p,q)-Eigenvalues of the No-Flux p-Laplacian

Меновщиков А. В., Journal of Mathematical Sciences 2026 Vol. 298 P. 608–618

Добавлено: 27 июля 2026 г.

Automated Reasoning: 13th International Joint Conference, IJCAR 2026, Lisbon, Portugal, July 26–29, 2026, Proceedings, Part II

Cham: Springer, 2026.

Добавлено: 26 июля 2026 г.

Proceedings of the International Science Conference “Scientific research of the SCO countries: synergy and integration” - Reports in English (June 3, 2026. Beijing, PRC)

Scientific publishing house Infinity, 2026.

Добавлено: 24 июля 2026 г.

К синтаксису клауз с аспектуальными глаголами в якутском языке

Баркова Л. А., Родной язык: лингвистический журнал 2026 № 1 С. 9–58

В статье исследуется синтаксис конструкций с аспектуальными глаголами в якутском языке. В таких конструкциях есть два предиката: лексический глагол, который стоит в форме конверба, и аспектуальный глагол, который передает какое-либо грамматическое значение и является финитным. Синтаксис таких конструкций уже был исследован для некоторых других тюркских языков. В этой работе рассматривались особенности положения аффиксов пассива, каузатива ...

Добавлено: 23 июля 2026 г.

Local Fault-Tolerant Routing in 3D Mesh NoCs using Single-Hop Rollback

Edward R. Rzaev, Aleksandr Y. Romanov, Andrey M. Sukhov, IEEE Access 2026 Vol. 14 P. 2169–3536

Добавлено: 23 июля 2026 г.

Систематизация равноправных произносительных вариантов в современном русском языке (на материале орфоэпических словарей)

Зубов В. И., Вопросы лексикографии 2026 № 40 С. 64–86

В статье представлена база данных равноправных произносительных вариантов современного русского языка, разработанная на материале трёх нормативных орфоэпических словарей: https://varuspeech.ru/. Описываются принципы отбора и систематизации вариантов, а также методика их разметки по типам и областям вариативности. Показаны расхождения между источниками и общие тенденции равноправной вариативности для отдельных форм и для лексем, а также роль частотности лексем ...

Добавлено: 23 июля 2026 г.

Библиометрия фольклора: русские пословицы в научных журналах

Писляков В. В., Вестник Томского государственного университета. Филология 2026 № 101 С. 175–192

Исследуется использование паремий в статьях, опубликованных в отечественных научных журналах. В результате поиска по платформе eLIBRARY.RU и постатейного просмотра полных текстов формируется «паремический массив» – набор журнальных статей, вышедших за 2014–2023 гг., в которых встречается одна из десяти исследуемых пословиц. Выделяются только случаи, когда пословицы используются авторами как пришедшиеся к слову изречения, а не как ...

Добавлено: 22 июля 2026 г.

Long-range machine-learning potentials with environment-dependent charges enable predicting LO-TO splitting and dielectric constants

Korogod D., Shapeev A., Новиков И. С., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 114 No. 2 Article 024104

Добавлено: 22 июля 2026 г.

Global optimization of atomic clusters via physically constrained tensor train decomposition

Sozykin K., Rybin N., Chertkov A. и др., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 113 No. 22 Article 224111

Добавлено: 22 июля 2026 г.

New bound on S1× S2-setting Bell locality of a nonseparable Werner state

Лубенец Е. Р., / Series arxiv.org "quant-ph". 2026. No. 2607.18050.

Добавлено: 21 июля 2026 г.

Russian Pronouns with Focus Antecedents: Coreference and Binding in Corpora

Тискин Д. Б., Компьютерная лингвистика и интеллектуальные технологии 2026 No. 24 P. 656–665

D:/Output/2025/Dialogue_after_review.pdfНесмотря на значительный интерес к факторам, определяющим выбор между личными и возвратными местоимениями с антецедентом в русском языке, роль отношения к антецеденту (кореферентность или связывание) остаётся слабо изученной, а приемлемость отдельных примеров вызывает споры. В настоящей работе на материале веб-корпусов (Araneum и ГИКРЯ) исследуется влияние, оказываемое на интерпретацию местоимения как кореферентного фокусному антецеденту или связанного ...

Добавлено: 19 июля 2026 г.

Kolmogorov Operators and Their Applications

Singapore: Springer, 2024.

Добавлено: 17 июля 2026 г.

Existence and uniqueness results for strongly degenerate McKean-Vlasov equations with rough coefficients

Веретенников А. Ю., Pascucci A., Rondelli A., Stochastic Processes and their Applications 2026 Vol. 199 Article 104978

Добавлено: 17 июля 2026 г.

О сильных решениях многомерных СДУ с диагональными матрицами диффузии

Веретенников А. Ю., Ляппиева А. А., Теория вероятностей и ее применения 2026 Т. 71 № 2 С. 295–304

Установлен новый результат о сильной единственности для многомерного СДУ с невырожденной диффузией и частично нерегулярным сносом. Его можно рассматривать как комбинированный вариант на темы Ямада и Ватанабэ (1971), Звонкина (1974) и первого автора настоящей статьи (1980). ...

Добавлено: 17 июля 2026 г.

Об условиях для центральной предельной теоремы Добрушина для неоднородных цепей Маркова

Веретенников А. Ю., Нуриева А. И., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 525 С. 24–30

Предложено новое достаточное условие в задаче о центральной предельной теореме в схеме серий для неоднородных цепей Маркова, с возможностью того, что минимум эргодического коэффициента Маркова–Добрушина может быть ближе к нулю, чем в основном условии Добрушина. ...

Добавлено: 17 июля 2026 г.

Не только ἐπιχώρια διδάγματα: пайдейя Эпаминонда

Можайский А. Ю., Schole. Философское антиковедение и классическая традиция 2026 Т. 20 № 2 С. 1105–1116

В настоящей статье исследуется образование Эпаминонда - знаменитого фиванского полководца и государственного деятеля. В античную эпоху он был широко известен благодаря образованности и философскому авторитету. В исследовании показано, что становление Эпаминонда было обусловлено сложным комплексом местных традиций обучения, которые Павсаний характеризует как «местные учения» (ἐπιχώρια διδάγματα). В то же время образование Эпаминонда отличалось от подготовки ...

Добавлено: 17 июля 2026 г.

О частных производных модифицированных полиномов Бернштейна–Станку для функций нескольких переменных

Веретенников А. Ю., Мазутский Н. М., Математический сборник 2025 Т. 216 № 7 С. 3–27

Целью работы является доказательство аппроксимации смешанных производных второго порядка для функции нескольких переменных в норме L1 такими же производными модифицированных полиномов Бернштейна–Станку при минимальной возможной регулярности. ...

Добавлено: 17 июля 2026 г.

On functional equations for Chow polylogarithms

Болбачан В. С., / Series math "arxiv.org". 2024.

Полилогарифмы Чжоу — это специальные функции, возникающие при явном описании отображения регулятора Бейлинсона. Наиболее интересное функциональное уравнение для этой функции отражает тот факт, что она обращается в нуль на границе в комплексе циклов Блоха. Мы показываем, что это функциональное уравнение формально вытекает из более простых свойств: кососимметричности, функториальности и мультипликативности. Для доказательства этого мы рассматриваем ...

Добавлено: 16 июля 2026 г.

On Goncharov’s conjecture in next to Milnor degree

Болбачан В. С., / Series math "arxiv.org". 2024.

Пусть K поле характеристики ноль. Мы доказываем что его когомологии в степени m-1 и весе m рационально изоморфны когомологиям полилогарифмического комплекса в соответствующей степени. Это дает частичное расширение теоремы Суслина, описывающую неразложимую K теорию K_3 для поля. ...

Добавлено: 16 июля 2026 г.

Statistical inference based on band-limited kernels: Rational-infinitely divisible distributions and beyond

Панов В. А., Рябченко А. П., / Series arXiv "stat.ME". 2026. No. 2607.05048.

Добавлено: 9 июля 2026 г.