Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Svetlana Iu. Toldova; Elena O. Sokur

?

Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Journal of Siberian Federal University. Series: Humanities & Social Sciences. 2024. Vol. 17. No. 5. P. 905–915.

Статья посвящена продолжающемуся проекту по созданию корпуса текстов на литературном даргинском языке (нахско-дагестанская группа языков). Пилотная версия корпуса была создана в 2022 г. В настоящей статье описывается опыт разработки полной версии корпуса. Во-первых, дан полный цикл разработки корпуса (необходимая последовательность этапов его разработки). Во-вторых, обсуждается процедура разработки и оптимизации морфологического парсера, обеспечивающего поморфемную аннотацию текстов в корпусе. Слои такой аннотации для каждой словоформы в корпусе включают: (а) слой поморфемной сегментации, (б) слой словарной формы, (в) слой грамматической поморфемной аннотации, (в) перевод лексемы на русский язык по двуязычному словарю. В‑третьих, анализируются проблемы, возникающие при применении выбранного инструмента для разработки системы морфологической аннотации (системы UniParser Т. Архангельского) к материалу даргинского языка, а также возможные пути их решения. Помимо этого, в статье описывается корпусной функционал.

Научное направление: Компьютерные науки Филология и лингвистика

Язык: английский

Полный текст

Текст на другом сайте

Ключевые слова: morphological parser морфологический парсер аннотированный корпус даргинские языки Dargwa languages annotated corpus Standard Dargwa

Proceedings of the International Science Conference “Scientific research of the SCO countries: synergy and integration” - Reports in English (June 3, 2026. Beijing, PRC)

Scientific publishing house Infinity, 2026.

Добавлено: 24 июля 2026 г.

К синтаксису клауз с аспектуальными глаголами в якутском языке

Баркова Л. А., Родной язык: лингвистический журнал 2026 № 1 С. 9–58

В статье исследуется синтаксис конструкций с аспектуальными глаголами в якутском языке. В таких конструкциях есть два предиката: лексический глагол, который стоит в форме конверба, и аспектуальный глагол, который передает какое-либо грамматическое значение и является финитным. Синтаксис таких конструкций уже был исследован для некоторых других тюркских языков. В этой работе рассматривались особенности положения аффиксов пассива, каузатива ...

Добавлено: 23 июля 2026 г.

Local Fault-Tolerant Routing in 3D Mesh NoCs using Single-Hop Rollback

Edward R. Rzaev, Aleksandr Y. Romanov, Andrey M. Sukhov, IEEE Access 2026

Добавлено: 23 июля 2026 г.

Систематизация равноправных произносительных вариантов в современном русском языке (на материале орфоэпических словарей)

Зубов В. И., Вопросы лексикографии 2026 № 40 С. 64–86

В статье представлена база данных равноправных произносительных вариантов современного русского языка, разработанная на материале трёх нормативных орфоэпических словарей: https://varuspeech.ru/. Описываются принципы отбора и систематизации вариантов, а также методика их разметки по типам и областям вариативности. Показаны расхождения между источниками и общие тенденции равноправной вариативности для отдельных форм и для лексем, а также роль частотности лексем ...

Добавлено: 23 июля 2026 г.

Библиометрия фольклора: русские пословицы в научных журналах

Писляков В. В., Вестник Томского государственного университета. Филология 2026 № 101 С. 175–192

Исследуется использование паремий в статьях, опубликованных в отечественных научных журналах. В результате поиска по платформе eLIBRARY.RU и постатейного просмотра полных текстов формируется «паремический массив» – набор журнальных статей, вышедших за 2014–2023 гг., в которых встречается одна из десяти исследуемых пословиц. Выделяются только случаи, когда пословицы используются авторами как пришедшиеся к слову изречения, а не как ...

Добавлено: 22 июля 2026 г.

Long-range machine-learning potentials with environment-dependent charges enable predicting LO-TO splitting and dielectric constants

Korogod D., Shapeev A., Новиков И. С., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 114 No. 2 Article 024104

Добавлено: 22 июля 2026 г.

Global optimization of atomic clusters via physically constrained tensor train decomposition

Sozykin K., Rybin N., Chertkov A. и др., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 113 No. 22 Article 224111

Добавлено: 22 июля 2026 г.

Russian Pronouns with Focus Antecedents: Coreference and Binding in Corpora

Тискин Д. Б., Компьютерная лингвистика и интеллектуальные технологии 2026 No. 24 P. 656–665

D:/Output/2025/Dialogue_after_review.pdfНесмотря на значительный интерес к факторам, определяющим выбор между личными и возвратными местоимениями с антецедентом в русском языке, роль отношения к антецеденту (кореферентность или связывание) остаётся слабо изученной, а приемлемость отдельных примеров вызывает споры. В настоящей работе на материале веб-корпусов (Araneum и ГИКРЯ) исследуется влияние, оказываемое на интерпретацию местоимения как кореферентного фокусному антецеденту или связанного ...

Добавлено: 19 июля 2026 г.

Не только ἐπιχώρια διδάγματα: пайдейя Эпаминонда

Можайский А. Ю., Schole. Философское антиковедение и классическая традиция 2026 Т. 20 № 2 С. 1105–1116

В настоящей статье исследуется образование Эпаминонда - знаменитого фиванского полководца и государственного деятеля. В античную эпоху он был широко известен благодаря образованности и философскому авторитету. В исследовании показано, что становление Эпаминонда было обусловлено сложным комплексом местных традиций обучения, которые Павсаний характеризует как «местные учения» (ἐπιχώρια διδάγματα). В то же время образование Эпаминонда отличалось от подготовки ...

Добавлено: 17 июля 2026 г.

Английский язык для студентов педагогических вузов. = English for Pre-Service Teachers (B2-C1)

Стогниева О. Н., Новикова В. П., М.: Флинта, 2026.

Инновационный курс английского языка для специальных целей для студентов педагогических вузов предлагает погружение в актуальный образовательный дискурс: от вопросов воспитания и когнитивного развития детей и подростков до переосмысления роли школы в цифровую эпоху. Содержательной основой курса выступают аутентичные мультимодальные материалы, позволяющие анализировать глобальные тренды современных образовательных систем и подходов. Издание идеально подходит вузам, стремящимся подготовить ...

Добавлено: 16 июля 2026 г.

Вклад Нгуен Тонг Куая в развитие вьетнамской поэзии (Новый взгляд на творчество поэта XVIII века)

Бритов И. В., Вьетнамские исследования 2026 Т. 10 № 2 С. 87–98

В статье анализируется творчество поэта XVIII в. Нгуен Тонг Куая. Обращается внимание на то, что во Вьетнаме только после провозглашения политики обновления стали активно изучать и высоко оценивать его литературное наследие, хотя еще при жизни поэта современники давали исключительно положительные отзывы о его стихах. Выявляются причины, по которым долгое время Нгуен Тонг Куай находился в ...

Добавлено: 16 июля 2026 г.

WSI-GT: Pseudo-Label Guided Graph Transformer for Whole-Slide Histology

Михайлов И. А., Machine Learning and Knowledge Extraction 2026 Vol. 8 No. 1 Article 8

Whole-slide histology images (WSIs) can exceed 100 k × 100 k pixels, making direct pixel-level segmentation infeasible and requiring patch-level classification as a practical alternative for downstream WSI segmentation. However, most approaches either treat patches independently, ignoring spatial and biological context, or rely on deep graph models prone to oversmoothing and loss of local tissue ...

Добавлено: 16 июля 2026 г.

On the construction of Barnes–Wall lattices and their application in cryptography

Кунинец А. А., Малыгина Е. С., Leevik A. G. и др., Journal of Computer Virology and Hacking Techniques 2026 No. 22 Article 62

Добавлено: 16 июля 2026 г.

Tencent и Open Source. Как относится к открытому ПО самый дорогой бренд Китая?

Силаков Д. В., Системный администратор 2026 № 5 С. 46–51

В предыдущей статье про Open Source в КНР [1] мы рассказали про Alibaba – крупную корпорацию, занимающую тридцатое место в рейтинге самых значимых мировых брэндов за 2025 год [2]. Место почетное, но не первое среди китайских компаний – на тринадцатом месте расположилась Tencent, разработчик WeChat и ряда других продуктов, широко используемых нашими восточными соседями. Tencent ...

Добавлено: 14 июля 2026 г.

Комитативно-аддитивная полисемия в пуровском диалекте лесного ненецкого языка

Козлов А. А., Лапшина К. М., Вопросы языкознания 2026 № 4 С. 132–146

В статье на материале полевых данных рассматриваются две функции суффикса -samae в пуровском диалекте лесного ненецкого языка: комитативная (выражение совместности: ‘с X-ом’) и скалярно-аддитивная (показатель со значением ‘даже X’). Комитативное употребление показателя -samae характерно прежде всего для маркирования неодушевленного спутника, однако его использование возможно и с другими типами участников — в частности, когда они образуют ...

Добавлено: 13 июля 2026 г.

2026 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

IEEE, 2026.

Добавлено: 13 июля 2026 г.

Prompt Design for GPT-4 Assessments of EFL Student Reports

Стогниева О. Н., Murashova N., Journal of Asia TEFL 2026 Vol. 23 No. 2 P. 490–505

Добавлено: 12 июля 2026 г.

Mathematical Optimization Theory and Operations Research, 25th International Conference, MOTOR 2026 Irkutsk, Russia, July 6–11, 2026 Proceedings

Switzerland: Springer, 2026.

Добавлено: 12 июля 2026 г.

Задачи бесконечной регулярной реализуемости

Шиманогов И. Н., Вялый М. Н., Дискретный анализ и исследование операций 2025 Т. 32 № 4(166) С. 213–230

Хорошо изученным классом алгоритмических задач являются задачи регулярной реализуемости: проверка непустоты пересечения регулярного языка с заданным языком. Данная задача имеет естественную алгебраическую интерпретацию: проверка принадлежности элемента булевой алгебры ядру определенного гомоморфизма. Это мотивирует рассмотрение аналогичной задачи бесконечной регулярной реализуемости: проверка бесконечности пересечения регулярного языка с заданным. В работе рассматриваются задачи регулярной реализуемости для разрешимых языков ...

Добавлено: 12 июля 2026 г.

International Academic Conference. Proceedings of the Scientific Forum “Modern Science: Theory and Practice” (April 22, 2026). Belgrade, Serbia. Part 3.

Scientific publishing house Infinity, 2026.

Добавлено: 10 июля 2026 г.

Этот смутный объект внимания: "реальные предметы" и гаптический опыт в рассказах В. Вулф

Шулятьева Д. В., Новое литературное обозрение 2026 № 199 С. 128–140

В статье рассмотрена гаптическая образность в поэтике В. Вулф на примере трех ее рассказов («Пятно на стене», «Женщина в зеркале», «Реальные предметы»), в центре которых оказываются предметы, устанавливающие обновленные отношения с героями. С опорой на теорию гаптической визуальности и на теорию вещи описаны трансформации, которые происходят с предметами, и переживание, которое открывается герою и нарратору при соприкосновении с ними, ...

Добавлено: 10 июля 2026 г.

Проблема семантической деривации слова «естественно»

Белов В. А., Шао М., Белова В. М., Русская речь 2025 № 6 С. 7–24

Статья посвящена семантической деривации слова «естественно», которое в русском языке может выполнять функции вводного слова, наречия, прилагательного, предикатива и частицы. Целью работы является анализ семантических и функциональных изменений при семантической деривации слова «естественно». Материалом исследования послужили данные Национального корпуса русского языка, а также сведения словарей русского языка. Гипотезой исследования является положение, что семантическая деривация слова ...

Добавлено: 26 января 2026 г.

Конструкции устной спонтанной речи: опыт систематизации на современном корпусном материале

Богданова-Бегларян Н. В., Попова Т. И., Коммуникативные исследования 2025 Т. 12 № 1 С. 37–53

Статья посвящена описанию опыта систематизации устойчивых неоднословных единиц (УНЕ) из класса конструкций (КС). КС рассматриваются в работе с позиций грамматики конструкций, т. е. в этот класс отнесены все УНЕ, включающие в свой состав не только постоянные компоненты, но и переменные (слоты), которые обозначаются символами Х и Y: <Х-у не до Y-ка> (мне до вас), <из X-а ...

Добавлено: 3 сентября 2025 г.

Standard Dargwa Corpus

Толдова С. Ю., Сокур Е. О., , in: Современная лингвистика: от теории к практике: III Казанский международный лингвистический саммит: (Казань, 14–19 ноября 2022 г.): тр. и матер.: в 3 т.Т. 1.: Каз.: Издательство Казанского университета, 2023.

Добавлено: 12 марта 2025 г.