• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
22 июня 2026 г.
Эффект Вышки: статьи в журналах первого квартиля и PhD в Университете Сиднея
Стефен Содоке, магистрант ОП «Население и развитие» Института демографии имени А.Г. Вишневского НИУ ВШЭ, победил в прошлом году в конкурсе научно-исследовательских работ студентов (НИРС). В 2026-м, уже в статусе выпускника Высшей школы экономики, он опубликовал две статьи в журналах первого квартиля и получил PhD в Университете Сиднея. Об исследовании Стефена и роли Вышки в его академической карьере — в нашем материале.
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Journal of Siberian Federal University. Series: Humanities & Social Sciences. 2024. Vol. 17. No. 5. P. 905–915.
Svetlana Iu. Toldova, Elena O. Sokur

 

Статья посвящена продолжающемуся проекту по созданию корпуса текстов на литературном даргинском языке (нахско-дагестанская группа языков). Пилотная версия корпуса была создана в 2022 г. В настоящей статье описывается опыт разработки полной версии корпуса. Во-первых, дан полный цикл разработки корпуса (необходимая последовательность этапов его разработки). Во-вторых, обсуждается процедура разработки и оптимизации морфологического парсера, обеспечивающего поморфемную аннотацию текстов в корпусе. Слои такой аннотации для каждой словоформы в корпусе включают: (а) слой поморфемной сегментации, (б) слой словарной формы, (в) слой грамматической поморфемной аннотации, (в) перевод лексемы на русский язык по двуязычному словарю. В‑третьих, анализируются проблемы, возникающие при применении выбранного инструмента для разработки системы морфологической аннотации (системы UniParser Т. Архангельского) к материалу даргинского языка, а также возможные пути их решения. Помимо этого, в статье описывается корпусной функционал.

Научное направление: Компьютерные науки Филология и лингвистика
Язык: английский
Полный текст
Текст на другом сайте
Ключевые слова: morphological parserморфологический парсераннотированный корпусдаргинские языкиDargwa languagesannotated corpusStandard Dargwa
Похожие публикации
Алжирская война и французская литература: случай Жоржа Перека
Кириченко В. В., Практики и интерпретации: журнал филологических, образовательных и культурных исследований, Россия 2026 Т. 11 № 1 С. 66–91
Статья посвящена малоизученному аспекту творчества французского писателя Жоржа Перека – влиянию Алжирской войны (1954–1962) на его литературное наследие. Несмотря на почти полное отсутствие прямых упоминаний войны в произведениях Перека, травматический исторический контекст значим для понимания тематики, структуры и стиля его текстов. Основное внимание уделяется анализу таких произведений, как «Вещи» (1965), «Что это за маленький мопед...» ...
Добавлено: 23 июня 2026 г.
Тезисы докладов Пятнадцатых Шмелёвских чтений
М.: Институт русского языка им. В.В. Виноградова РАН, 2026.
Сборник тезисов Пятнадцатых Шмелёвских чтений (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева) Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности. Охватывает разные аспекты современной русистики: от исторической лексикологии до современных трансформаций прагматики и семантики слов. ...
Добавлено: 23 июня 2026 г.
2025 9th International Conference on Information, Control, and Communication Technologies (ICCT-2025)
IEEE, 2026.
Добавлено: 23 июня 2026 г.
Кумранская версия текста одного библейского отрывка (Ис 42:1–9)
Битнер К. А., Индоевропейское языкознание и классическая филология 2025 Т. 29 № 1 С. 180–195
Статья посвящена интерпретации нескольких наиболее важных вариантов текста Ис 42:1–9, которые встречаются в Большом свитке Исайи (1QIsaa ), обнаруженном в Кумране. Данная рукопись является старейшим свидетельством древнееврейского текста библейской книги Исайи, датируется второй половиной II в. до н. э. В статье демонстрируется, что в большинстве случаев причиной появления разночтений являлась редакторская деятельность писца свитка. ...
Добавлено: 22 июня 2026 г.
Zα and Zβ Localize ADAR1 to Flipons That Modulate Innate Immunity, Alternative Splicing, and Nonsynonymous RNA Editing
Herbert A., Cherednichenko O., Lybrand T. и др., International Journal of Molecular Sciences 2025 Vol. 26 No. 6 Article 2422
Добавлено: 22 июня 2026 г.
Интерпретация эпиклезы византийской литургии в «Евхологии» Жака Гоара (1647)
Бернацкий М. М., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2026 № 83 С. 81–100
В публикации представлен комментированный перевод c латинского заметок Жака Гоара к тексту эпиклезы из его «Евхология» (1647). Перевод предваряется вступительной статьей, помещающей текст Гоара в историко-литературный контекст, связанный с греко-латинскими спорами о времени освящения даров, ключевым моментом которых стала полемика об эпиклезе на Флорентийском соборе 1439 г. Комментарии Гоара построены на основе итогов флорентийских дебатов, ...
Добавлено: 21 июня 2026 г.
Международная конференция «Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологи- ях искусственного интеллекта», приуроченная к 205-й годовщине со дня его рождения» : Материалы конференции. / (Обнинск, 14–16 мая 2026 г.): Материалы конференции. Под ред. акад. В.Б. Бетелина. — Калуга: Калужский печатный двор, 2026. — 232 с.
Калужский печатный двор, 2026.
Сборник трудов конференции "Математические идеи академика П.Л. Чебышёва, их приложения в естественных науках и технологиях искусственного интеллекта» ...
Добавлено: 20 июня 2026 г.
ИНТЕГРАЦИЯ ТЕХНОЛОГИИ ГЕНЕРАТИВНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ОБРАЗОВАТЕЛЬНЫЙ ВИДЕОКОНТЕНТ
Стогниева О. Н., Чеснокова Н. Е., Отечественная и зарубежная педагогика 2026 Т. 1 № 3 (115) С. 123–131
Внедрение генеративных инструментов искусственного интеллекта в образовательную практику актуализирует проблему педагогически обоснованного использования данных технологий при создании образовательного видеоконтента, который всё чаще применяется в языковом и профессионально-ориентированном обучении. Цель статьи — провести сравнительный анализ образовательного видеоконтента, созданного с применением генеративных ИИ-инструментов, с позиций теории когнитивной нагрузки и принципов педагогического дизайна, а также выявить дидактические условия повышения ...
Добавлено: 20 июня 2026 г.
Benchmarking DNA large language models on quadruplexes
Cherednichenko O., Herbert A., Попцова М. С., Computational and Structural Biotechnology Journal 2025 Vol. 27 P. 992–1000
Добавлено: 19 июня 2026 г.
Kolmogorov–Arnold networks for genomic tasks
Попцова М. С., Briefings in Bioinformatics 2025 Vol. 26 No. 2 P. 1–11
Добавлено: 19 июня 2026 г.
Бьяджо Гарофало и дискуссии о «естественном порядке слов» в Европе XVII-XVIII вв.
Шумилин М. В., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 1 С. 769–790
В статье предлагается уточнение интерпретации трактата Бьяджо Гарофало «Соображения по поводу поэзии евреев и греков» (Considerazioni intorno alla poesia degli Ebrei, e de i Greci, 1707), вписывающее его в контекст европейских дискуссий XVII–XVIII в. о «естественном порядке слов». Чаще трактат рассматривают исключительно как реплику о метрической природе древнееврейской поэзии, однако, как показано в статье более ...
Добавлено: 18 июня 2026 г.
In orationes Ciceronis emendatiunculae
Шумилин М. В., Hyperboreus 2026 Vol. 32 No. 1 P. 98–105
В статье предлагается набор эмендаций к речам Цицерона. В много обсуждавшемся месте Pro Archia 28 предлагается вместо рукописного (ad)(h)ortaui читать aduocaui. В Pro Caelio 18 вместо парадосиса liceret предлагается читать liceat. В Pro Ligario 24 дается рекомендация читать Quamquam <quid>, quid facturi fueritis, dubitem... В Philippicae 2. 69 предлагается удалить слово exegit. ...
Добавлено: 18 июня 2026 г.
Графовые паттерны в несогласованных декларативных моделях процессов
Анненков А. Н., Нестеров Р. А., Моделирование и анализ информационных систем 2026 Т. 33 № 2 С. 176–205
Декларативные модели процессов широко используются в process mining для гибкого описания поведения процессов с помощью наборов ограничений. Однако модели, автоматически извлекаемые из журналов событий, могут содержать несогласованные ограничения, что затрудняет их интерпретацию и делает их непригодными для исполнения, проверки соответствия или дальнейшего анализа. Существующие методы анализа согласованности либо опираются на автоматные конструкции с высокой асимптотической сложностью ...
Добавлено: 18 июня 2026 г.
Advances in Information Retrieval: 48th European Conference on Information Retrieval, ECIR 2026, Delft, The Netherlands, March 29 – April 2, 2026, Proceedings, Part II. (LNCS, volume 16484)
Cham: Springer Publishing Company, 2026.
Добавлено: 18 июня 2026 г.
Искусственный интеллект как роза научной деятельности: исследование Тимоти Гауэрса
Поддьяков А. Н., Троицкий вариант. Наука 2026 № 12 С. 24–25
В научно-популярной заметке представлен обзор содержания поста филдсовского медалиста Тимоти Гауэрса о возможностях ИИ в математике и содержания комментариев под постом. Обзор сделан в основном чат-ботом DeepSeek. В заключение обсуждается возможность не только решения задач искусственным интеллектом, но и их постановки. ...
Добавлено: 18 июня 2026 г.
Exploring New Frontiers in Vertical Federated Learning: the Role of Saddle Point Reformulation
Beznosikov A., Kormakov G., Grigorievskiy A. и др., Journal of Optimization Theory and Applications 2026 Vol. 209 Article 18
Добавлено: 17 июня 2026 г.
Supervised Learning in Critical Phenomena—Statistical and Systematic Accuracy
Chertenkov V. I., Щур Л. Н., Lobachevskii Journal of Mathematics 2026 Vol. 47 No. 2 P. 720–727
Добавлено: 16 июня 2026 г.
Enhancing Emotion Recognition in Speech Based on Self-Supervised Learning: Cross-Attention Fusion of Acoustic and Semantic Features
Deeb B., Andrey V. Savchenko, Макаров И. А., IEEE Access 2026 Vol. 13 P. 56283–56295
Добавлено: 16 июня 2026 г.
Проблема семантической деривации слова «естественно»
Белов В. А., Шао М., Белова В. М., Русская речь 2025 № 6 С. 7–24
Статья посвящена семантической деривации слова «естественно», которое в русском языке может выполнять функции вводного слова, наречия, прилагательного, предикатива и частицы. Целью работы является анализ семантических и функциональных изменений при семантической деривации слова «естественно». Материалом исследования послужили данные Национального корпуса русского языка, а также сведения словарей русского языка. Гипотезой исследования является положение, что семантическая деривация слова ...
Добавлено: 26 января 2026 г.
Конструкции устной спонтанной речи: опыт систематизации на современном корпусном материале
Богданова-Бегларян Н. В., Попова Т. И., Коммуникативные исследования 2025 Т. 12 № 1 С. 37–53
Статья посвящена описанию опыта систематизации устойчивых неоднословных единиц (УНЕ) из класса конструкций (КС). КС рассматриваются в работе с позиций грамматики конструкций, т. е. в этот класс отнесены все УНЕ, включающие в свой состав не только постоянные компоненты, но и переменные (слоты), которые обозначаются символами Х и Y: <Х-у не до Y-ка> (мне до вас), <из X-а ...
Добавлено: 3 сентября 2025 г.
Standard Dargwa Corpus
Толдова С. Ю., Сокур Е. О., , in: Современная лингвистика: от теории к практике: III Казанский международный лингвистический саммит: (Казань, 14–19 ноября 2022 г.): тр. и матер.: в 3 т.Т. 1.: Каз.: Издательство Казанского университета, 2023.
Добавлено: 12 марта 2025 г.
Социолингвистическое исследование в цудахарской зоне
Меленченко Максим, Конча Кирилл, Добрушина Нина., В кн.: Songs and Trees: Papers in Memory of Sasha Vydrina.: СПб.: Институт лингвистических исследований РАН, 2023. С. 451–484.
— ...
Добавлено: 27 сентября 2023 г.
The Old Church Slavonic Corpora and Their Use in Language Studies at the University
Афанасьев И. А., Babanov A., , in: Literature, Language and Computing: Russian Contribution.: Springer, 2023.
Добавлено: 15 сентября 2023 г.
Лексико-фразеологические особенности кадарского диалекта даргинского языка
Вагизиева Н. А., Махачкала: АЛЕФ, 2021.
Работа представляет собой монографическое исследование лексики и фразеологии кадарского диалекта даргинского языка. В диалекте выявлены фонетико-морфологические, словообразовательные, словоизменительные, лексические и фразеологические особенности. Особое внимание уделяется исследованию разных пластов лексики (исконной и заимствованной), описанию типов фразеологизмов, благопожеланий и проклятий исследуемого диалекта. Издание рассчитано на лингвистов, исследователей дагестанских и кавказских языков, специалистов по даргинской диалектологии, а также ...
Добавлено: 5 июня 2023 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору