Developing a polysynthetic language corpus: problems and solutions

Arkhangelskiy T.A.; Lander Yu.A.

?

Developing a polysynthetic language corpus: problems and solutions

Компьютерная лингвистика и интеллектуальные технологии. 2016. No. 15 (22). P. 40–49.

Arkhangelskiy T.A., Lander Yu.A.

Несмотря на то, что в настоящее время существует множество морфологически размеченных корпусов для языков с богатой морфологией, до сих пор не было создано ни одного корпуса полисинтетического языка, который бы учитывал необходимую морфологическую информацию. Разработка корпуса для таких языков ставит перед корпусным лингвистом ряд нетривиальных теоретических и практических задач. Некоторые из них в меньшем объёме встречались и частично решались ранее при создании корпусов языков с большими морфологическими системами и обилием продуктивных деривационных моделей, например, тюркских или уральских языков. Однако многие из этих проблем уникальны для полисинтетических языков. В ходе работы над созданием корпуса полисинтетического адыгейского языка мы обрисовываем эти проблемы и предлагаем ряд теоретических и практических решений. Описываемые проблемы включают в себя токенизацию (связанную с нечёткой границей между синтаксисом и мофологией), лемматизацию и морфологическую разметку, а также ряд вопросов, связанных с глоссированием и поиском в корпусе. Предлагаемые решения частично реализованы и будут доступны для тестирования в пилотной версии корпуса.

Научное направление: Филология и лингвистика

Приоритетные направления: гуманитарные науки

Язык: английский

Полный текст

Текст на другом сайте

Ключевые слова: corpus linguistics Adyghe polysynthesis Circassian languages West Circassian

Metaphor in the Mental Lexicon: Investigating Different Types of Polysemy via Eye-Tracking and Behavioral Experiments

Апресян В. Ю., Орлов А. В., Конча К. О. и др., Metaphor and Symbol 2026 Vol. 41 No. 1 P. 5–38

Добавлено: 13 января 2026 г.

Литература в глобальном мире: поэтика, компаративистика, имагология.

Н. Новгород: Нижегородский государственный лингвистический университет им. Н.А. Добролюбова, 2023.

Коллективная монография «Литература в глобальном мире: поэтика, компаративистика, имагология», публикуемая кафедрой литературы народов мира и межкультурной коммуникации, отражает результаты одноименной международной научной конференции, проходившей в НГЛУ им. Н.А. Добролюбова в мае 2022 года. Она представляет интерес для всех, кто профессионально занимается или просто интересуется такими науками, как литературоведение, лингвистика и имагология. Монография отражает новейшие тенденции ...

Добавлено: 11 января 2026 г.

XVIII век: день и ночь в литературе и искусстве эпохи

СПб.: Алетейя, 2025.

В коллективной монографии «XVIII век: день и ночь в литературе и искусстве эпохи» собраны статьи, написанные по материалам докладов участников XIV Международной конференции по литературе и искусству эпохи Просвещения, проведенной 21–22 марта 2025 года кафедрой истории зарубежной литературы филологического факультета МГУ им.ܷМ. В.ܷЛомоносова в рамках программы Российского общества по изучению XVIII века. Ученые анализировали образы дня ...

Добавлено: 10 января 2026 г.

ПУТИ ФОРМИРОВАНИЯ ЛИТЕРАТУРНОЙ РЕПУТАЦИИ: Ф.Г. КЛОПШТОК В РОССИИ XIX ВЕКА

Сибирцева В. Г., ИЗВЕСТИЯ СМОЛЕНСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2024 Т. 1 № 65 С. 102–119

В статье предпринимается попытка реконструкции апологетической литературной репутации Ф.Г. Клопштока, сочетающейся с читательским безразличием к его творчеству. Литературная репутация - многоаспектное явление, которое складывается под воздействием различных факторов, может оказываться результатом случайных обстоятельств. При безоговорочном причислении Клопштока к классикам - великим сентименталистам и эпикам - и изучении его поэзии в общеобразовательных учреждениях XIX века оды ...

Добавлено: 10 января 2026 г.

И ЕЩЕ РАЗ О ВЕДЕНЯПИНЕ В «ДОКТОРЕ ЖИВАГО» Б. Л. ПАСТЕРНАКА

Поливанов К. М., Русская литература 2025 № 4 С. 192–196

В статье представлен один из источников мыслей о бессмертии и искусстве, культуре и истории, античности и современности в «Докторе Живаго» Б. Л. Пастернака, большую часть которых в романе высказывает важнейший идеологический персонаж — Николай Веденяпин. Показано, что в процессе работы над романом влияние на идейный пласт могло оказать общение писателя с его двоюродной сестрой О. М. Фрейденберг, с которой ...

Добавлено: 10 января 2026 г.

Памяти Тамары Федоровны Теперик

Брагинская Н. В., Аристей. Aristeas: Вестник классической филологии и античной истории 2025 Т. 32 С. 182–188

Жизнь, педагогическая и научная деятельность доктора филологических наук (2009)и доцента кафедры классической филологии Тамары Федоровны Теперик (18.10.1954-17.04.2025), коллеги и друга. ...

Добавлено: 9 января 2026 г.

К вопросу о символике фитонимов и флоронимов во вьетнамской народной поэзии (казао)

Старикова Е. О., Вьетнамские исследования 2025 Т. 9 № 4 С. 127–138

Статья посвящена образам и символам вьетнамской народной поэзии, связанным с растительным миром. Среди них встречаются автохтонно вьетнамские, например, парный символ «бетель и арека», который ассоциирован с любовью и браком. Кроме того, в дальневосточном культурном регионе существует устойчивая растительная символика, которая проявляется в различных видах искусства, таких как живопись и поэзия. Многие растения, встречающиеся во вьетнамской ...

Добавлено: 2 января 2026 г.

Неведомый мир: забытые рассказы и повести о крестьянах (1791-1861). Антология

М.: Рутения, 2025.

Антология объединяет под одной обложкой 25 редких и забытых рассказов и повестей российских писателей конца XVIII ― первой половины XIX века о крестьянах, их нелегком быте и насыщенной частной жизни. Среди авторов ― как классики (Н. М. Карамзин, В. И. Даль, М. Л. Михайлов, Д. В. Григорович), так и малоизвестные прозаики второго и даже третьего ...

Добавлено: 2 января 2026 г.

Aphasia in Andrei Bely's Petersburg

Золотарёва О. А., Studies in the Novel 2025 Vol. 57 No. 1 P. 40–60

Добавлено: 2 января 2026 г.

Apul. Met. 1.4: Spear Swallower, Pole Dancing, and the Miraculous Boy

Шумилин М. В., Philologus 2025 Vol. 169 No. 2 P. 276–280

Добавлено: 30 декабря 2025 г.

Время Сапгира / Отв. ред. Ю.Б. Орлицкий. М.: РГГУ, 2025.

М.: Изд-во РГГУ, 2025.

В коллективную монографию, подготовленную по материалам ежегодных научных конференций в РГГУ, посвященных творчеству крупнейшего русского поэта конца ХХ в. Генриха Сапгира (Сапгировских чтений), вошли главы, затрагивающие различные аспекты изучения личности и творчества поэта и его наиболее значимые произведения. В приложение вошли избранные воспоминания о Сапгире. Для филологов, преподавателей вузов, аспирантов и студентов, а также всех интересующихся русской поэзией ...

Добавлено: 26 декабря 2025 г.

Международная конференция «Теории и практики литературного мастерства: “Диалог с читателем”» (НИУ ВШЭ, Москва, 13–14 сентября 2024 года)

Стрижкова Д. А., Исаева А. О., Новое литературное обозрение 2025 № 194 С. 422–436

Обзор международной конференции «Теории и практики литературного мастерства: “Диалог с читателем”» (НИУ ВШЭ, Москва, 13–14 сентября 2024 года) ...

Добавлено: 25 декабря 2025 г.

The emergence of hierarchical alignment in Northern Khanty: a comparative dialectal corpus study

Муравьев Н. А., Linguistica Uralica 2025 Vol. 61 No. 2 P. 106–130

В статье рассматривается морфосинтаксическое кодирование ядерных аргументов в севернохантыйском языке, в частности параметры активного/пассивного залога и субъектного/объектного спряжения. Цель исследования — предложить более детальное понимание стратегий кодирования в севернохантыйских диалектах. В качестве материала использованы 4320 переходных клауз на четырех северных хантыйских диалектах: обдорском, шурышкарском, тегинском и казымского, извлеченные из доступных корпусов. Материал размечен вручную по параметрам лица, одушевленности, референтного статуса и топикальности. ...

Добавлено: 24 декабря 2025 г.

Семантика и морфосинтаксис глагольно-каритивных конструкций в типологической перспективе

Муравьев Н. А., Гордеев Н. О., Кукушкина М. С., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2024 Т. 20 № 3 С. 119–166

В статье на материале шести языков рассмотрены каритивные конструкции в типологической перспективе. Исследование сочетает подходы Грамматики конструкций (CxG) и лексической семантики, источник данных — опрос носителей. Выделяется три семантических домена: утраты и необладания, уступки и избегания. Переходные конструкции акцентируют участие агенса, а в фокусе непереходных — отношение обладания между двумя участниками. К основным лексическим источникам ...

Добавлено: 24 декабря 2025 г.

The influence of internal possessors on argument coding in Northern Khanty

Муравьев Н. А., Voprosy Jazykoznanija 2024 Vol. 5 P. 65–79

Добавлено: 24 декабря 2025 г.

The Names of the Low Comedians and Prisoners Rendered in the Russian Translations of Shakespeare’s Measure for Measure

Калашников А. В., Komunikacija i Kultura Online 2025 Vol. 16 No. 16 P. 195–207

Добавлено: 23 декабря 2025 г.

Событийная структура морфологического каузатива в собственно хваршинском

Сибилев Г. О., Типология морфосинтаксических параметров 2023 Т. 6 № 1 С. 112–129

В статье рассматривается устройство событийной структуры морфологического каузатива в собственно хваршинском диалекте хваршинского языка (цезская группа<аваро-андо-цезская ветвь<нахскодагестанские языки). Мы также проанализировали семантические параметры морфологического каузатив на -χ-/-k’- и сравнили их с семантическими параметрами аналитической каузативной конструкции. Отметим, что конструкция с морфологическим маркером каузатива может являться как однособытийной (концептуализироваться как единая ситуация), так и двусобытийной (концептуализироваться ...

Добавлено: 22 декабря 2025 г.

Локутивная модальность в хваршинском языке

Сибилев Г. О., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2025 Т. 21 № 1 С. 163–185

В статье приведены данные о способах выражения локутивной модальности (speaker-oriented modality) в собственно хваршинском диалекте хваршинского языка (цезская группа < аваро-андо-цезская ветвь < нахско-дагестанские языки). Были исследованы и описаны семантические зоны гортатива, императива, юссива, оптатива и превентива, а также затронуты некоторые особенности средств выражения локутивной модальности в собственно хваршинском диалекте хваршинского языка как с типологической, ...

Добавлено: 22 декабря 2025 г.

Recent Publications on Syriac Topics: 2024

Минов С. В., Kessel G., Hugoye: Journal of Syriac Studies 2025 Vol. 28 No. 1 P. 217–287

Добавлено: 21 декабря 2025 г.

Царица Елена в культурной памяти сирийских христиан: два новых свидетельства

Минов С. В., Библия и христианская древность 2025 Т. 1 [25] С. 116–150

В статье впервые публикуются полностью два сирийских текста, посвящённых фигуре царицы Елены, матери императора Константина: переписка с Еленой из эпистолярного корпуса, приписанного Папе бар Аггаю, епископу Селевкии-Ктесифона (IV в.), и анонимные «Гипомнематы о происхождении царицы Елены», повествующие о сирийских корнях царицы и её пути к вершинам власти. Наряду с обсуждением их датировки и аутентичности, предпринимается ...

Добавлено: 21 декабря 2025 г.

Syriac Christian Polemic against Popular Religion: New Evidence from the Islamic Period

Минов С. В., Scrinium: Journal of Patrology and Critical Hagiography 2025 Vol. 21 No. 1 P. 163–206

Добавлено: 21 декабря 2025 г.

Preposition drop in Russian spoken by Mari and Beserman bilinguals

Яковлева А. В., Kosheliuk N., Мороз Г. А., International Journal of Bilingualism 2025 P. 1–19

Добавлено: 26 ноября 2025 г.

Вариативность годов vs. лет в русских говорах: корпусное исследование

Земичева С. С., Мороз Г. А., Наккарато М. К., Вопросы языкознания 2025 № 6 С. 7–34

The presence of the genitive plural suppletive form let in the paradigm of the noun god ‘year’ distinguishes Russian from other East Slavic languages. In Russian dialects, instead of let, the dialect variant godov is sometimes used. Data from the panchronic subcorpus of the Russian National Corpus show that the form godov, which is first attested in the ...

Добавлено: 12 ноября 2025 г.

Automatic Annotation of Discourse and Speech Formulas in Internet Communication: A Telegram Comment Corpus

Maslenikova A., Tatiana I. Popova, , in: 27th International Conference, SPECOM 2025, Szeged, Hungary, October 13–15, 2025, Proceedings, Part I. Speech and Computer. Lecture Notes in Artificial Intelligence 16187Vol. 16187: Lecture Notes in Artificial Intelligence.: Springer, 2025. P. 278–292.

Добавлено: 19 октября 2025 г.