Морфосинтаксическая разметка текста на китайском языке с помощью статистических анализаторов: методика, оценка качества.

А. А. Кубатиева

?

Морфосинтаксическая разметка текста на китайском языке с помощью статистических анализаторов: методика, оценка качества.

Kubatieva A.

In this paper, we describe basic principles of POS-classifications and their modelling for POS-tagging of Chinese and statistical NLP systems. Using three available statistical POS-taggers, we conducted an experiment on POS-tagging of Chinese text to analyze quality evaluation, correspondence between POS-tags and categories assigned in different reference grammars. We also determine the basic rules of POS-taggers tagset evaluation.

Language: Russian

Full text

Keywords: natural language processing китайский язык морфология morphology автоматическая обработка текста лексико-грамматическая разметка part of speech tagging Chinese language

In book

I Молодежная международная конференция «Методы точных наук в востоковедении», 10-11 ноября 2015 г.: Материалы конференции

СПб.: Издательство РХГА, 2015.

Способы перевода Интернет-лексики китайского языка(на материале 2021-2024 гг.)

Liu Q., Известия Байкальского государственного университета 2025 Т. 35 № 4 С. 638–645

Internet communication, as a dynamic manifestation of language, is a crucial element of modern social reality; it is a relatively recent medium of communication that is expanding worldwide. Communication on the Internet allows people to show linguistic creativity, so in the virtual communicative space a lot of neologisms, terms and slang expressions appear. Our study ...

Added: January 15, 2026

Источники интернет-лексики китайского языка (на материале 2022-2024 гг.)

Liu Q., Казанский лингвистический журнал 2025 Т. 8 № 4 С. 545–556

Added: January 14, 2026

Китайский язык: второй иностранный язык: 5-й класс: учебник (8-е изд.)

Sizova A., М.: Просвещение, 2025.

Учебник «Китайский язык. Второй иностранный язык. 5 класс» серии «Время учить китайский!» создан совместно с издательством «People’s Education Press» (Китайская Народная Республика) и предназначен для обучающихся общеобразовательных организаций, начинающих изучать китайский язык в качестве второго иностранного языка с 5 класса. Настоящий учебник подготовлен в соответствии с требованиями ФГОС ООО, утверждённого Приказом Министерства просвещения РФ № ...

Added: January 14, 2026

Влияние импульсного лазерного излучения на морфологию и свойства поверхности вольфрама, имплантированного ионами гелия

Боровицкая И. В., Пименов В. Н., Коршунов С. Н. et al., Вопросы атомной науки и техники. Термоядерный синтез 2025 Т. 48 № 3 С. 135–146

Проведено исследование влияния мощного импульсного лазерного излучения (ЛИ), создаваемого в установке ГОС 1001 в режиме модулированной добротности с плотностью мощности потока, равной 1,0·1014 Вт/м2, длительно-стью импульса t = 50 нс, числом импульсов N от 1 до 8 на структуру и микротвёрдость поверхности образцов вольфрама, размещённых в вакуумной камере. Образцы облучены в исходном состоянии и после ...

Added: December 26, 2025

Китайский разговорник

Durymanova A., Ермолаева Е. А., Сутулов А. А., М.: Бомбора, 2025.

Начни говорить на китайском уже сейчас! Китайский разговорник поможет изъясниться за границей в различных ситуациях: будь то заказ обеда в ресторане либо поход в аптеку. Разговорник включает в себя множество тем и выражений, снабжённых транскрипцией на кириллице. Небольшой формат, гибкая обложка и закруглённые уголки, — всё делает разговорник идеальным карманным помощником! Предназначен для смелых путешествий в Китай, а также послужит отличным пособием для самостоятельного развития разговорного языка. ...

Added: October 1, 2025

Прописи: мои первые китайские иероглифы

Durymanova A., М.: Бомбора, 2025.

В пособии Анастасии Дурымановой, опытного преподавателя китайского языка в РГГУ и ВШЭ, вас ждет освоение 33 основных иероглифов через историю их происхождения и методы написания. С помощью творческого подхода, который объединяет изучение языка с погружением в культуру Китая, вы сможете легко и доступно освоить основы иероглифики. В книге предусмотрены поля для практики письма, мнемонические иллюстрации, а также увлекательные задания, которые сделают обучение интересным как для детей, так ...

Added: October 1, 2025

Китайские прописи для начинающих: введение в иероглифику

Durymanova A., М.: Бомбора, 2025.

Начертания иероглифов поддаются элементарным правилам, освоив которые каждый сможет верно написать любой иероглиф, лишь взглянув на него. С помощью книги вы освоите правильный порядок написания черт, выучите множество иероглифов по их происхождению и начертанию, погрузитесь в тонкости культуры языка и страны. Пособие разбирает такие темы, как: основные черты и лигатуры, правила сочетаний простых черт между ...

Added: October 1, 2025

Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions

Chepikov I., Karpov I., , in: Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.

Modern LLM models such as BERT, ChatGPT, DeepSeek have shown great potential in solving various tasks, including text classification, text generation, analysis and summary of documents. In this paper, we show that these models close to classical ML approaches based on decision trees not only in text processing, but also in processing classical tabular data ...

Added: September 4, 2025

Влияние психологии культуры и идей "Чжун юн" на формирование митигативных признаков средств выразительности в китайском языке

Мизриева Л. Р., Тахтарова (Латышева) С. С., Успехи гуманитарных наук 2022 № 4 С. 125–133

A distinctive feature of the Chinese language is the influence of Confucian ideology. The attitudes and postulates formulated by Confucius and his followers, philosophical ideas, in particular “zhong yong” (“Middle and unchanging path”) have been intertwined for centuries and firmly fixed in the linguistic consciousness of the Chinese. As a result, the principle of "zhong ...

Added: May 29, 2025

Проблемы перевода культурных реалий как элемента туристического ландшафта (в паре русский – китайский)

Dubinina M., Ученые записки национального общества прикладной лингвистики 2024 № 4(44) С. 186–199

In Russia, various service sectors are turning their attention to the East. The tourism sector, in anticipation of foreign guests from China, is preparing information signs and banners in Chinese. However, they do not always help to navigate a new environment and raise even more questions about the culture and life of the area. The ...

Added: April 17, 2025

Элементы горномарийского языка в типологическом освещении

М.: Буки Веди, 2023.

Монография посвящена горномарийскому языку (в другой традиции — горному наречию марийского языка), относящемуся к уральской семье. Центральное место в книге занимает рассмотрение широкого спектра грамматических явлений: семантики именных и глагольных категорий, морфосинтаксиса именных и послеложных групп, актантных преобразований, синтаксиса клауз различных типов, устройства полипредикативных конструкций и др. Дается социолингвистическая справка о горномарийском языке. Приводятся сведения ...

Added: March 28, 2025

Роль проблемных ситуаций в преподавании китайского языка посредством общественно-политических китайских ток-шоу

Бинштейн М. М., Бурова И. В., Педагогика и психология образования 2025 № 2 С. 76–95

Статья посвящена рассмотрению преимуществ интеграции общественно-политических ток-шоу в процесс проблемного обучения китайскому языку как иностранному. Актуальность исследования обусловлена ориентированностью современной методики обучения иностранным языкам на поиск методов, позволяющих не только развить у обучающихся навыки говорения и способность критически мыслить, но и вовлечь их в процесс коммуникации, стимулировать активную самостоятельную работу с иноязычным материалом. Методическая цель ...

Added: February 18, 2025

Электронная инженерия: теория параметрической чувствительности систем

Kofanov Y. N., М.: ИНФРА-М, 2024.

Систематизированы методы исследования чувствительности выходных электрических, тепловых, механических и других физических характеристик систем к изменениям внутренних параметров этих процессов, моделирование которых может проводиться в области аналитических, структурных, топологических и морфологических представлений. Для полноты системного подхода автором дополнительно проведена разработка ряд новых методов. Показывается эффективность применения функций параметрической чувствительности в процессе проектирования систем с одновременно протекающими ...

Added: January 31, 2025

Automatic Morpheme Segmentation for Russian: Can an Algorithm Replace Experts?

Morozov D., Garipov T., Lyashevskaya O. et al., Journal of Language and Education 2024 Vol. 10 No. 4 P. 71–84

Introduction: Numerous algorithms have been proposed for the task of automatic morpheme segmentation of Russian words. Due to the differences in task formulation and datasets utilized, comparing the quality of these algorithms is challenging. It is unclear whether the errors in the models are due to the ineffectiveness of algorithms themselves or to errors and inconsistencies ...

Added: January 7, 2025

Cross-country analysis of science, technology and innovation policies: non-covid-19 related and Covid-19 specific STI policies in OECD countries

Russo M., Pavone P., Meissner D. et al., Quality and Quantity 2024 P. 1–25

In OECD countries, Science, Technology and Innovation (STI) policies were seen as key aspects of coping with the Covid-19 pandemic. Now that the pandemic is over, identifying which policy mix portfolios characterised countries in terms of their non-Covid-19 related and Covid-19 specific STI policies fills a knowledge gap on changes in STI policies induced by ...

Added: September 27, 2024

How does Burrows' Delta work on medieval Chinese poetic texts?

Orekhov B., / Series Computer Science "arxiv.org". 2024.

Burrows' Delta was introduced in 2002 and has proven to be an effective tool for author attribution. Despite the fact that it was applied to different languages, they mostly belong to the same grammatical type and use the same graphic principle to convey speech in writing: a phonemic alphabet with word separation using spaces. The question ...

Added: August 8, 2024

Parameter-Efficient Tuning of Transformer Models for Anglicism Detection and Substitution in Russian

Daniil Lukichev, Kryanina Darya, Anastasia Bystrova et al., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Вып. 22.Вып. 22.: [б.и.], 2023. P. 295–306.

Added: April 25, 2024

Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи

Lelik V., Eremicheva T., Morozova D. et al., В кн.: Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.: М.: «Буки Веди», Московский институт психоанализа, 2023. С. 274–279.

Some of the important conditions of the effectiveness of morphological analyzers are the correct recognition of unfamiliar words and successful morphological disambiguation. In this work, we evaluated the results of automatic processing of children’s spontaneous speech using the morphological analyzer MyStem. We analyzed the longitudinal spontaneous speech recordings of two bilingual children and their parents ...

Added: April 5, 2024

Integrated placental modelling of histology with gene expression to identify functional impact on fetal growth

Yong H. E., Maksym K., Yusoff M. A. et al., Cells 2023 Vol. 12 No. 7 Article 1093

Fetal growth restriction (FGR) is a leading cause of perinatal morbidity and mortality. Altered placental formation and functional capacity are major contributors to FGR pathogenesis. Relating placental structure to function across the placenta in healthy and FGR pregnancies remains largely unexplored but could improve understanding of placental diseases. We investigated integration of these parameters spatially ...

Added: February 28, 2024