Автоматическая лингвистическая разметка китайских текстов, содержащих заимствования: словоделение, транскрипция, PoS-тэггинг

АБВ
АБВ
АБВ

Обычная версия сайта

Приоритетные направления

по году

Тематика

19 февраля 2026 г.

Разработка ученых ВШЭ для быстрой диагностики афазии опубликована на RuStore

Нейролингвисты Центра языка и мозга НИУ ВШЭ разработали приложение для быстрой диагностики афазии — нарушений речи, возникающих в результате травм головы, инсультов или других неврологических заболеваний. Этот инструмент за 5 минут позволяет оценить наличие и степень выраженности речевых нарушений и оперативно принять решение о направлении к логопеду и разработать план реабилитации. Быстрый тест на афазию доступен для скачивания на RuStore.

19 февраля 2026 г.

«Вышка - место, где формируются научные школы»

11 февраля в НИУ ВШЭ состоялась церемония награждения победителей конкурса на лучшую научно‑исследовательскую работу студентов (НИРС) 2025 года. Всего в нем участвовала 2061 работа. По итогам экспертной оценки звания победителей и лауреатов получили 366 студентов по таким секциям, как социальные науки, экономико‑менеджериальные дисциплины, точные и гуманитарные науки, а также креативные индустрии.

16 февраля 2026 г.

Ученые ВШЭ: молодые россияне знают достаточно о деньгах, но не умеют ими распоряжаться

Подростки и молодые люди в России сегодня хорошо ориентируются в финансовых терминах: знают, что такое банковские карты, кредиты, проценты и онлайн-платежи. Однако, как выяснили ученые НИУ ВШЭ, реальные навыки обращения с деньгами у большинства из них пока развиты слабо. Исследование «Финансовая грамотность, финансовая культура и финансовая автономия молодежи» опубликовано в издании «Мониторинг общественного мнения: экономические и социальные перемены».

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации

?

Автоматическая лингвистическая разметка китайских текстов, содержащих заимствования: словоделение, транскрипция, PoS-тэггинг

С. 1081–1094.

Коновалова А. С., Вольф Е. А., Семенов К. И., Короткова Ю. О.

В статье описываются проблемы лингвистической аннотации китайских текстов в Русско-китайском параллельном корпусе НКРЯ (далее – Корпус) и пути их решения. Особенное внимание уделяется проблеме обработки заимствований из русского языка. Представлено описание экспериментов в трех аспектах лингвистической разметки: словоделения, фонетической аннотации (G2P) и морфологической аннотации (PoS-тэггинг). Также описано создание датасетов, разработанных на основе данных Корпуса, которые могут быть использованы в дальнейших исследованиях нестандартных текстов на китайском языке. Полученные результаты исследования планируется применить для переразметки и дальнейшей обработки текстов в Корпусе.

Язык: русский

DOI

Текст на другом сайте

Ключевые слова: chinese word segmentation grapheme-to-phoneme conversion (G2P)PoS-tagging out-of-vocabulary problem (OOV)code-switching detection автоматическая сегментация автоматическая транскрипция морфологическая аннотация проблема слов вне словаря автоматическое определение смены кодов

В книге

Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)

Issue 20: Основной том. , -, 2021.