?
Автоматизация процесса адаптации текстов для электронных учебников. Проблемы и перспективы (на примере русского языка)
Nová rusistika/ Новая русистика. 2014. № 1. С. 19-35.
Сибирцева В. Г., Карпов Н. В.
В статье описан опыт использования аутентичных материалов Национального корпуса русского языка в рамках проекта «Создание электронного учебника по русскому языку как иностранному языку». Особое внимание уделяется рассмотрению путей автоматической адаптации языкового материала лингвистического корпуса и новостных статей. Анализируется возможность автоматического упрощения сложных аутентичных текстов с точки зрения их лексики, а также синтаксической и морфологической структуры. В статье описывается не только алгоритм решения поставленных задач, но и трудности, с которыми сталкиваются разработчики
Научное направление:
Филология и лингвистика
Язык:
русский
Ключевые слова: Национальный корпус русского языкарусский язык как иностранныйRussian as a foreign languageRussian National CorpusAutomatic adaptation of textsавтоматическая адаптация текстаморфология и синтаксис
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Сибирцева В. Г., Хоменко А. Ю., Баранова Ю. Н., Образовательные технологии и общество 2013 Т. 16 № 3 С. 508-521
В статье идёт речь о разработках научно-учебной группы студентов и преподавателей Национального исследовательского университета – Высшей школы экономики «Корплинги (Нижний Новгород-Москва)». Данная работа связана с исследованиями в области компьютерной и корпусной лингвистики. Разработки нацелены в первую очередь на создание интерактивных ресурсов, основанных на материалах Национального корпуса русского языка, для обучения студентов русскому языку как иностранному. ...
Добавлено: 4 октября 2013 г.
Сибирцева В. Г., Rocznik Instytutu Polsko-Rossyjskiego 2013 № 2 (5) С. 98-110
Применение НКРЯ и программ автоматического выравнивания текстов является новым этапом в обучении иностранным языкам, в частности, русскому языку как иностраному. В статье демонстрируются возможности параллельного подкорпуса НКРЯ (на примере русских и польских текстов, а также их переводов) и коллекции выровненных параллельных текстов, созданной при помощи бесплатного программного продукта LF aligner, для последующей разработки творческих лексико-стилистических ...
Добавлено: 16 февраля 2014 г.
Сибирцева В. Г., Карпов Н. В., / Издательский дом НИУ ВШЭ. Series WP "Working Papers of Humanities". 2012. No. 2012-6.
Рассматриваются особенности отбора учебного иллюстративного материала для теоретической части мультимедийного учебника по русскому языку как иностранному "Русский глагол. Словообразование" и описывают возможности составления различных упражнений на базе Национального корпуса русского языка. На материале Корпуса разработана технология создания электронного учебника, применимая для любого учебника иностранного языка. Технология позволяет внедрять в учебник вспомогательные всплывающие подсказки. Подсказка состоит ...
Добавлено: 8 ноября 2012 г.
Карпов Н. В., Сибирцева В. Г., / НИУ ВШЭ. Series WP BRP "Linguistics". 2014.
Добавлено: 10 декабря 2014 г.
Бонч-Осмоловская А. А., Труды института русского языка им. В.В. Виноградова 2015 Т. 4 № 6 С. 605-641
Культуромика – новый метод исследования культурных и социальных процессов с помощью статистического анализа употребления слов и словосочетаний в огромных текстовых массивах. Исследования по культуромике выполняются на базе Google ngrams, хранилища всех сочетаний слов для каждого года длиной от 1 до 5 на 8 языках. Однако работа с большими данными обладает рядом проблем, решить которые предлагается, ...
Добавлено: 14 марта 2016 г.
Ляшевская О. Н., М. : Языки славянской культуры, 2016
Русская корпусная лингвистика представлена в монографии двумя направлениями. Первая часть включает описание подходов и методов аннотации Национального корпуса русского языка (http://ruscorpora.ru), включая разметку лексико-грамматической, лексико-семантической, семантико-синтаксической и словообразовательной информации. Кроме того, описываются процедуры оценки инструментов автоматической разметки текстов (морфологических и синтаксических парсеров) и идеология создания двух частотных корпусных словарей, общего и лексико-грамматического. Во вторую часть ...
Добавлено: 26 марта 2015 г.
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2016 Т. 47 № 2 С. 7-25
В работе рассматриваются два подхода к разработке автоматической аннотации корпуса старорусских текстов XV–XVII вв., включенных в Национальный корпус русского языка (НКРЯ). Лексико-грамматическая аннотация состоит в определении части речи, грамматических характеристик и начальной формы слова (леммы) для каждой словоформы корпуса. Язык старорусской письменности совмещает в себе, с одной стороны, черты древнерусского словоизменения, включая формы аориста и ...
Добавлено: 14 декабря 2016 г.
Орехов Б. В., Савчук С. О., Труды института русского языка им. В.В. Виноградова 2019 № 21 С. 61-82
В настоящей статье рассмотрено несколько вопросов, связанных с разработкой и использованием акцентологического корпуса в качестве инструмента для исследования ударения: состав и структура корпуса, текущее состояние, перспективы развития, пополнение новым материалом. Особое внимание уделено подкорпусу наивной поэзии в составе акцентологического корпуса как источнику акцентологических данных. Возможности этого ресурса, его эффективное использование проверены на нескольких участках акцентологической ...
Добавлено: 25 марта 2020 г.
Ляшевская О. Н., Власова Е. А., Литвинцева К. В. и др., / НИУ ВШЭ. Series WP BRP "Linguistics". 2018. No. 77.
Добавлено: 13 декабря 2018 г.
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2017 Т. 51 С. 11-20
Рассматривается проблематика нестабильной орфографии корпуса текстов позднедревнерусского периода в свете их автоматической обработки. Тексты Старорусского корпуса Национального корпуса русского языка (НКРЯ) включают памятники, написанные преимущественно в XV-XVII вв., т. е. в тот период, когда вариативность написания слов была общераспространенным явлением. Задача лексико-грамматической разметки словоформ в корпусе заключается в определении начальной формы (словарной формы, леммы), части ...
Добавлено: 14 декабря 2016 г.
Бонч-Осмоловская А. А., Шаги/Steps 2018 № 4 С. 115-146
Исследование рассматривает конструкции, включающие в себя название десятилетия – двадцатые, тридцатые, сороковые и т.д. – и определяющее его прилагательное. Интерес к этим конструкциям обусловлен предположением, что по спискам прилагательных, сочетающихся с каждым из десятилетий, и их частотностям можно восстановить мнемонический образ каждого из десятилетий советской и постсоветской истории. Исследование сделано на материале выборки из Национального корпуса русского языка. ...
Добавлено: 15 апреля 2018 г.
М. : Изд-во РГГУ, 2020
Сборник включает 60 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2020», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 26 июня 2020 г.
М. : МГИМО-Университет, 2018
В сборник вошли статьи участников V Международной научно-методической конференции "Преподавание русского языка как иностранного в вузе: традиции, новации и перспективы" (Москва, 1-2 марта 2018), проходившей в МГИМО МИД России. ...
Добавлено: 7 марта 2018 г.
Panchenko A., Лопухина А. А., Ustalov D. и др., Компьютерная лингвистика и интеллектуальные технологии 2018 No. 17 P. 547-564
В статье описываются результаты первого соревнования по автоматиче- скому извлечению значений слов из неразмеченного корпуса текстов для русского языка. Подобные соревнования проводились для некоторых ро- манских и германских языков; мы исследуем методы извлечения значений и разрешения многозначности на материале одного из славянских языков, обладающих богатой морфологией и достаточно свободным порядком слов. Участникам соревнования было предложено ...
Добавлено: 7 июня 2018 г.
Lavrentiev A. M., Шерстинова Т. Ю., Чеповский А. М. и др., Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya 2021 Vol. 70 P. 69-89
The purpose of this paper is to test the methodological tools provided by TXM platform for research on dynamics of vocabulary and punctuation marks in diachronic corpora. TXM is a powerful text analysis software which provides both quantitative and qualitative features in a transparent open-source implementation. In this paper, we demonstrate how it can be ...
Добавлено: 24 июня 2021 г.
Казарцев Е. В., Jahrbuch für Internationale Germanistik 2016 No. 1 P. 53-72
Статья посвящена проблеме изучения метрики и ритмики стиха лингво-статистическими методами. Эти методы развивались в рамках русского и славянского стиховедения в 20 веке и были перенесены в американскую науку. В то время как в Западной Европе эти методы до сих пор практически не применялись. В статье предлагается опыт использования данной методики для немецкого и, в меньшей ...
Добавлено: 5 июня 2016 г.
Alexeeva S. V., Protopopova E. V., Bodrova A. A. и др., Компьютерная лингвистика и интеллектуальные технологии 2014 P. 562-571
Добавлено: 8 октября 2014 г.
Coimbra : Association for Computational Creativity, 2020
Добавлено: 29 сентября 2020 г.
Кузнецов И. О., Научно-техническая информация. Серия 2: Информационные процессы и системы 2012 № 12
Представлен краткий обзор теоретических и практических моделей, используемых при решении задачи автоматической разметки семантических актантов.Рассматривается понятие семантической роли и место этого конструкта в общей языковой системе, проблема составления ролевых инвентарей, а также различные аспекты реализации автоматической разметки актантов с помощью алгоритмов машинного обучения. Также рассматривается ряд проблем, связанных сэтой областью, в частности, проблема «языкозависимости» современных ...
Добавлено: 23 декабря 2013 г.
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 16 октября 2019 г.
Stroudsburg, PA : Association for Computational Linguistics, 2019
Добавлено: 5 октября 2020 г.
L. : Routledge, 2014
This book provides a comprehensive analysis of the ways in which new media technologies have shaped language and communication in contemporary Russia. It traces the development of the Russian-language internet (Runet) from late-Soviet cybernetics to the advent of Twitter and explores the evolution of web-based communication practices, showing how they have both shaped and been ...
Добавлено: 11 декабря 2013 г.
Svetlana S. Bodrunova, Кольцова Е. Ю., Sergey Koltcov и др., International Journal of Communication 2017 Vol. 11 P. 3242-3264
Добавлено: 4 октября 2017 г.
[б.и.], 2016
Добавлено: 1 декабря 2016 г.