?
Использование корпусных технологий для изучения ошибок: learner corpora на факультете филологии НИУ ВШЭ
Научно-техническая информация. Серия 2: Информационные процессы и системы. 2015. № 1. С. 21-26.
Кутузов А. Б., Кузьменко Е. А.
Представлен проект факультета филологии НИУ ВШЭ по созданию двух корпусов текстов, предоставляющих исследователям лингвистический материал с разнообразными ошибками. Первый корпус, состоящий из академических текстов, написанных студентами НИУ ВШЭ, содержит материал по типам ошибок, совершаемых в английском языке носителями русского языка. Второй корпус, содержащий англо-русские и русско-английские переводы, выполненные студентами переводческих специальностей, предоставляет возможность исследовать ошибки и вариативность в переводе. Несмотря на широкое распространение корпусов ошибок, для русского языка подобные ресурсы создаются впервые.
Научное направление:
Филология и лингвистика
Язык:
русский
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Архангельский Т. А., Гильмуллин Р. А., Невзорова О. А. и др., Научно-техническая информация. Серия 2: Информационные процессы и системы 2013
В статье описывается электронный корпус татарского языка, созданный в рамках программы фундаментальных исследований Президиума РАН "Корпусная лингвистика", и методы, использованные авторами для создания этого корпуса. В частности, описываются текстовый состав и жанровая структура корпуса, принятые авторами решения о выделении морфологических характеристик, автоматическая морфологическая разметка текстов с помощью двухуровневой модели морфологии и анализатора PC-KIMMO и размещение ...
Добавлено: 25 октября 2013 г.
СПб. : Издательство Санкт-Петербургского университета, 2019
Сборние содержит материалы докладов, представленных на Международной научной конференции "Корпусная лингвистика-2019" 24-28 июня 2019 г. в Санкт-Петербурге. ...
Добавлено: 8 июля 2019 г.
Издательство Санкт-Петербургского государственного университета, 2019
Сборник содержит материалы докладов, представленных на Международной научной конференции «Корпусная лингвистика-2019» 24–28 июня 2019 г. в Санкт-Петербурге. Создание корпусов текстов является одним из приоритетных направлений в современной лингвистике. Проведение конференции по данной тематике знакомит ученых с современными разработками и новыми технологическими решениями в этой области, а также способствует обобщению опыта научных исследований по корпусной лингвистике. ...
Добавлено: 1 ноября 2020 г.
Сибирцева В. Г., Хоменко А. Ю., Баранова Ю. Н., Образовательные технологии и общество 2013 Т. 16 № 3 С. 508-521
В статье идёт речь о разработках научно-учебной группы студентов и преподавателей Национального исследовательского университета – Высшей школы экономики «Корплинги (Нижний Новгород-Москва)». Данная работа связана с исследованиями в области компьютерной и корпусной лингвистики. Разработки нацелены в первую очередь на создание интерактивных ресурсов, основанных на материалах Национального корпуса русского языка, для обучения студентов русскому языку как иностранному. ...
Добавлено: 4 октября 2013 г.
Феногенова А. С., Кузьменко Е. А., / НИУ ВШЭ. Series WP BRP "Linguistics". 2016.
Добавлено: 14 декабря 2016 г.
M. : Russian State University for the Humanitie, 2015
Добавлено: 28 апреля 2015 г.
Лаврентьев А. М., Соловьев Ф. Н., Суворова М. И. и др., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2018 Т. 16 № 3 С. 19-31
ПлатформаTXM предоставляет широкие возможности корпусного анализа, такие как анализ соответствий,
кластеризация, построение лексических таблиц, поиск сложных лексических конструкций, выделение подкорпу-сов по различным параметрам. По умолчанию платформа работает со словоупотреблениями в качестве структур-ных единиц анализа. Она интегрирована с единственным расширениемTreeTagger, позволяющим проводить лишь морфологический анализ и лемматизацию словоупотреблений. Однако пользователь может сопроводить каждое словоупотребление набором дополнительных характеристик, ...
Добавлено: 8 сентября 2018 г.
M. : Russian State University for the Humanitie, 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...
Добавлено: 16 октября 2019 г.
Бонч-Осмоловская А. А., Компьютерная лингвистика и интеллектуальные технологии 2015 Т. 1 № 14(21) С. 80-95
В статье предлагаются новые подходы к исследованию проблемы дативных субъектов в русском языке в предикативных и атрибутивных конструкциях. Исследуется изменение дистрибуции употребления выраженного дативного субъекта у предитативов и прилагательных в 18 и 21 веках. Строится иерархическая классификация, показывающая то, как разные мофросинтаксические конструкции делятся на классы по близости поведения и как состав этих классов меняется ...
Добавлено: 15 апреля 2015 г.
Архангельский Т. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2012 № 4 С. 24-29
Представлены четыре электронных корпуса, созданные в 2011 г. в рамках Программы фундаментальных исследований РАН «Корпусная лингвистика»: албанский, калмыцкий, лезгинский и осетинский. Даётся описание интерфейса и функциональности этих корпусов, освещаются технические вопросы, которые пришлось решать при их создании, обсуждаются перспективы их развития. Особое внимание уделяется вопросам составления грамматических словарей и автоматической грамматической разметки корпусов. ...
Добавлено: 31 октября 2012 г.
М. : Изд-во РГГУ, 2017
16-й выпуск ежегодника «Компьютерная лингвистика и интеллектуальные технологии» содержит избранные материалы 23-й международной конференции «Диалог». Работы в сборнике отражают направления исследований в области компьютерного моделирования и анализа естественного языка, которые по традиции представляются на конференции. ...
Добавлено: 15 марта 2017 г.
Lavrentiev A. M., Шерстинова Т. Ю., Чеповский А. М. и др., Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya 2021 Vol. 70 P. 69-89
The purpose of this paper is to test the methodological tools provided by TXM platform for research on dynamics of vocabulary and punctuation marks in diachronic corpora. TXM is a powerful text analysis software which provides both quantitative and qualitative features in a transparent open-source implementation. In this paper, we demonstrate how it can be ...
Добавлено: 24 июня 2021 г.
Казарцев Е. В., Jahrbuch für Internationale Germanistik 2016 No. 1 P. 53-72
Статья посвящена проблеме изучения метрики и ритмики стиха лингво-статистическими методами. Эти методы развивались в рамках русского и славянского стиховедения в 20 веке и были перенесены в американскую науку. В то время как в Западной Европе эти методы до сих пор практически не применялись. В статье предлагается опыт использования данной методики для немецкого и, в меньшей ...
Добавлено: 5 июня 2016 г.
М. : Изд-во РГГУ, 2020
Сборник включает 60 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2020», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 26 июня 2020 г.
Добавлено: 29 сентября 2016 г.
Svetlana S. Bodrunova, Кольцова Е. Ю., Sergey Koltcov и др., International Journal of Communication 2017 Vol. 11 P. 3242-3264
Добавлено: 4 октября 2017 г.
Китов В. В., Научные труды Вольного экономического общества России 2014 Т. 186 С. 228-235
В работе рассматривается применение известного алгоритма «обучения трансформаций» для генерации правил, автоматически определяющих части речи в тексте. Приводятся результаты по точности применения алгоритма к размеченной выборке русского языка, а также демонстрируются правила, обеспечивающие наибольший прирост точности. ...
Добавлено: 16 марта 2016 г.
Panchenko A., Лопухина А. А., Ustalov D. и др., Компьютерная лингвистика и интеллектуальные технологии 2018 No. 17 P. 547-564
В статье описываются результаты первого соревнования по автоматиче- скому извлечению значений слов из неразмеченного корпуса текстов для русского языка. Подобные соревнования проводились для некоторых ро- манских и германских языков; мы исследуем методы извлечения значений и разрешения многозначности на материале одного из славянских языков, обладающих богатой морфологией и достаточно свободным порядком слов. Участникам соревнования было предложено ...
Добавлено: 7 июня 2018 г.
М. : Азбуковник, 2013
В настоящий сборник вошли статьи, подготовленные с использованием материалов поэтического корпуса Национального корпуса русского языка. Авторы статей прослеживают на обширном материале историю отдельных слов в языке поэзии, анализируют разные аспекты поэтической грамматики и семантики, рассматривают некоторые формальные параметры русского стиха.
Сборник предназначен для специалистов в области лингвистической поэтики, стиховедения, а также для тех, кто интересуется современными ...
Добавлено: 28 сентября 2013 г.
[б.и.], 2016
Добавлено: 1 декабря 2016 г.
М. : Изд-во РГГУ, 2015
Сборник содержит труды 21-й Международной конференции по компьютерной лингвистике. ...
Добавлено: 20 мая 2015 г.
Кузнецов И. О., Научно-техническая информация. Серия 2: Информационные процессы и системы 2012 № 12
Представлен краткий обзор теоретических и практических моделей, используемых при решении задачи автоматической разметки семантических актантов.Рассматривается понятие семантической роли и место этого конструкта в общей языковой системе, проблема составления ролевых инвентарей, а также различные аспекты реализации автоматической разметки актантов с помощью алгоритмов машинного обучения. Также рассматривается ряд проблем, связанных сэтой областью, в частности, проблема «языкозависимости» современных ...
Добавлено: 23 декабря 2013 г.
Coimbra : Association for Computational Creativity, 2020
Добавлено: 29 сентября 2020 г.
М. : Издательский центр «Российский государственный гуманитарный университет», 2019
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 16 октября 2019 г.