?
Создание лексико-грамматической базы для старорусского корпуса НКРЯ
С. 229-234.
Работа посвящена разработке морфологического анализатора для Корпуса старорусской письменности Национального корпуса русского языка (НКРЯ, http://ruscorpora.ru/search-mid_rus.html). Задачи включают составление грамматического словаря, списка словоизменительных парадигм, а также обработку вариативности, представленной в текстах старорусского корпуса.
В книге
Ижевск, В : Lietuvos mokslo taryba, 2016
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2016 Т. 47 № 2 С. 7-25
В работе рассматриваются два подхода к разработке автоматической аннотации корпуса старорусских текстов XV–XVII вв., включенных в Национальный корпус русского языка (НКРЯ). Лексико-грамматическая аннотация состоит в определении части речи, грамматических характеристик и начальной формы слова (леммы) для каждой словоформы корпуса. Язык старорусской письменности совмещает в себе, с одной стороны, черты древнерусского словоизменения, включая формы аориста и ...
Добавлено: 14 декабря 2016 г.
Гаврилова Т. С., Шалганова Т. А., Ляшевская О. Н., Вестник Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология 2017 Т. 51 С. 11-20
Рассматривается проблематика нестабильной орфографии корпуса текстов позднедревнерусского периода в свете их автоматической обработки. Тексты Старорусского корпуса Национального корпуса русского языка (НКРЯ) включают памятники, написанные преимущественно в XV-XVII вв., т. е. в тот период, когда вариативность написания слов была общераспространенным явлением. Задача лексико-грамматической разметки словоформ в корпусе заключается в определении начальной формы (словарной формы, леммы), части ...
Добавлено: 14 декабря 2016 г.
Митрофанова О. А., Паничева П. В., Компьютерная лингвистика и интеллектуальные технологии 2013 Т. 19 С. 465-477
Доклад отражает новые результаты, полученные в ходе совместного про- екта кафедры математической лингвистики СПбГУ с разработчиками Национального корпуса русского языка (НКРЯ, http://ruscorpora.ru). Цель исследования — разработка технологии автоматического распознавания в тексте конструкций, связанных с той или иной лексической единицей, и применение этой технологии в создании каталога русских лексиче- ских конструкций. Выделение конструкций предполагает использование потенциала ...
Добавлено: 30 сентября 2015 г.
Даниэль М. А., , in : Partitive cases and related categories. : Berlin, NY : De Gruyter Mouton, 2014. Ch. 9. P. 347-377.
This paper is an overview of the so-called second genitive in Russian, a nominal form available for a minority of Russian nouns but widely used with these nouns in certain contexts. In many ways, the second genitive is a secondary case. Thus, it may always be substituted with a regular genitive form, while the opposite ...
Добавлено: 17 октября 2013 г.
Митрофанова О. А., Паничева П. В., В кн. : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т. Т. 1: Основная программа конференции. Вып. 12 (19).: М. : РГГУ, 2013. С. 465-477.
Работа отражает новые результаты, полученные в ходе совместного проекта кафедры математической лингвистики СПбГУ с разработчиками Национального корпуса русского языка (НКРЯ, http://ruscorpora.ru). Цель исследования – разработка технологии автоматического распознавания в тексте конструкций, связанных с той или иной лексической единицей, и применение этой технологии в создании каталога русских лексических конструкций. Выделение конструкций предполагает использование потенциала многоплановой лингвистической ...
Добавлено: 23 сентября 2013 г.
Ляшевская О. Н., , in : Computational Linguistics and Intellectual Technologies. Issue 18.: M. : Russian State University for the Humanitie, 2019. P. 422-434.
Статья посвящена созданию морфологического стандарта для разметки Старорусского корпуса, который входит в состав исторических корпусов Национального корпуса русского языка (НКРЯ). Для того, чтобы сделать разметку удобной для лингвистов, работающих с историческими и современными корпусами, а также для разработчиков систем автоматической обработки исторических текстов, мы предусматриваем две параллельные схемы морфологической разметки, в нотации НКРЯ и Универсальных зависимостей ...
Добавлено: 12 июня 2019 г.
В статье подводятся итоги проекта фундаментальной реконструкции и модернизации платформы Национального корпуса русского языка, осуществленного в 2020-2023 годах. В фокусе статьи новые возможности, которые открываются для лингвистов и более широкой аудитории, в частности, улучшение репрезентативности имеющихся корпусов, создание новых корпусов, новая разметка, полученная с помощью применения нейросетевых моделей, новые интерфейсные решения. Более детально рассматриваются три ...
Добавлено: 21 марта 2024 г.
Даниэль М. А., Khurshudian V., , in : Linguistics of Temperature. : Amsterdam : John Benjamins Publishing Company, 2015. P. 392-439.
This paper is an analysis of lexical categorisation of the temperature domain in modern Eastern Armenian. Compared to the vast research outline proposed in (Koptjevskaja-Tamm 2011), this paper has several important limitations. First, it is focused on non-derived, primary temperature terms (most of which happen to be adjectives or nouns, or both). Derived lexical items, ...
Добавлено: 17 октября 2013 г.
Холодилова М. А., В кн. : Материалы к корпусной грамматике русского языка. Выпуск II. Синтаксические конструкции и грамматические категории. : М. : Издательство Нестор-История, 2017. С. 205-279.
В главе рассматривается устройство относительных предложений в русском языке. Рассматриваются как данные о грамматической приемлемости различных синтаксических структур, так и количественные данные об их распределении, полученные в результате корпусного исследования. ...
Добавлено: 21 января 2019 г.
М. : Изд-во РГГУ, 2015
Сборник содержит труды 21-й Международной конференции по компьютерной лингвистике. ...
Добавлено: 20 мая 2015 г.
Москвина А. Д., Митрофанова О. А., Ерофеева А. Р. и др., В кн. : Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017». : СПб. : Издательство СПбГУ, 2017. С. 268-275.
В работе представлены результаты работы по модификации алгоритма RAKE, используемого для быстрого извлечения ключевых слов и словосочетаний. В качестве источника информации о границах синтаксических групп в RAKE предлагаются правила грамматики синтаксического анализатора для русского языка на основе NLTK (NLTK4RUSSIAN). Для определения эффективности работы алгоритма с русскоязычными текстами были проведены эксперименты на материале представительных корпусов. ...
Добавлено: 29 сентября 2020 г.
Кибрик А. А., Худякова М. В., Добров Г. Б. и др., Frontiers in Psychology 2016 Vol. 7 No. 1429 P. 1-21
Добавлено: 28 сентября 2016 г.
Пиперски А. Ч., В кн. : Двенадцатая Конференция по типологии и грамматике для молодых исследователей. Тезисы докладов (Санкт-Петербург, 19–21 ноября 2015 г.). : СПб. : Издательство Нестор-История, 2015. С. 69-72.
Исследование особенностей русских двувидовых глаголов при помощи корпусных методов ...
Добавлено: 22 ноября 2015 г.
Пиперски А. Ч., , in : Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). : М. : Изд-во РГГУ, 2015. P. 494-500.
В статье обсуждаются понятия приемлемости, встречаемости, грамматичности и существования, в первую очередь — связь между корпусной лингвистикой и вопросом о существовании единиц лексикона. Доказывается, что корпуса не могут свидетельствовать о несуществовании слова, поскольку они обычно являются выборками из некоторой генеральной совокупности, а верхняя граница доверительного интервала для частотности на основе выборки всегда больше 0, вне
зависимости ...
Добавлено: 13 марта 2016 г.
Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. и др., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58-65
Цель исследования: разработка методики сравнения специальных корпусов текстов для последующего применения в задачах идентификации экстремистских текстов. Метод: применялись частотные методы и показатель специфичности для анализа текстов в рамках корпусной платформы TXM. Полученные результаты: разработана методика сравнительного анализа специальных корпусов текстов, которая позволяет выявлять неявные связи между корпусами разнородных текстов; показана возможность использования индекса специфичности для ...
Добавлено: 31 октября 2020 г.
Бочкарев А. Е., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2016 Т. 14 № 3 С. 5-14
В статье рассматриваются способы и средства отображения страха в русской языковой картине мира. Обращение к Национальному корпусу русского языка позволяет, в частности, установить, что пропозициональная модель, характеризующая наше знание о страхе, включает информацию о том, что в наиболее привычных своих проявлениях страх передается, охватывает и парализует, что состояние страха испытывают обычно за то, чем дорожат, ...
Добавлено: 28 ноября 2016 г.
Власова Е. А., Бец Ю. В., Северина Е. М., В кн. : «Русская грамматика в диалоге научных школ, направлений, методов». : Владивосток : Издательство ДВФУ, 2022.
В статье анализируются нетривиальные фонетические и грамматические явления устной речи иностранцев, изучающих русский язык. Показано, что устный учебный корпус позволяет получить систематическое представление о компенсаторных механизмах речепорождения, проверять и формулировать гипотезы. ...
Добавлено: 8 ноября 2023 г.
Кузьмина Т. А., Ученые записки национального общества прикладной лингвистики 2013 № 1(1) С. 26-35
В работе представлены результаты изучения инструментов корпусной лингвистики, которые представляют широкий спектр возможностей для развития навыков академического письма. Исследуются некоторые практические аспекты названных технологий, которые позволяют существенно улучшить точность и правильность изложения материала. ...
Добавлено: 24 апреля 2013 г.
Зевахина Н. А., Джакупова С. С., , in : Материалы 21-й Международной конференции по компьютерной лингвистике "Диалог". : М. : Изд-во РГГУ, 2015.
Добавлено: 20 мая 2015 г.
Андриянец В. А., Даниэль М. А., Pakendorf B., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.). Вып. 17(24).: М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 28-38.
Добавлено: 19 июня 2018 г.
Хоменко А. Ю., В кн. : Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования: материалы Х Международного конгресса по когнитивной лингвистике. 17–20 сентября 2020 г. Т. 2(41).: Уральский государственный педагогический университет, 2020. С. 893-897.
В настоящей статье речь пойдет о применении интегративного подхода к определению гендера в рамках решения задач судебной лингвистики. Автор интегрирует методы когнитивной науки, корпусной и, шире, компьютерной лингвистики, а также классический структурный анализ текста для идентификации характеристик мужской и женской речи. ...
Добавлено: 11 августа 2021 г.
Скоринкин Д. А., В кн. : Два века в двадцати словах. : М. : Издательский дом НИУ ВШЭ, 2016. С. 294-316.
Статья рассказывает о развитии и изменении значений слова "Публика" на протяжениии XIX-XX веков ...
Добавлено: 12 мая 2016 г.
Пиперски А. Ч., В кн. : Труды Международной научной конференции "Корпусная лингвистика-2015". : СПб. : Издательство СПбГУ, 2015. С. 374-381.
В статье анализируется употребление двусложных сравнительных союзов будто, словно и точно у 15 русских поэтов в тех позициях, где эти слова метрически взаимозаменяемы. Показано, что частота этих союзов возрастает после окончания золотого века русской поэзии (1-я треть XIX века). Если в начале XIX века на роль основного двусложного союза претендует союз будто, то в последу- ...
Добавлено: 15 марта 2017 г.
Vydrin V., Rovenchak A., Маслинский К. А., , in : Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Vol. 11: Traitement automatique des langues africaines (TALAf) .: P. : Association pour le Traitement Automatique des Langues, 2016. P. 87-94.
Добавлено: 10 марта 2017 г.