• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Сложность русских правовых текстов: методы оценки и языковые данные
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.
14 мая 2026 г.
<a>Ученые ФКН ВШЭ представили работы в сфере ИИ и биоинформатики на ICLR 2026
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭи студенты трека «ИИ360: Инженерия искусственного интеллекта» бакалаврской программы «Прикладная математика и информатика» приняли участие в международной конференции ICLR — одном из самых авторитетных мировых форумов в области машинного обучения и представления данных. В этом году конференция состоялась в Рио-де-Жанейро (Бразилия).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Сложность русских правовых текстов: методы оценки и языковые данные

С. 175–182.
Блинова О. В., Тарасов Н. А.

Для создания модели автоматического определения сложности русских правовых текстов было необходимо собрать коллекцию таких текстов, разметить их, выделить параметры оценки сложности в применении к выбранному формату разметки. Эти шаги описываются в настоящей работе. Обозначается состав корпусов современных русских юридических текстов СorRIDA, CorDeс, CorCodex общим объемом 8,5 млн токенов. Описываются основания выбора инструментов лингвистической разметки (UDPipe, pymorphy2). Кратко характеризуются языковые признаки оценки сложности, среди которых: простейшие базовые метрики; пять формул читабельности; параметры оценки лексической сложности (значения TTR, Yule’s K, количество гапаксов, аббревиатур, абстрактных слов и мн. др.); параметры оценки морфосинтаксической и дискурсивной сложности (значения Noun-Verb Ratio; количество граммем генитива, среднего рода, пассива; относительных предложений, аппозитивных модификаторов, лексических средств дискурсивной связности и пр.).

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: legal documentsязыковая сложностьlinguistic complexitylexical complexityлексическая сложностьчитабельность текстаmorphosyntactic complexitydiscursive complexitysynchronous corpora of legal Russianправовые документыморфосинтаксическая сложностьдискурсивная сложностьрусские синхронные юридические корпусы

В книге

Труды международной конференции «Корпусная лингвистика-2021»
СПб.: Скифия-принт, 2021.
Похожие публикации
Geospatial effects on phonological complexity in the world’s languages
Hartmann F., Николс Д., Linguistic Typology 2025
Добавлено: 26 июля 2025 г.
Методические рекомендации по повышению удобочитаемости текстов: Как написать нормативный правовой акт простым языком?
Алимпеев Д. Р., Кнутов А. В., Плаксин С. М. и др., М.: Издательский дом НИУ ВШЭ, 2024.
Корней Чуковский называл канцелярит единственной по-настоящему существенной болезнью русского языка, а Нора Галь сравнивала стиль официальных актов с питанием «сухомяткой». В последние десятилетия нормативные акты стали значительно сложнее для восприятия: это объясняется обилием длинных предложений, речевой избыточностью и многократными повторами, активным использованием страдательного залога и причастных оборотов. Осознавая проблему, коллектив авторов предлагает всем интересующимся, особенно ...
Добавлено: 23 декабря 2024 г.
Субъективная трудность текстов виртуального тура по Эрмитажу: пилотное исследование
Колмогорова П. А., Куликова Е. Р., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 139–155
В статье обсуждается вопрос оценки трудности текстов, сопровождающих виртуальный тур по Главному музейному комплексу Государственного Эрмитажа. Методика оценки трудности, в отличие от сложности как более объективной, поддающейся параметризации характеристики текста, представляется открытым вопросом. В статье описываются результаты пилотного эксперимента, в котором информанты оценивали тексты, выделяя и комментируя фрагменты, вызывающие затруднения. Анализ показал, что наиболее частыми ...
Добавлено: 8 ноября 2024 г.
Лингвистическая сложность текстов жанра «виртуальная экскурсия по музею» (на материале виртуального визита в Государственный Эрмитаж)
Колмогорова А. В., Куликова Е. Р., Колмогорова П. А., Текст. Книга. Книгоиздание 2025 № 38 С. 29–54
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра.  Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Modeling lemma frequency bands for lexical complexity assessment of Russian texts
Блинова О. В., Tarasov N., Blekanov I. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.)Вып. 19(26).: М.: Изд-во РГГУ, 2020. P. 76–92.
Статья посвящена проблеме моделирования общеязыковой частотности с использованием данных больших русских корпусов. Нашей целью является выработка методики формирования общего частотного списка, который в дальнейшем можно будет использовать в том числе для оценки лексической сложности русских текстов. Мы сравнили 4 частотных списка, основанных на материале 4-х корпусов (Национального корпуса русского языка (НКРЯ), ruTenTen11, Araneum Russicum III Maximum, ...
Добавлено: 12 декабря 2022 г.
Оценка сложности русских правовых текстов: архитектура модели
Блинова О. В., Мир русского слова 2022 № 2 С. 4–13
В статье описана основанная на метриках модель оценки сложности русских правовых текстов. Архитектура модели подразумевает использование 130 метрик, разделённых на следующие категории: «базовые метрики», «формулы читабельности», «учёт слов разных частеречных классов», «n-граммы частеречных помет», «частотность лемм», «словообразовательные модели», «отдельные граммемы», «лексические и семантические признаки, неоднословные выражения», «синтаксические признаки», «оценки связности». Две метрики учитывают гипертекстовые связи ...
Добавлено: 29 октября 2022 г.
Word-formation complexity: a learner corpus-based study
Ляшевская О. Н., Pyzhak J.V., Виноградова О. И., Russian Journal of Linguistics 2022 Vol. 26 No. 2 P. 471–492
В статье рассматривается словообразовательная сложность учебных текстов, которая трактуется как система измерений, показывающих разнообразие приемов словообразования разного уровня, от простых до продвинутых, используемых учащимся. Анализируется взаимосвязь между сложностью и ошибками, которые учащиеся допускают в словообразовании. Исследование основано на материалах REALEC - корпуса английских экзаменационных эссе, написанных студентами университета с родным русским языком. Предлагается подход к ...
Добавлено: 5 октября 2022 г.
Язык нормативных правовых актов: пора ли бить тревогу?
Кнутов А. В., Чаплинский А. В., Алимпеев Д. Р., Вестник Пермского университета. Юридические науки 2022 № 3(57) С. 399–426
Введение: в статье описан опыт оценки удобочитаемости нормативных правовых актов посредством анализа сложности их синтаксических конструкций. По субъективному восприятию нормативные тексты становятся год от года сложнее, что затрудняет их толкование и уяснение правового смысла. Цель: проверить данную гипотезу на основе метрических показателей и в случае подтверждения сформулировать рекомендации по упрощению юридических текстов. Для этого были ...
Добавлено: 3 октября 2022 г.
Decisions of Russian Constitutional Court: Lexical Complexity Analysis in Shallow Diachrony
Блинова О. В., Belov S., Revazov M., , in: CEUR Workshop Proceedings (Proceedings of the International Conference "Internet and Modern Society" IMS-2020, 17-20 June 2020, ITMO University, St. Petersburg, Russia).: CEUR Workshop Proceedings, 2020. Ch. 5 P. 61–74.
Добавлено: 1 ноября 2020 г.
Русские официальные документы домена “Здравоохранение” и оценка их лексической сложности с использованием ключевых слов
Блинова О. В., Белов С. А., В кн.: Труды международной конференции «Корпусная лингвистика-2019».: Издательство Санкт-Петербургского государственного университета, 2019. С. 166–173.
Представленное исследование выполняется в русле изучения доступности для восприятия и понимания русских официальных документов из социальных доменов здравоохранения, культуры и образования. Материал — Корпус русских локальных документов и актов CorRIDA, подкорпус документов здравоохранения (617 107 токенов). Исследование направлено на выявление лексической специфики официальных документов домена с помощью метода извлечения ключевых словоформ, а также на оценку полученных ключевых словоформ с точки зрения их общеязыковой частотности. Анализируя ключевые ...
Добавлено: 1 ноября 2020 г.
Why is gender so complex? Some typological considerations
Николс Д., , in: Grammatical gender and linguistic complexityVol. 1: General issues and specific studies.: Berlin: Language Science Press, 2019. Ch. 4 P. 63–92.
Добавлено: 4 ноября 2019 г.
Grammatical gender and linguistic complexity
Berlin: Language Science Press, 2019.
Добавлено: 4 ноября 2019 г.
Automated assessment of learner text complexity
Ляшевская О. Н., Irina Panteleeva, Olga Vinogradova, Assessing Writing 2021 No. 49 Article 100529
Добавлено: 20 октября 2019 г.
Inspector: The Tool For Automated Assessment Of Learner Text Complexity
Olga I. Vinogradova, Olga N. Lyashevskaya, Irina M. P., / NRU Higher School of Economics. Series WP BRP 55/LNG/2017. 2019. No. 79.
Добавлено: 10 октября 2019 г.
Русский язык: статус и динамика развития на современном этапе
Сомин А. А., Пиперски А. Ч., Кронгауз М. А. и др., / Россйская Академия народного хозяйства и государственной службы. Серия SSRN "working papers series". 2014.
Изменения в языке (в первую очередь — в лексике, в значении слов и в речевом этикете) стали главным объектом исследования в настоящем проекте. Однако ценность описания подобных изменений значительно возрастает, если мы открываем причины, запускающие механизмы изменений, то есть предлагаем внешнюю интерпретацию для внутриязыковых изменений. Поэтому в проекте исследуется динамика изменений русского языка в постперестроечную ...
Добавлено: 17 марта 2016 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору