• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Сложность русских правовых текстов: методы оценки и языковые данные
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.
2 июня 2026 г.
От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем
Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.

4 июня 2026 г.
«Я хочу, чтобы люди больше доверяли науке»
Выбирая специальность «фундаментальная и прикладная лингвистика», Татьяна Еремичева думала, что это про изучение языков, а оказалось — про помощь людям. В интервью проекту «Молодые ученые Вышки» она рассказала о науке как инструменте приятия этого мира, бильярде как варианте тимбилдинга и о том, как иногда непросто научиться читать.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Сложность русских правовых текстов: методы оценки и языковые данные

С. 175–182.
Блинова О. В., Тарасов Н. А.

Для создания модели автоматического определения сложности русских правовых текстов было необходимо собрать коллекцию таких текстов, разметить их, выделить параметры оценки сложности в применении к выбранному формату разметки. Эти шаги описываются в настоящей работе. Обозначается состав корпусов современных русских юридических текстов СorRIDA, CorDeс, CorCodex общим объемом 8,5 млн токенов. Описываются основания выбора инструментов лингвистической разметки (UDPipe, pymorphy2). Кратко характеризуются языковые признаки оценки сложности, среди которых: простейшие базовые метрики; пять формул читабельности; параметры оценки лексической сложности (значения TTR, Yule’s K, количество гапаксов, аббревиатур, абстрактных слов и мн. др.); параметры оценки морфосинтаксической и дискурсивной сложности (значения Noun-Verb Ratio; количество граммем генитива, среднего рода, пассива; относительных предложений, аппозитивных модификаторов, лексических средств дискурсивной связности и пр.).

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: legal documentsязыковая сложностьlinguistic complexitylexical complexityлексическая сложностьчитабельность текстаmorphosyntactic complexitydiscursive complexitysynchronous corpora of legal Russianправовые документыморфосинтаксическая сложностьдискурсивная сложностьрусские синхронные юридические корпусы

В книге

Труды международной конференции «Корпусная лингвистика-2021»
СПб.: Скифия-принт, 2021.
Похожие публикации
Geospatial effects on phonological complexity in the world’s languages
Hartmann F., Николс Д., Linguistic Typology 2025
Добавлено: 26 июля 2025 г.
Методические рекомендации по повышению удобочитаемости текстов: Как написать нормативный правовой акт простым языком?
Алимпеев Д. Р., Кнутов А. В., Плаксин С. М. и др., М.: Издательский дом НИУ ВШЭ, 2024.
Корней Чуковский называл канцелярит единственной по-настоящему существенной болезнью русского языка, а Нора Галь сравнивала стиль официальных актов с питанием «сухомяткой». В последние десятилетия нормативные акты стали значительно сложнее для восприятия: это объясняется обилием длинных предложений, речевой избыточностью и многократными повторами, активным использованием страдательного залога и причастных оборотов. Осознавая проблему, коллектив авторов предлагает всем интересующимся, особенно ...
Добавлено: 23 декабря 2024 г.
Субъективная трудность текстов виртуального тура по Эрмитажу: пилотное исследование
Колмогорова П. А., Куликова Е. Р., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 139–155
В статье обсуждается вопрос оценки трудности текстов, сопровождающих виртуальный тур по Главному музейному комплексу Государственного Эрмитажа. Методика оценки трудности, в отличие от сложности как более объективной, поддающейся параметризации характеристики текста, представляется открытым вопросом. В статье описываются результаты пилотного эксперимента, в котором информанты оценивали тексты, выделяя и комментируя фрагменты, вызывающие затруднения. Анализ показал, что наиболее частыми ...
Добавлено: 8 ноября 2024 г.
Лингвистическая сложность текстов жанра «виртуальная экскурсия по музею» (на материале виртуального визита в Государственный Эрмитаж)
Колмогорова А. В., Куликова Е. Р., Колмогорова П. А., Текст. Книга. Книгоиздание 2025 № 38 С. 29–54
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра.  Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Modeling lemma frequency bands for lexical complexity assessment of Russian texts
Блинова О. В., Tarasov N., Blekanov I. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня — 20 июня 2020 г.)Вып. 19(26).: М.: Изд-во РГГУ, 2020. P. 76–92.
Статья посвящена проблеме моделирования общеязыковой частотности с использованием данных больших русских корпусов. Нашей целью является выработка методики формирования общего частотного списка, который в дальнейшем можно будет использовать в том числе для оценки лексической сложности русских текстов. Мы сравнили 4 частотных списка, основанных на материале 4-х корпусов (Национального корпуса русского языка (НКРЯ), ruTenTen11, Araneum Russicum III Maximum, ...
Добавлено: 12 декабря 2022 г.
Оценка сложности русских правовых текстов: архитектура модели
Блинова О. В., Мир русского слова 2022 № 2 С. 4–13
В статье описана основанная на метриках модель оценки сложности русских правовых текстов. Архитектура модели подразумевает использование 130 метрик, разделённых на следующие категории: «базовые метрики», «формулы читабельности», «учёт слов разных частеречных классов», «n-граммы частеречных помет», «частотность лемм», «словообразовательные модели», «отдельные граммемы», «лексические и семантические признаки, неоднословные выражения», «синтаксические признаки», «оценки связности». Две метрики учитывают гипертекстовые связи ...
Добавлено: 29 октября 2022 г.
Word-formation complexity: a learner corpus-based study
Ляшевская О. Н., Pyzhak J.V., Виноградова О. И., Russian Journal of Linguistics 2022 Vol. 26 No. 2 P. 471–492
В статье рассматривается словообразовательная сложность учебных текстов, которая трактуется как система измерений, показывающих разнообразие приемов словообразования разного уровня, от простых до продвинутых, используемых учащимся. Анализируется взаимосвязь между сложностью и ошибками, которые учащиеся допускают в словообразовании. Исследование основано на материалах REALEC - корпуса английских экзаменационных эссе, написанных студентами университета с родным русским языком. Предлагается подход к ...
Добавлено: 5 октября 2022 г.
Язык нормативных правовых актов: пора ли бить тревогу?
Кнутов А. В., Чаплинский А. В., Алимпеев Д. Р., Вестник Пермского университета. Юридические науки 2022 № 3(57) С. 399–426
Введение: в статье описан опыт оценки удобочитаемости нормативных правовых актов посредством анализа сложности их синтаксических конструкций. По субъективному восприятию нормативные тексты становятся год от года сложнее, что затрудняет их толкование и уяснение правового смысла. Цель: проверить данную гипотезу на основе метрических показателей и в случае подтверждения сформулировать рекомендации по упрощению юридических текстов. Для этого были ...
Добавлено: 3 октября 2022 г.
Decisions of Russian Constitutional Court: Lexical Complexity Analysis in Shallow Diachrony
Блинова О. В., Belov S., Revazov M., , in: CEUR Workshop Proceedings (Proceedings of the International Conference "Internet and Modern Society" IMS-2020, 17-20 June 2020, ITMO University, St. Petersburg, Russia).: CEUR Workshop Proceedings, 2020. Ch. 5 P. 61–74.
Добавлено: 1 ноября 2020 г.
Русские официальные документы домена “Здравоохранение” и оценка их лексической сложности с использованием ключевых слов
Блинова О. В., Белов С. А., В кн.: Труды международной конференции «Корпусная лингвистика-2019».: Издательство Санкт-Петербургского государственного университета, 2019. С. 166–173.
Представленное исследование выполняется в русле изучения доступности для восприятия и понимания русских официальных документов из социальных доменов здравоохранения, культуры и образования. Материал — Корпус русских локальных документов и актов CorRIDA, подкорпус документов здравоохранения (617 107 токенов). Исследование направлено на выявление лексической специфики официальных документов домена с помощью метода извлечения ключевых словоформ, а также на оценку полученных ключевых словоформ с точки зрения их общеязыковой частотности. Анализируя ключевые ...
Добавлено: 1 ноября 2020 г.
Why is gender so complex? Some typological considerations
Николс Д., , in: Grammatical gender and linguistic complexityVol. 1: General issues and specific studies.: Berlin: Language Science Press, 2019. Ch. 4 P. 63–92.
Добавлено: 4 ноября 2019 г.
Grammatical gender and linguistic complexity
Berlin: Language Science Press, 2019.
Добавлено: 4 ноября 2019 г.
Automated assessment of learner text complexity
Ляшевская О. Н., Irina Panteleeva, Olga Vinogradova, Assessing Writing 2021 No. 49 Article 100529
Добавлено: 20 октября 2019 г.
Inspector: The Tool For Automated Assessment Of Learner Text Complexity
Olga I. Vinogradova, Olga N. Lyashevskaya, Irina M. P., / NRU Higher School of Economics. Series WP BRP 55/LNG/2017. 2019. No. 79.
Добавлено: 10 октября 2019 г.
Русский язык: статус и динамика развития на современном этапе
Сомин А. А., Пиперски А. Ч., Кронгауз М. А. и др., / Россйская Академия народного хозяйства и государственной службы. Серия SSRN "working papers series". 2014.
Изменения в языке (в первую очередь — в лексике, в значении слов и в речевом этикете) стали главным объектом исследования в настоящем проекте. Однако ценность описания подобных изменений значительно возрастает, если мы открываем причины, запускающие механизмы изменений, то есть предлагаем внешнюю интерпретацию для внутриязыковых изменений. Поэтому в проекте исследуется динамика изменений русского языка в постперестроечную ...
Добавлено: 17 марта 2016 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору