Низкочастотные слова в русском языке и подходы к моделированию общеязыковой частотности

О. В. Блинова

?

Низкочастотные слова в русском языке и подходы к моделированию общеязыковой частотности

Социо- и психолингвистические исследования. 2019. № 7. С. 7–13.

Блинова О. В.

В настоящей статье сравниваются частотные списки лемм, представленные в «Новом частотном словаре русской лексики» на базе НКРЯ и полученные в частотном списке на базе веб-корпуса ruTenTen11. Перед сравнением исходные списки были преобразованы, в результате получены списки общей длиной, соответственно, в 51681 слово и 457935 слов. Сопоставлены списки слов, имеющих относительные частоты <5 ipm по данным хотя бы одного из корпусов. В качестве нижнего порога отсечения вынужденно выбрано значение абсолютной частоты, равное 37. Посчитаны значения мер «coverage» (охват) и «enrichment» (обогащение). Выяснилось, что мера «coverage», отражающая долю перекрытия между списками лемм, принимает значение в 9,4%. Это значит, что доля перекрытия между списками составляет лишь 9,4% (от есть список на базе НЧСРЛ имеет низкий охват списка на базе RuTenTen для слов с абсолютной частотой ≥ 37).

Становится понятным, что именно следует изменить в методике сравнения данных корпусов для получения списков низкочастотных слов. Во-первых, пороговые значения следует вводить для сводного списка лемм, ранжированного по значениям «ipm mean». Во-вторых, необходимо привлечь к сравнению частотный список лемм, полученный на материале относительно жанрово-сбалансированного корпуса. Такой русский корпус существует – это «Taiga». В-третьих, из списков, полученных на материале веб-корпусов, стоит удалить позиции, содержащие ошибки лемматизации и другой шум. В-четвёртых, списки лемм, относящихся к словоформам глаголов, следует рассматривать отдельно. Именно такую методику и предполагается применять в дальнейшем.

Научное направление: Филология и лингвистика

Приоритетные направления: гуманитарные науки

Язык: русский

Текст на другом сайте

Ключевые слова: русский язык языковой корпус веб-корпус частотный список лемм общеязыковая частотность низкочастотные слова

Proceedings of the International Science Conference “Scientific research of the SCO countries: synergy and integration” - Reports in English (June 3, 2026. Beijing, PRC)

Scientific publishing house Infinity, 2026.

Добавлено: 24 июля 2026 г.

К синтаксису клауз с аспектуальными глаголами в якутском языке

Баркова Л. А., Родной язык: лингвистический журнал 2026 № 1 С. 9–58

В статье исследуется синтаксис конструкций с аспектуальными глаголами в якутском языке. В таких конструкциях есть два предиката: лексический глагол, который стоит в форме конверба, и аспектуальный глагол, который передает какое-либо грамматическое значение и является финитным. Синтаксис таких конструкций уже был исследован для некоторых других тюркских языков. В этой работе рассматривались особенности положения аффиксов пассива, каузатива ...

Добавлено: 23 июля 2026 г.

Систематизация равноправных произносительных вариантов в современном русском языке (на материале орфоэпических словарей)

Зубов В. И., Вопросы лексикографии 2026 № 40 С. 64–86

В статье представлена база данных равноправных произносительных вариантов современного русского языка, разработанная на материале трёх нормативных орфоэпических словарей: https://varuspeech.ru/. Описываются принципы отбора и систематизации вариантов, а также методика их разметки по типам и областям вариативности. Показаны расхождения между источниками и общие тенденции равноправной вариативности для отдельных форм и для лексем, а также роль частотности лексем ...

Добавлено: 23 июля 2026 г.

Библиометрия фольклора: русские пословицы в научных журналах

Писляков В. В., Вестник Томского государственного университета. Филология 2026 № 101 С. 175–192

Исследуется использование паремий в статьях, опубликованных в отечественных научных журналах. В результате поиска по платформе eLIBRARY.RU и постатейного просмотра полных текстов формируется «паремический массив» – набор журнальных статей, вышедших за 2014–2023 гг., в которых встречается одна из десяти исследуемых пословиц. Выделяются только случаи, когда пословицы используются авторами как пришедшиеся к слову изречения, а не как ...

Добавлено: 22 июля 2026 г.

Russian Pronouns with Focus Antecedents: Coreference and Binding in Corpora

Тискин Д. Б., Компьютерная лингвистика и интеллектуальные технологии 2026 No. 24 P. 656–665

D:/Output/2025/Dialogue_after_review.pdfНесмотря на значительный интерес к факторам, определяющим выбор между личными и возвратными местоимениями с антецедентом в русском языке, роль отношения к антецеденту (кореферентность или связывание) остаётся слабо изученной, а приемлемость отдельных примеров вызывает споры. В настоящей работе на материале веб-корпусов (Araneum и ГИКРЯ) исследуется влияние, оказываемое на интерпретацию местоимения как кореферентного фокусному антецеденту или связанного ...

Добавлено: 19 июля 2026 г.

Не только ἐπιχώρια διδάγματα: пайдейя Эпаминонда

Можайский А. Ю., Schole. Философское антиковедение и классическая традиция 2026 Т. 20 № 2 С. 1105–1116

В настоящей статье исследуется образование Эпаминонда - знаменитого фиванского полководца и государственного деятеля. В античную эпоху он был широко известен благодаря образованности и философскому авторитету. В исследовании показано, что становление Эпаминонда было обусловлено сложным комплексом местных традиций обучения, которые Павсаний характеризует как «местные учения» (ἐπιχώρια διδάγματα). В то же время образование Эпаминонда отличалось от подготовки ...

Добавлено: 17 июля 2026 г.

Английский язык для студентов педагогических вузов. = English for Pre-Service Teachers (B2-C1)

Стогниева О. Н., Новикова В. П., М.: Флинта, 2026.

Инновационный курс английского языка для специальных целей для студентов педагогических вузов предлагает погружение в актуальный образовательный дискурс: от вопросов воспитания и когнитивного развития детей и подростков до переосмысления роли школы в цифровую эпоху. Содержательной основой курса выступают аутентичные мультимодальные материалы, позволяющие анализировать глобальные тренды современных образовательных систем и подходов. Издание идеально подходит вузам, стремящимся подготовить ...

Добавлено: 16 июля 2026 г.

Вклад Нгуен Тонг Куая в развитие вьетнамской поэзии (Новый взгляд на творчество поэта XVIII века)

Бритов И. В., Вьетнамские исследования 2026 Т. 10 № 2 С. 87–98

В статье анализируется творчество поэта XVIII в. Нгуен Тонг Куая. Обращается внимание на то, что во Вьетнаме только после провозглашения политики обновления стали активно изучать и высоко оценивать его литературное наследие, хотя еще при жизни поэта современники давали исключительно положительные отзывы о его стихах. Выявляются причины, по которым долгое время Нгуен Тонг Куай находился в ...

Добавлено: 16 июля 2026 г.

Комитативно-аддитивная полисемия в пуровском диалекте лесного ненецкого языка

Козлов А. А., Лапшина К. М., Вопросы языкознания 2026 № 4 С. 132–146

В статье на материале полевых данных рассматриваются две функции суффикса -samae в пуровском диалекте лесного ненецкого языка: комитативная (выражение совместности: ‘с X-ом’) и скалярно-аддитивная (показатель со значением ‘даже X’). Комитативное употребление показателя -samae характерно прежде всего для маркирования неодушевленного спутника, однако его использование возможно и с другими типами участников — в частности, когда они образуют ...

Добавлено: 13 июля 2026 г.

Prompt Design for GPT-4 Assessments of EFL Student Reports

Стогниева О. Н., Murashova N., Journal of Asia TEFL 2026 Vol. 23 No. 2 P. 490–505

Добавлено: 12 июля 2026 г.

International Academic Conference. Proceedings of the Scientific Forum “Modern Science: Theory and Practice” (April 22, 2026). Belgrade, Serbia. Part 3.

Scientific publishing house Infinity, 2026.

Добавлено: 10 июля 2026 г.

Этот смутный объект внимания: "реальные предметы" и гаптический опыт в рассказах В. Вулф

Шулятьева Д. В., Новое литературное обозрение 2026 № 199 С. 128–140

В статье рассмотрена гаптическая образность в поэтике В. Вулф на примере трех ее рассказов («Пятно на стене», «Женщина в зеркале», «Реальные предметы»), в центре которых оказываются предметы, устанавливающие обновленные отношения с героями. С опорой на теорию гаптической визуальности и на теорию вещи описаны трансформации, которые происходят с предметами, и переживание, которое открывается герою и нарратору при соприкосновении с ними, ...

Добавлено: 10 июля 2026 г.

Two ga-morphemes in Rutul: Accidental similarity or a case of polygrammaticalization?

Майсак Т. А., Word Structure 2026 Vol. 19 No. 2-3 P. 338–367

Добавлено: 9 июля 2026 г.

Towards a typology of imperative interjections: ‘Take it!’ in the Caucasus

Майсак Т. А., Transactions of the Philological Society 2026 Vol. 124 No. 2 P. 386–427

Добавлено: 9 июля 2026 г.

Light Verb Constructions from a Cross-Linguistic Perspective

Berlin, Boston: De Gruyter, 2025.

Добавлено: 9 июля 2026 г.

The Semiotic Intensity Approach: A Scoping Review of Amplification and Attenuation Mechanisms in Multimodal Media Discourse

Инь Ц., Terra Linguistica 2026 Vol. 17 No. 2 P. 152–168

Добавлено: 8 июля 2026 г.

Комитет цензуры иностранной как институт культурного трансфера, или судьба итальянских книг и переводов с итальянского в цензурных документах 1830–1850-х годов

Бодрова А. С., Гуськов С. Н., Studi Slavistici 2026 Т. 23 № 1 С. 197–212

Статья посвящена анализу иностранной цензуры как института культурного и книжного трансфера в Российской империи и ее роли в рецепции итальянской литературы в 1830–1850-е годы. На материале архивных документов авторы показывают, что цензурные решения определялись не только нормами Устава 1828 года, но и другими факторами — политической конъюнктурой, языком перевода, социальным статусом переводчиков и личностными особенностями ...

Добавлено: 5 июля 2026 г.

Деепричастия в русском языке XVIIв.: переходный период в истории формирования их грамматического значения

Ермолова М. В., Russian Linguistics 2026 Т. 50 Статья 14

В статье анализируется функционирование деепричастий в русском языке XVII в. На основе анализа контекстов, отсутствующих в современном русском языке, делаются выводы о том, что в XVII в. деепричастие теряло абсолютное временное значение, ко торое имело некогда, приобретая относительное значение в зависимости от времени главного сказуемого, но оставалось при этом предикатом еще формальнонезависимой клаузы. Закрепление за ...

Добавлено: 4 июля 2026 г.

Семантика необратимости в медиадискурсе ФРГ: эсхатологические коды и реакция аудитории в условиях кризиса

Москвина Ж. О., Вестник Российского университета дружбы народов. Серия: Литературоведение, журналистика 2026 Т. 31 № 2 С. 398–408

Исследованы семантические и когнитивные механизмы функционирования лексемы «необратимость» (Unumkehrbarkeit), изучен современный немецкий медиа-дискурс, где освещается кризис германо-российских отношений. В основе исследования лежит гипотеза о том, что апелляция к семантике необратимости в СМИ служит ритори-ческой стратегией, призванной усилить восприятие происходящих изменений как окон-чательных. Однако, как демонстрирует проведенный анализ, данная стратегия вступает в противоречие с глубинными структурами ...

Добавлено: 3 июля 2026 г.

Men and women are from the same planet Gender similarities in perspective-taking abilities

Imbault C., Слюсарь Н. А., Иваненко А. А. и др., The Mental Lexicon 2026 P. 1–23

Добавлено: 2 июля 2026 г.

Тезисы докладов Пятнадцатых Шмелёвских чтений: (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева):Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности

М.: Институт русского языка им. В.В. Виноградова РАН, 2026.

Сборник тезисов Пятнадцатых Шмелёвских чтений (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева) Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности. Охватывает разные аспекты современной русистики: от исторической лексикологии до современных трансформаций прагматики и семантики слов. ...

Добавлено: 23 июня 2026 г.

Система синтаксических инвариантов текстовой деятельности: статистические дескрипторы, семантическая структура и диагностические профили

Кудрявцева Е. И., / РЦИС. Серия № 0148-756-286. 2026.

Содержанием работы является система идентификации четырех типов письменно-речевых структур. Совокупность 11 расчетных параметров, статистических эталонов и семантических характеристик позволяют идентифицировать структуру текста как результат определенной когнитивной схемы (сцена, событие, история, оценка). Метод верифицирован на репрезентативной выборке (N=3900+) и базируется на выявлении критического порогового значения коэффициента подчиненности. Также математически верифицированы переходы между типами: от атомарной фиксации объекта ...

Добавлено: 2 июня 2026 г.

Почему растущие доходы не делают людей счастливее: эмоциональное объяснение парадокса Истерлина (Why Growing Incomes Do Not Make People Happier: an Emotional Explanation of the Easterlin Paradox)

Ворчик А. Д., / SSRN. Серия Social Science Research Network "Social Science Research Network". 2026.

Эта работа посвящена теоретическому объяснению парадокса Истерлина, согласно которому долгосрочный экономический рост не приводит к росту среднего уровня счастья людей. Под счастьем мы понимаем интенсивность эмоций, которые люди испытывают, когда сравнивают свой новый доход с ожидаемым либо целевой - с изначальным. В первом случае мы имеем дело с реактивным подходом к росту, тогда как во втором ...

Добавлено: 31 мая 2026 г.

Juxtapositional vs. possessive-like encoding in Russian specificational constructions

Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11

Добавлено: 18 мая 2026 г.