Проверка закона ципфа по данным Google Labs.

А. С. Ингачева

?

Проверка закона ципфа по данным Google Labs.

С. 109–110.

Ингачева А. С.

В конце 40-х годов ХХ столетия Ципф, собрав статистический материал, попытался показать, что распределение слов языка подчиняется закону, который можно сформулировать следующим образом. Если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру (рангу этого слова). Автором был проверен закон Ципфа для английского, немецкого, французского, русского и испанского языков по данным, предоставленным Google Labs. Проверялся закон для первой тысячи наиболее встречаемых слов. Так как до 1806 года данных представлено мало, и в первой тысяче слов встречаются нулевые частоты, то из рассмотрения их исключили. Для проверки закона была начерчена в двойных логарифмических координатах зависимость ранга слова от частоты его встречаемости, по методу наименьших квадратов были подобрали коэффициенты модели. Значения этих коэффициента получились близкие к единице, например в английском языке значения лежат в интервале от 0.904 до 1.03, как и в самом законе Ципфа. Самый маленький коэффициент получился в русском языке, коэффициент a равен 0.88. По полученным результатам можно сделать вывод, что гипотеза применяется для всех рассматриваемых выборок данных, т.е. закон Ципфа выполняется для любого языка 1806 по 2008 год по 12% всех когда-либо выпущенных книг, которые отсканировало Google Labs.

Язык: русский

Полный текст

Текст на другом сайте

Ключевые слова: закон Ципфа

В книге

Итоговая научно-образовательная конференция студентов Казанского(Приволжского) Федерального Университета. Сборник тезисов.

Каз.: Издательство Казанcкого государственного университета, 2011.

Кластеры как драйверы регионального экономического развития: практика США

Растворцева С. Н., Череповская Н. А., Мировая экономика и международные отношения 2024 Т. 68 № 2 С. 27–38

Проведен анализ развития кластеров США по группам, ориентированным на внешний и внутренний рынки. Обоснована правомерность такой классификации, определены современные тенденции развития кластеров. ...

Добавлено: 20 июня 2024 г.

Закон Ципфа в городах России: анализ новых показателей

Растворцева С. Н., Манаева И. В., Экономика региона 2020 Т. 16 № 3 С. 935–947

На современном этапе развития экономической науки городские эмпирики широко используют закон Ципфа для оценки урбанистических систем регионов и стран. Закон Ципфа, или правило «ранг-размер» - закономерность, которая связывает численность населения города с его местом в упорядоченной по убыванию размеров иерархии городов. Цель работы - определить, является ли равномерным распределение населения, численности работников предприятий, числа предприятий ...

Добавлено: 24 октября 2022 г.

Закон Ципфа в городах России. Анализ новых показателей

Растворцева С. Н., Манаева И. В., Экономика региона 2020 Т. 16 № 3 С. 935–947

На современном этапе развития экономической науки городские эмпирики широко используют закон Ципфа для оценки урбанистических систем регионов и стран. Закон Ципфа, или правило «ранг-размер» — закономерность, которая связывает численность населения города с его местом в упорядоченной по убыванию размеров иерархии городов. Цель работы — определить, является ли равномерным распределение населения, численности работников предприятий, числа предприятий ...

Добавлено: 1 октября 2020 г.

Оценка временного роста городов России

Растворцева С. Н., Манаева И. В., Региональная экономика: теория и практика 2019 Т. 17 № 3 С. 402–417

Предмет. Дисбаланс в распределении городов, представляющий угрозу для экономического развития и социально-политической стабильности страны. Цели. Оценка временного роста городов России в период 1897–2014 гг. Методология. В качестве инструментария использованы законы Ципфа, Гибрата, метод корреляции. Результаты. Проведен анализ распределения городов России по числу жителей в период 1897–2014 гг.; построена временная корреляционная матрица роста городов России в указанный период; дана ...

Добавлено: 20 марта 2019 г.

Связь распределения Ферми–Дирака с лингвостатистическими распределениями

Маслов В. П., Математические заметки 2017 Т. 101 № 4 С. 531–548

В статье с математической точки зрения рассматриваются аналогии между языком и многочастичными системами в термодинамике. Делается попытка введения математического аппарата и технических средств статистической физики в лингвистические описания. В частности, к лингвистическим объектам применяются понятия числа степеней свободы, бозе-конденсата, фазового перехода и др. На основе статистического анализа словаря и лингвостатистических распределений выдвигается гипотеза о фазовом переходе первого рода от семиотической ...

Добавлено: 28 октября 2018 г.

Метод выделения коллокаций с использованием степенного показателя в распределении Ципфа

Клышинский Э. С., Кочеткова Н. А., Карпик О. В., В кн.: Новые информационные технологии в автоматизированных системах: материалы двадцать первого научно-практического семинара.: М.: Институт прикладной математики им. М.В. Келдыша РАН, 2018. С. 220–225.

Для выделения из коллокаций текста мы предлагаем использовать степенной показатель распределения Ципфа. Для этого предлагается рассчитывать распределение Ципфа для фиксированного слова и его соседей. В статье проводится исследование получаемых результатов для таких пар как прилагательное+существительное, существительное+глагол и др. Предложенный метод сравнивается с результатами расчета меры MI. ...

Добавлено: 25 сентября 2018 г.

Анализ проявления закона Ципфа в городах России

Растворцева С. Н., Манаева И. В., Экономический анализ: теория и практика 2015 Т. 46 С. 56–66

Предмет. Большое значение при проведении социально-экономической политики в регионах имеет понимание процессов концентрации ресурсов, населения, предприятий на отдельных территориях, чаще всего в городах. Это вызвано и общемировой тенденцией урбанизации, и агломерационными факторами, возникающими в местах сосредоточения экономической активности и усиливающими дифференциацию регионального развития в рамках страны. Вопросы размещения экономической активности в территориальном пространстве решаются учеными ...

Добавлено: 21 апреля 2017 г.

Анализ проявления закона Ципфа в городах России

Манаева И. В., Экономический анализ: теория и практика 2015 Т. 46 С. 56–66

Добавлено: 21 апреля 2017 г.

Уточнение закона Ципфа для частотных словарей

Маслов В. П., Доклады Академии наук 2005 Т. 405 № 5 С. 591–594

Добавлено: 20 января 2014 г.