?
The Combinatorial Analysis of n-Gram Dictionaries, Coverage and Information Entropy based on the Web Corpus of English
Baltic Journal of Modern Computing. 2021. Vol. 9. No. 3. P. 363–376.
We research n-gram dictionaries and estimate its coverage and entropy based on the web corpus of English. We consider a method for estimating the coverage of empirically gen- erated dictionaries and an approach to address the disadvantage of low coverage. Based on the ideas of Kolmogorov’s combinatorial approach, we estimate the n-gram entropy of the English language and use mathematical extrapolation to approximate the marginal entropy. In addition, we approximate the number of all possible legal n-grams in the English language for high order of n-grams.
Приоритетные направления:
компьютерно-математическое
Язык:
английский
Strube M., Braud C., Hardmeier C. и др., Suzhou: Association for Computational Linguistics, 2025.
Добавлено: 11 июня 2026 г.
Добавлено: 10 июня 2026 г.
Добавлено: 10 июня 2026 г.
Дистиллированные кисломолочные напитки встречаются в пищевой промышленности редко, несмотря на повсеместное распространение растительных спиртных напитков. В настоящее время производство крепких дистиллированных алкогольных напитков из кисломолочных продуктов с использованием традиционных технологий известно лишь среди монголоязычных народов и их сибирских соседей. Данное исследование представляет собой первый междисциплинарный анализ дарасуна, традиционного бурятского спиртного напитка, изготавливаемого из кисломолочного напитка ...
Добавлено: 10 июня 2026 г.
Добавлено: 10 июня 2026 г.
Flamarion M. V., Пелиновский Е. Н., Nonlinear Dynamics 2026 Vol. 114 Article 784
Добавлено: 5 июня 2026 г.
Добавлено: 19 мая 2026 г.
Добавлено: 28 апреля 2026 г.
Добавлено: 20 апреля 2026 г.
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset
Меньшиков И. А., Бернадотт А. К., Елфимов Н. С., / Series arXie "Statistical mechanics". 2025.
Добавлено: 1 декабря 2025 г.
Добавлено: 21 ноября 2025 г.
Рубчинский А. А., Чубарова Д. А., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2025. No. WP7/2025/01.
Добавлено: 9 ноября 2025 г.
Обсуждается разработка метода оптимального размещения точек доступа и шлюзов внутри помещений с учетом мобильности конечных устройств. Предлагается метод, основанный на генетическом недоминируемом алгоритме сортировки II (NSGA-II) и методике определения порядка предпочтения по сходству с идеальным решением, а также приводится пример успешного использования метода в реальной ситуации. ...
Добавлено: 14 июня 2025 г.
Яцкин Д. В., Кочкаров А. А., Наукоемкие технологии 2016 Т. 17 № 9 С. 20–29
Описывается интерпретация задачи мониторинга пространства как задачи обнаружения целевого объекта в пределах некоторой области. Рассматриваются подзадачи, комплексное решение которых гарантирует решение исходной задачи. Формулируется задача поиска геометрического положения сенсоров. Задача приводится к дискретному виду, описываются алгоритмы ее решения в общем и в частном случае. На основании разработанных алгоритмов строится программная модель, которая находит и визуализирует ...
Добавлено: 7 марта 2025 г.
Эбрахим А., Иванов И. А., Али А., В кн.: Инновационные, информационные и коммуникационные технологии. Сборник трудов XХ Международной научно-практической конференции. Москва, 2023.: М.: Ассоциация выпускников и сотрудников ВВИА им. проф. Жуковского, 2023. С. 422–425.
Статья посвящена разработке метода оптимального размещения точек доступа и шлюзов внутри помещений. В работе предлагается математическая модель оптимизации, основанная на генетическом недоминируемом алгоритме сортировки II, а также проводится сравнение полученных результатов работой профессионального программного обеспечения. ...
Добавлено: 6 апреля 2024 г.
Малашина А. Г., Лось А. Б., Чебышевский сборник 2022 Т. 23 № 2 С. 151–160
При исследовании криптографических качеств алгоритмов защиты информации важным моментом является построение теоретических и экспериментальных моделей источников сообщений. В данной статье проводится статистический анализ свойств лексических и n-граммных моделей русского языка на основе новостного текстового корпуса. Создан специализированный корпус из новостных статей последних лет политической направленности, отражающий узкую область употребления языка. Составлены словари токенов и n-грамм, ...
Добавлено: 27 сентября 2021 г.
Малашина А. Г., , in: Entropy 2021: The Scientific Tool of the 21st Century. Conference Proceedings Book.: Porto: MDPI Open Access Publishing, 2021. P. 106–106.
Добавлено: 5 мая 2021 г.
Жучкова С. В., Ротмистров А. Н., Шабанова Е. А., Мониторинг общественного мнения: Экономические и социальные перемены 2021 № 4 С. 23–52
Если в категориальном регрессоре есть пропущенные значения, то что лучше применить: анализ полных наблюдений или метод индикаторной переменной? Суть первого подхода состоит в исключении из анализа (в нашем случае – линейного регрессионного) наблюдений, содержащих пропуски хотя бы по одной из изучаемых переменных. Этот подход применяется по умолчанию во многих популярных приложениях, и вопреки сложившимся представлениям ...
Добавлено: 12 декабря 2020 г.
Малашина А. Г., Лось А. Б., В кн.: Алгебра, теория чисел и дискретная геометрия: современные проблемы, приложения и проблемы истории.: Тула: ТГПУ, 2020. С. 177–181.
Добавлено: 24 сентября 2020 г.
Ольшевская М. Ю., Карпова Е. Л., Власова Е. А., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2019 Т. 17 № 4 С. 63–77
Данная статья содержит исследование методологии составления лексических минимумов (далее - ЛМ) по русскому языку общего владения (Государственный стандарт, Система лексических минимумов В.В. Морковкина и Частотный словарь русского языка для иностранцев, созданный С.А. Шаровым в рамках проекта KELLY), а также анализ специальных лексических минимумов по медицине, робототехнике, ядерной энергетике, математике. Рассмотрены и систематизированы общеметодический, лингвостатистический и ...
Добавлено: 2 октября 2019 г.