?
Программа для создания словарей n-грамм и вычисления их информационных характеристик
Программа предназначена для генерации словарей n-грамм, оценки их объема и вычисления энтропии и покрытия. Применяется для оценки свойств текстовых корпусов естественного языка на основе их информационных характеристик. Программа позволяет реализовать процедуру генерации словарей n-грамм. Словари составляются на основе пользовательского файла с исходным текстом и сохраняются в виде текстовых файлов. Для сгенерированных словарей вычисляется их энтропия и покрытие. Эмпирическое покрытие рассчитывается на основе тестового образца. Теоретическое покрытие вычисляется на основе количества однократно встречаемых единиц словаря. Поддерживаются латинский и кириллический алфавиты. Требуемая кодировка входных текстовых файлов - Windows-1251. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Windows 7 и выше.