?
Анализ коллекции данных посредством логико-множественного гистограммного представления
В статье рассматриваются вопросы анализа коллекции данных с использованием логико-множественного гистограммного представления. Этот вид представления данных основан на применении гистограммы и особого математического аппарата, позволяющего реализовать элементные запросы в виде высказываний с множественными и логическими операциями. Результатом анализа является количественный показатель присутствия некоторого элементного состава, определенного в запросе. Кроме того, возможно использование данных-образцов в качестве запроса для определения схожести с анализируемыми данными. В этом случае результатом является количественный показатель схожести. Что касается коллекции, то она определена в виде списка однотипных данных (например, текстовых документов, изображений, видео или др.), которые состоят из элементов универсального множества, а каждому элементу коллекции ставится в соответствие его гистограммное представление. В настоящей работе приводятся два подхода к анализу коллекции данных посредством логико-множественного представления, которые базируются на поэлементном анализе данных. В качестве результата анализа коллекции определен список количественных значений присутствия при элементном запросе и значения схожести при данных-образцах, которые при отображении пользователю в случае необходимости могут быть упорядочены по убыванию или возрастанию.