В статье предлагаются разнообразные подходы классификации знаковых представлений изображений, основанные на функциях расстояния. При этом для знаковых представлений каждое изображение описывается с помощью множества признаков, описывающих разности яркости пискселей изображения. Построение функции расстояния осуществляется на основе функционалов из теории инофрмации, а именно энтропии Шеннона и расстония Кульбака-Лейблера. Показывается, что байесовская классификация в случая независимых признаков может быть также описана с помощью функций расстояния. В конце статьи рассмотренные подходы к классификации знаковых представлений изображений оцениваются при решении задачи детекции лиц.
Measures and functionals of global asymmetry of noisy and noisefree images are axiomatically introduced. Explicit expressions are obtained that make these functionals applicable for determining the symmetry axes of noisy images. It is shown that some asymmetry functionals are unstable against noise levels of images; i.e., the symmetry axis obtained using these functionals may deviate significantly if the signalto noise ratio is large. Sufficient and necessary conditions are obtained under which the symmetry axes calcu lated using asymmetry functionals remain unchanged.
A new approach to analysis of the molecule–descriptor matrix in the structure–property problem,based on the fuzzy cluster structure of the training sample, is developed. Methods for constructing fast pre diction rejection rules and for the search the outliers in a training sample are described. To that end, a special space ofeasily computed descriptors is introduced. Optimization of the classifying function with respect to the param eters of fuzzy classification is considered. Prognostic models with a high quality of prediction, based on thisapproach, are proposed. Comparison of models is performed, which shows the efficiency of the describedmethods
Problems of identification of plane unclosed curves are considered. Methods are proposed that allow one to classify graphic objects invariantly to affine transformations. An answer is given to the question on the types and the quantity of features that are needed to construct a mathematical description of curves for the recognition of an unclosed contour of an object. Metrics are introduced on the basis of which one can identify unclosed curves. The quality of identification on the basis of the metrics introduced is analyzed.
Proposed and developed a method for solving the “structure property” problem, which is based on an adaptive choice of the description of molecules and the automatic selection of feature space in accordance with the characteristics of the training sample. Solved the problem of combinatorial explosion using Group Method of Data Handling. Used the clustering of objects in the training set to improve the predictive ability of the model.
Статья посвящена прогнозированию свойств химических соединений математическими методами распознавания образов. Исследование проведено на примере активности ингибиторов фермента деления клеток. В качестве методов построения распознающих моделей используется подход на базе смесей алгоритмов. В работе рассмотрена двухфазная схема решения задачи «структура – свойство», также описаны локальный классификатор на базе метода ближайших соседей и метод использующий множества кластеризаций. Проведено сравнение новых алгоритмов построения смесей классификаторов. Рассматриваются методы согласованного прогнозирования активности новых соединений. Также приводится сравнение результатов математического моделирования с методами молекулярного дизайна на основе координации соединений с известными структурами терапевтических мишеней. Проведено экспериментальное изучение биологической активности