?
Object-Attribute Biclustering for Elimination of Missing Genotypes in Ischemic Stroke Genome-Wide Data
Springer
,
2020.
Игнатов Д. И., Khvorykh G. V., Khrunin A. V., Николич С., Shaban M., Petrova E. A., Koltsova E. A., Фузи Т., Егурнов Д. А.
В печати
Отсутствующие генотипы могут повлиять на эффективность подходов машинного обучения к выявлению генетических вариантов риска распространенных заболеваний и признаков. Проблема возникает, когда генотипические данные собираются в разных экспериментах с разными ДНК-микрочипами, каждый из которых характеризуется своим набором неустановленных (отсутствующих) генотипов. Это может помешать машинному классификатору правильно назначать классы. Чтобы решить эту проблему, мы использовали хорошо изученные понятия бикластеров объект-атрибут и формальные понятия, которые соответствуют плотным подотношениям в бинарных отношениях пациенты-SNP. В статье представлены экспериментальные результаты по применению алгоритма бикластеризации к большому набору реальных данных, собранных для изучения генетических основ ишемического инсульта. Алгоритм мог идентифицировать большие плотные бикластеры в генотипической матрице для дальнейшей обработки, что, в свою очередь, значительно улучшило качество классификаторов машинного обучения. Предложенный алгоритм также смог сгенерировать бикластеры для всего набора данных без ограничений по размеру по сравнению с алгоритмом In-Close4 для генерации формальных понятий.
Научное направление:
Компьютерные науки
Приоритетные направления:
компьютерно-математическое
Язык:
английский