• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

Распознавание структур стебель-петля транспозонов человека и прогнозирование их функции при помощи модели машинного обучения.

Гречишникова Д. А., Попцова М. С.

Во многих процессах, происходящих в клетке, важную роль играют вторичные структуры РНК/ДНК. Часто та- кие структуры служат опознавательным знаком для белков. Ранее нами было установлено, что транспозоны чело- века имеют на 3’-хвосте консервативную вторичную структуру типа стебель – петля. Мы предположили, что она может быть необходима для связи с белком, осуществляющим транспозицию. Аргументом в пользу этой гипотезы могло бы стать значимое отличие физических характеристик структур из транспозонов и из других областей ге- нома. В данной работе мы определяем физические и геометрические свойства структур стебель – петля на 3’-конце транспозонов человека и сравниваем их со свойствами структур из других областей генома. Каждой структуре стебель – петля сопоставлялся набор из 10 характеристик: свободной энергии Гиббса, энтальпии, энтропии, гидро- фильности, Shift, Slide, Rise, Tilt, Roll и Twist. С помощью многомерного дисперсионного анализа мы отвергли гипо- тезу о неразличимости физических характеристик структур из транспозонов и из других областей генома. По- строена модель логистической регрессии, способная распознавать структуры из транспозонов по физическим свой- ствам с точностью 89 %. Наибольшим весом в модели обладают гидрофильность, параметры Rise и Twist. Предпо- лагается, что именно эти свойства в первую очередь влияют на распознавание белком структуры.