?
High-throughput computational design of protein binders for complex targets using deep learning models
Методы компьютерного проектирования белков изменили структурную биоинформатику, преодолев множество экспериментальных ограничений. Ранее для создания связывающих белков использовались экспериментальные методы, такие как направленная эволюция. Многие достижения в компьютерном дизайне белков позволили создавать связывающие вещества de novo исключительно на основе информации о целевой структуре и последовательности. Однако, несмотря на недавний прогресс, разработка белковых связующих de novo по-прежнему представляет трудности, поскольку средний показатель успешности экспериментальных испытаний остается относительно низким (1). Подходы глубокого обучения показали себя многообещающими в решении этой проблемы, особенно после успеха модели AlphaFold в задаче предсказания структуры белка (2). Целью данного исследования является объединение множества различных подходов геометрических и генеративных нейронных сетей в единый полуавтоматический конвейер для разработки белковых связующих. Предлагаемый конвейер включает в себя методы структурного анализа и прогнозирования интерфейса связывания, генерацию основной цепи связывания и последовательности, а также модель AlphaFold 2 в качестве основного инструмента для проверки. Во многих исследованиях аналогичные методы применялись для создания связующих для хорошо известных белков-мишеней, некоторые из которых могут иметь ограниченную геометрическую сложность. Однако в данном конкретном случае конвейер применяется к более сложным ландшафтам крупных белковых комплексов. Мы создаем несколько сотен проектов, изображаем плюсы и минусы различных подходов к созданию связующих, оцениваем их производительность и потребление вычислительных ресурсов. Разработанный подход может служить основой для высокопроизводительного проектирования кремниевых связующих, а также эталонным тестом для аналогичных инструментов проектирования белков.