Машинное обучение — это направление искусственного ума, которое опирается на методы для решения заморочек либо сотворения новейших молекул — к примеру, белков. В прошедшем году компания DeepMind употребляла собственный ИИ для пророчества формы практически всех белков, чтоб лучше осознать их функции и возлагать на разработку наиболее действенных способов исцеления либо даже вакцин. С данной для нас целью исследователи разработали систему искусственного ума, способную создавать белки, на базе 2-ух разных подходов.
Биохимические функции белков обычно обеспечиваются маленьким количеством остатков, которые составляют многофункциональный веб-сайт (к примеру, активный веб-сайт фермента либо веб-сайт связывания с молекулой). Потому конструирование белков содержит в себе определение аминокислот, обеспечивающих желаемую активность, и геометрических конформаций многофункциональных участков. В прошедшем при проектировании белков удавалось отыскивать последовательности, складывающиеся в желаемую конформацию, но получение многофункциональных белков остается сложной задачей.
Искусственный ум может расширить спектр способностей, используя огромное количество обученных нейронных сетей, обученных на огромном количестве белковых данных — общественной базе данных, содержащей сотки тыщ белковых структур. “В данной для нас работе мы показываем, что машинное обучение быть может применено для проектирования белков с широким диапазоном функций”, — произнес в собственном заявлении Дэвид Бейкер, ведущий создатель исследования и доктор биохимии в UW Medicine. “Белки, которые мы находим в природе, являются необычными молекулами, но белки, сделанные таковым образом, могут созодать еще больше”.
Исследователи обрисовывают два подхода машинного обучения для сотворения белков с новенькими функциями без необходимости уточнять складку либо вторичную структуру молекулы. 1-ый, именуемый “галлюцинацией”, улучшает аминокислотные последовательности белков таковым образом, чтоб их конечные структуры содержали хотимый многофункциональный участок. Принципиально осознавать, что аминокислоты подобны буковкам в тексте и являются кодом для многофункциональных белков.
Экспериментальная группа ассоциирует этот 1-ый подход с написанием книжки: “Вы начинаете со случайного набора слов — полной тарабарщины. Потом вы устанавливаете требование, к примеру, чтоб 1-ый абзац был о черной и бурной ночи. Потом комп меняет слова одно за иным и спрашивает себя: “Имеет ли это больше смысла для моей истории?”” Если это так, то конфигурации длятся до того времени, пока история не будет завершена. В данном случае начиная со случайной строчки аминокислот, программное обеспечение изменяет последовательность, пока не будет сотворена окончательная версия, кодирующая желаемую функцию.
2-ой подход, именуемый “раскрашивание”, работает в оборотном направлении. Он начинает с многофункционального участка белка, потом добавляет доп последовательности для сотворения жизнестойкого белкового каркаса. Нейронные сети заполняют “недостающие фрагменты” структуры белка всего за несколько секунд.
Лабораторные тесты проявили, что почти все белки, сделанные при помощи этих подходов, работают, как и ожидалось, к примеру, связываясь с противораковым сенсором PD-1. Не считая того, эти способы могут быть полезны при разработке вакцин, которая нередко осложняется молекулярной формой, которую нужно получить. К примеру, исследователи смогли сделать новейшие белки, включающие фрагмент патогена, нужный для вакцины против респираторно-синцитиального вируса. Программное обеспечение могло свободно создавать всякую структуру вокруг этого фрагмента, что привело к созданию нескольких возможных вакцин с разными молекулярными формами.
Источник
Читайте далее: