Photo by Warren Umoh
Ученые создали искусственный интеллект, который может не только расшифровывать генетический код, но и писать его самостоятельно. Исследователи из Arc Institute совместно с учеными из Stanford University, UC Berkeley и UC San Francisco разработали крупнейшую в биологии модель искусственного интеллекта — Evo 2. Новый ИИ может анализировать и проектировать генетические последовательности для всех доменов жизни, начиная с простейших микроорганизмов и заканчивая человеком.
Модель Evo 2 обучалась на ДНК более чем 100 000 видов живых организмов, включая человека, растения, бактерии и даже вирусы. В общей сложности модель проанализировала 9,3 триллиона нуклеотидов (строительных блоков ДНК и РНК) из 128 000 геномов.
По своему масштабу Evo 2 сравнима с самыми мощными языковыми моделями ИИ, используемыми в чат-ботах. Evo 2 обучалась в течение нескольких месяцев, используя более 2000 графических процессоров NVIDIA H100. Модель способна одновременно обрабатывать генетические последовательности длиной до 1 миллиона нуклеотидов, что помогает находить взаимосвязи даже между далеко расположенными участками ДНК.
Для достижения таких возможностей команде пришлось пересмотреть подходы к обучению ИИ, разработав новую архитектуру StripedHyena 2, которая обеспечивает более быструю и эффективную обработку огромных объемов генетической информации.
Модель Evo 2 показала впечатляющие результаты в различных направлениях, от анализа генетических данных до создания новых геномов.
Предсказание мутаций. Модель Evo 2 может точно предсказывать, как мутации повлияют на белки, РНК и здоровье организма. Например, модель смогла с точностью более 90% определить, какие мутации в гене BRCA1, связанном с раком груди, не представляют опасности, а какие — потенциально опасны.
Анализ генетического кода. Evo 2 самостоятельно научилась различать ключевые особенности генетического кода, такие как границы экзонов и интронов (участки ДНК, которые участвуют или не участвуют в синтезе белков), а также места, где к ДНК присоединяются белки, регулирующие ее активность.
Создание новых геномов. Это включает в себя в том числе геном бактерии Mycoplasma genitalium, которая известна своим минимальным набором генов, необходимых для поддержания жизни. Ученые часто используют эту бактерию в качестве модели для исследований, чтобы лучше понять, какие гены действительно важны для клеточного функционирования и выживания. Созданные моделью геномы выглядят более естественно и последовательно по сравнению с результатами предыдущих исследований.
Контролируемое создание ДНК. Evo 2 может проектировать ДНК с заданными свойствами. Например, ученые смогли с ее помощью создать последовательности ДНК, которые активны только в определенных типах клеток, что может использоваться в генной терапии.
Разработчики также запускают Evo Designer — удобный интерфейс для работы с моделью, который доступен всем желающим. Открытый исходный код Evo 2 уже представлен ученым по всему миру, что позволит значительно ускорить научные исследования в биологии и медицине. Этот проект обещает стать настоящим прорывом, способным изменить наше понимание жизни и открыть путь к созданию новых форм биологической реальности.
Что почитать по теме. Рассказывали, как нейроны в мозге разрывают свои ДНК, чтобы записать в память негативный опыт.
Ученые оценили эффект от регулярного общения с кошками и собаками в денежном эквиваленте
Гарвардские ученые 30 лет следили за рационом 100 тысяч человек и выяснили, что работает лучше всего
14 приемов, проверенных наукой и лабораторией Яндекс Практикума