Image

Продукт генома: семантический подход к созданию генов de novo

4cb4e158012357abcdb0f66ffbef548d

Ученые из США показали, что геномная языковая модель Evo способна создавать новые функциональные последовательности, опираясь на контекст прокариотического генома. С помощью Evo они сгенерировали системы токсин-антитоксин (как белковые, так и на основе РНК) и анти-CRISPR белки, причем некоторые варианты не имели выраженного сходства с природными белками, но обладали целевой активностью. Также авторы работы создали базу SynGenome, содержащую 120 гигабаз синтетической ДНК. Некоторые входящие в нее гены также выходили за пределы естественных последовательностей. Это доказывает, что семантический подход позволяет получать гены de novo, опираясь только на организацию геномов.

Группа исследователей из США представила концепцию «семантического проектирования» искусственных геномов. Она основана на использовании Evo — геномной языковой модели, обученной на миллиардах пар оснований прокариотических геномов. В геномах бактерий гены с родственными функциями часто располагаются рядом, формируя опероны и устойчивые функциональные кластеры. Если модель способна улавливать такую «геномную семантику», то, используя короткую подсказку из реального геномного контекста, она может генерировать новые последовательности, функционально связанные с этим контекстом, но не обязанные быть похожими на природные. С помощью такого «автодополнения» последовательностей авторы сгенерировали токсины, антитоксины, анти-CRISPR белки и РНК-антитоксины — то есть белки и нуклеиновые кислоты, обладающие активностью, но не имеющие выраженного сходства с природными последовательностями. 

Для начала авторы проверили способность Evo к автодополнению бактериальных генов, то есть давали только фрагмент высококонсервативного гена и оценивали, может ли модель правильно его продолжить. В анализ включили три версии модели, из них Evo 1.5 продемонстрировала наиболее высокую производительность. Например, получая на вход всего 30% последовательности, модель восстанавливала сигма-фактор РНК-полимеразы Escherichia coli (rpoS) c 85%-ной достоверностью. Также Evo 1.5 продемонстрировала способность достраивать гены внутри целых оперонов, учитывая направление транскрипции. Анализ энтропии показал, что модель не запоминает конкретные последовательности, а генерирует их заново, сохраняя ключевые аминокислоты, но варьируя нуклеотиды, подобно естественной эволюции.

Далее ученые перешли к полноценному функциональному дизайну и с помощью подсказок из геномного контекста пытались создавать многокомпонентные системы. Для моделирования они выбрали системы токсин-антитоксин типа II, играющие роль в защите от бактериофагов. Сначала авторы генерировали токсичные белки, затем тестировали их способность ингибировать рост бактерий. Один из вариантов, EvoRelE1, продемонстрировал выраженную токсичность — он снижал выживаемость бактерий на 70% — и умеренное сходство с с природным RelE. Затем его последовательность использовали в качестве входных данных, чтобы модель создала подходящие антитоксины. Из набора сгенерированных последовательностей половина оказалась функциональной, а лучшие варианты полностью восстанавливали рост клеток. Некоторые антитоксины нейтрализовали сразу несколько природных токсинов, хотя сами имели низкое сходство с природными последовательностями. Это указывает на способность модели извлекать скрытые принципы взаимодействий белков, не ограниченные существующими природными шаблонами.

Аналогичный подход применили к системам типа III, где для нейтрализации токсина используется не белок, а повторяющаяся РНК. Среди кандидатов нашли рабочий РНК-антитоксин EvoAT6, подавляющий токсин ToxN и имеющий лишь умеренное сходство с последовательностью ToxI — РНК-антитоксина Bacillus multifaciens. Более того, Evo создала полностью новый токсин EvoT1, не похожий на существующие в природе.

Используя контексты природных анти-CRISPR оперонов — фаговых систем защиты от иммунитета бактерий, — модель создала большую библиотеку кандидатных анти-CRISPR белков (Acr). Авторы оценили их потенциал с помощью алгоритма машинного обучения PaCRISPR, который классифицировал многие последовательности как вероятные Acr. Затем их тестировали в культурах E. coli. В результате 17% последовательностей подавляли работу Cas9, причем пять из них обеспечивали выраженную защиту как в жидкой культуре, так и при фаговой инфекции. Два белка, EvoAcr1 и EvoAcr2, не были схожи с какими-либо природными белками. EvoAcr3–5 также были эффективны, но принадлежали к существующим классам белков, включая те, что ранее не были связаны с анти-CRISPR активностью.

В завершение работы авторы создали SynGenome — базу данных искусственных геномов, содержащую 120 миллиардов пар оснований синтетической ДНК. В качестве геномных подсказок модель опиралась на более чем 1,7 млн природных бактериальных и фаговых генов. Анализ этой базы показал, что сгенерированные открытые рамки считывания (ORF) по длине, структуре и доменной архитектуре напоминают природные, но при этом около 20% последовательностей формируют кластеры, отсутствующие в природном семантическом пространстве геномов. SynGenome также воспроизводит естественные ассоциации доменов и может подсказать функцию неохарактеризованных белков. База данных находится в открытом доступе.

Таким образом, что языковая модель, обученная на прокариотических геномах, способна создавать новые функциональные молекулы, основываясь исключительно на геномном контексте, которое в природе отражает функциональные связи. Полученные белки и РНК — токсины, антитоксины, анти-CRISPR-системы — обладают биологической активностью, при этом многие из них принципиально новы и не имеют явного сходства с известными белками. Этот подход открывает возможность быстрого генерирования стартовых вариантов для дальнейшей инженерии, поиска новых биологических инструментов и расширения функционального пространства генов.

Источник: pcr.news

Источник: ai-news.ru

✅ Найденные теги: новости, Продукт, Семантический

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых