Представляем новые возможности GPT-Rosalind | OpenAI

12.06.2026 ideipro.ru

Внедрение более интеллектуальных решений, основанных на реальных научных рабочих процессах, в медико-биологическую отрасль.

Запросить доступ

Повышение эффективности выполнения задач, имеющих научное значение.
Более убедительные научные доводы
От логических рассуждений до реализованных рабочих процессов
Расширенный доступ для организаций, пользующихся доверием.
Что дальше?

Оглавление

Повышение эффективности выполнения задач, имеющих научное значение.
Более убедительные научные доводы
От логических рассуждений до реализованных рабочих процессов
Расширенный доступ для организаций, пользующихся доверием.
Что дальше?

Мы представляем новое обновление модели для нашей серии GPT-Rosalind, специально разработанной для исследований в области биологических наук в масштабах предприятия. Оно сочетает в себе возможности агентного кодирования и использования инструментов GPT-5.5 с более мощным интеллектом модели в ключевых областях разработки лекарств, таких как медицинская химия и геномика, одновременно повышая производительность в более широких областях анализа, проектирования и экспериментальных рабочих процессов в биологических науках.

Прогресс в биологических науках зависит от синтеза данных и доказательств в различных масштабах и форматах: молекулы, гены, метаболические пути и живые системы. В ходе наших оценок обновленная версия GPT-Rosalind демонстрирует значительное повышение эффективности при решении исследовательских задач, выполняемых экспертами в области биологии, сложных вопросов медицинской химии, количественной биологии и устранении неполадок в лабораторных условиях.

Теперь GPT-Rosalind доступен в режиме предварительного ознакомления для соответствующих организаций по всему миру через нашу структуру развертывания с гарантированным доступом.

Повышение эффективности выполнения задач, имеющих научное значение.

Для измерения и постоянного улучшения реального влияния GPT-Rosalind мы разработали LifeSciBench — бенчмарк, оцениваемый внешними экспертами и сфокусированный на фундаментальных аспектах исследований в области биологических наук. В отличие от существующих бенчмарков, которые оценивают отдельный компонент производительности модели или биологическую область изолированно, LifeSciBench рассматривает научно значимую работу в комплексе, объединяя задачи из шести областей рабочего процесса, центральных для исследований в области биологических наук: обработка данных, анализ, проектирование и оптимизация, научное обоснование, валидация и эксплуатация, а также перевод и коммуникация. Мы используем этот бенчмарк для согласования прогресса с потребностями и реалиями исследований в области биологических наук.

Извлечение, сопоставление и проверка научных данных из статей, рисунков, таблиц и экспериментальных записей.

Пример оценки

Мы готовимся к встрече с FDA типа B по поводу AAV9-microDys-X, генной терапии на основе микродистрофина с использованием AAV9 для лечения мышечной дистрофии Дюшенна, которая экспрессирует конструкцию с молекулярной массой 138 кДа под контролем промотора MCK, и нам нужна объективная критика того, действительно ли наш текущий пакет документов поддерживает ускоренное одобрение экспрессии микродистрофина в качестве суррогатного показателя, который с достаточной вероятностью предсказывает клиническую пользу.

Контекст исследования: открытое исследование фазы 1b/2 с участием 12 амбулаторных мальчиков в возрасте 4–7 лет с подтвержденной мышечной дистрофией Дюшенна и делециями стержневых доменов с нарушением рамки считывания. В комплект входят:

Биопсия латеральной широкой мышцы бедра до начала лечения: 0–3% дистрофина здоровых контрольных лиц, определенное количественным вестерн-блоттингом с использованием MANEX1A против N-концевого актин-связывающего домена.
Биопсия контралатеральной латеральной широкой мышцы бедра через 12 недель после лечения: среднее содержание микродистрофина 38% от уровня у здоровых контрольных лиц (диапазон 18–61%) по данным того же вестерн-блота, нормализованное по общему количеству белка с помощью окрашивания Кумасси.
Иммунофлуоресцентное исследование после обработки: сарколеммальный сигнал в 75–95% волокон с использованием поликлональных антител к С-концевому участку дистрофина.
Функциональное состояние через 48 недель: среднее изменение NSAA на +1,4 балла по сравнению с исходным уровнем, тогда как в опубликованной внешней когорте естественного течения заболевания этот показатель составил −0,6 балла (p = 0,03 по непарному t-критерию).
Безопасность: транзиторное повышение уровня трансаминаз у 8 из 12 пациентов, получавших лечение с постепенным снижением дозы стероидов; один случай купирования миокардита; летальных исходов не было.
Биораспределение/персистенция: геномы вектора AAV9 обнаруживаются в мышцах через 12 недель в среднем по 2,3 генома вектора на ядро.
Критерии отбора: отсутствие исходных нейтрализующих антител к AAV9 (титр <1:400) и отсутствие делеций в экзоне 44.

Пожалуйста, проверьте каждый пункт этого пакета на прочность: где, по мнению FDA или скептически настроенного эксперта, представленные доказательства не подтверждают наш вывод, и какие дополнительные данные, анализы или изменения в дизайне потребуются для устранения этих пробелов, если это возможно? В отношении всего, что не указано, следует исходить из того, что известно из других программ по разработке микродистрофина 138 кДа для клинического применения и соответствующих клинических испытаний до 31 декабря 2025 года.

Ответ кандидата

В итоге: представленный пакет документов недостаточно убедителен для ускоренного одобрения использования экспрессии микродистрофина в качестве суррогатного показателя, способного с достаточной вероятностью предсказать клиническую пользу. Скептически настроенный эксперт FDA, вероятно, сочтет доказательства, касающиеся биомаркеров, функциональных свойств, долговечности, безопасности и обобщаемости, недостаточно обоснованными.

Упаковочный товар	Ключевой режим отказа	Что потребуется
Количественный анализ методом вестерн-блоттинга	MANEX1A связывается с N-концевым эпитопом, общим для эндогенного полноразмерного дистрофина и трансгена микродистрофина, поэтому данный анализ не позволяет четко отличить трансген от остаточного/ревертантного дистрофина. Количественное определение микродистрофина с молекулярной массой 138 кДа по сравнению со стандартным образцом полноразмерного дистрофина у здоровых людей также некорректно.	Используйте рекомбинантный микродистрофиновый стандарт и ортогональный метод, позволяющий отличить трансген от эндогенного дистрофина, например, целевую масс-спектрометрию или анализ, специфичный для трансгена/эпитопа.
Иммунофлуоресценция	Поликлональные антитела к С-концу плохо подходят, поскольку в конструкции с молекулярной массой 138 кДа отсутствует С-концевой домен. У многих пациентов с ДМД наблюдаются ревертантные волокна, а ревертантный дистрофин может сохранять С-концевые эпитопы. Ревертантные волокна могут клонально размножаться с возрастом, искажая сигнал иммунофлуоресценции, особенно у мальчиков старшего возраста.	Повторите иммунофлуоресцентный анализ с использованием антитела к эпитопу, присутствующему в трансгене, но отсутствующему в ревертантном дистрофине. Количественно оцените трансген-положительные волокна отдельно от ревертантных волокон.
Валидность суррогатной конечной точки	В инструкции смешивают количество белка с клинической функцией. Утверждение «38% от массы белка у здоровых людей» не означает 38% от нормальной функции дистрофина, поскольку микродистрофин имеет укороченную структуру.	Прежде чем рассматривать экспрессию в качестве суррогатного показателя, необходимо эмпирически подтвердить взаимосвязь между массовой долей микродистрофина, локализацией в сарколеммальной области, восстановлением функций нижележащих звеньев и клинической пользой.
дизайн биопсии	Биопсия контралатеральной латеральной широкой мышцы бедра до и после лечения выявляет пространственную изменчивость между левой и правой сторонами, а также внутримышечную изменчивость. Прогрессирование заболевания и фиброзно-жировая инфильтрация также могут изменять сигнал, нормированный по общему количеству белка.	Стандартизировать место биопсии, используя согласованные анатомические ориентиры, нормализовать результаты по белкам, специфичным для мышц, и параллельно измерить фиброзно-жировой состав.
Сравнительный показатель/статистика NSAA	Внешняя когорта с естественным течением заболевания не является рандомизированным контрольным исследованием. Критерии отбора участников исследования, поддерживающая терапия, эффекты участия, исходный уровень NSAA, режим стероидной терапии, возраст и класс экзона — все это может исказить результаты сравнения. Непарный t-тест недостаточен. Кроме того, изменение уровня NSAA на +1,4 находится в пределах вариабельности результатов повторного тестирования для данной возрастной группы.	Провести рандомизированное плацебо-контролируемое исследование или, как минимум, использовать скорректированный анализ с учетом исходного уровня NSAA, возраста, режима приема стероидов, класса экзона и других искажающих факторов.
Влияние возрастного окна на результаты	У мальчиков в возрасте 4–7 лет наблюдается период развития, когда у амбулаторных пациентов с мышечной дистрофией Дюшенна, не получающих лечения, может наблюдаться улучшение двигательных функций до того, как начнется их ухудшение. Изменение показателей NSAA за 48 недель сочетает в себе улучшение развития, прогрессирование заболевания и возможный эффект лечения.	Для разделения траектории развития и эффекта лечения используйте рандомизированное контролируемое исследование с возрастной стратификацией.
Предшествующие клинические прецеденты	Открытые исследования функциональных сигналов микродистрофина не дали надежных результатов в подтверждении положительного эффекта; в опубликованных прецедентах упоминаются подтверждающие исследования генной терапии микродистрофином, которые не смогли воспроизвести улучшения, отмеченные в открытых исследованиях NSAA.	Не следует полагаться на изменения в NSAA, выявленные в ходе открытого исследования, как на решающее доказательство. Необходимо получить контролируемые функциональные данные.
Структурные ограничения конструкции	Конструкция массой 138 кДа удаляет спектриновые повторы R16/17, содержащие сайты связывания nNOS. Потеря связывания nNOS может нарушить функциональный симпатолиз и защиту от ишемии во время физических упражнений, создавая механистический потолок для восстановления, не зависящий от уровня экспрессии.	Необходимо добавить механистические исследования, показывающие, восстанавливает ли данная конкретная конструкция функцию соответствующего комплекса, связанного с дистрофином, локализацию nNOS, физиологию физических упражнений и защиту мышц.
долговечность AAV	Геномы векторов через 12 недель не обеспечивают устойчивой экспрессии. Геномы AAV9 в основном представляют собой неинтегрирующиеся эписомы и могут снижаться со временем. Устойчивость генома вектора не то же самое, что устойчивая экспрессия белка.	Оцените продольную экспрессию трансгенного белка и устойчивость функциональных биомаркеров в течение более чем 12 недель.
Иммунный/профиль безопасности	Повышение уровня трансаминаз у 8 из 12 пациентов соответствует иммунному ответу на клетки, трансдуцированные AAV, однако механизм этого явления не установлен. Один случай миокардита вызывает опасения, учитывая кардиотропизм AAV9.	Необходимо обеспечить более глубокий иммунологический мониторинг, характеристику безопасности для печени и сердца, а также усиленное кардиологическое наблюдение.
Отбор пациентов/обобщаемость результатов	Исключение пациентов с положительным результатом на нейтрализующие антитела к AAV9 ограничивает возможность обобщения результатов. Исключение делеций в экзоне 44 ограничивает применимость к этой подгруппе пациентов с ДМД. Количество пациентов (n=12) слишком мало для характеристики безопасности и эффективности в более широкой популяции пациентов с ДМД.	По возможности следует расширить круг лиц, имеющих право на участие, или заранее определить стратифицированный анализ по статусу антител, генотипу/классу экзона, возрасту и исходному состоянию здоровья, прежде чем использовать результаты для обоснования широкого одобрения.

Регуляторный вывод: Упаковка может демонстрировать биологическую активность, но пока не установлено, что измеренная экспрессия микродистрофина является надежным суррогатным показателем, способным с достаточной вероятностью предсказать клиническую пользу. Основные недостатки заключаются в специфичности анализа, недействительных стандартах количественного определения, возможном смешивании с ревертантными волокнами, отсутствии рандомизированного контроля, смешивании с возрастными изменениями NSAA, неопределенной долговечности и нерешенных вопросах безопасности/обобщаемости.

Для устранения этого пробела программе потребуется контролируемый, стратифицированный по возрасту клинический дизайн с анализами экспрессии трансгенов, ортогональным количественным определением белков, контролем состава тканей, данными о долгосрочной устойчивости, механистическими функциональными анализами укороченной конструкции и более строгим мониторингом безопасности, особенно в отношении печени и сердца.

Критерии оценки и баллы

Критерии оценки: Выявляет проблемы анализа/измерения при количественном определении микродистрофина, включая совпадение эпитопа MANEX1A, недействительные стандарты полноразмерного дистрофина и необходимость измерения с использованием рекомбинантных или ортогональных трансгенов. +24 Объясняет, почему уровень экспрессии микродистрофина не является автоматически допустимым суррогатом функциональной клинической пользы. +22 Отмечает факторы, влияющие на результаты, связанные с местом биопсии, составом ткани и возрастным окном, которые ослабляют интерпретацию экспрессии и NSAA. +19 Критикует компаратор/статистику NSAA, особенно зависимость от внешних контрольных групп естественного течения заболевания. +12 Рассматривает долговечность AAV, иммунный ответ, трансаминит, миокардит и необходимость более длительного наблюдения за экспрессией/безопасностью. +15 Отмечает пробелы в отборе пациентов/обобщаемости результатов, включая исключение анти-AAV9, исключение экзона 44 и малый размер выборки. +8

Более убедительные научные доводы

Медицинская химия

GPT-Rosalind демонстрирует лучшие в отрасли показатели в области медицинской химии, которая занимается превращением молекул в полезные лекарственные препараты. Мы разработали MedChemBench, чтобы отразить реалистичные рабочие процессы медицинской химии, оценивая многомодальное понимание химической структуры; взаимосвязь структуры и активности (SAR); прогнозирование эффективности, токсичности и абсорбции, распределения, метаболизма и выведения лекарственных препаратов (ADME); принятие решений по оптимизации ведущего соединения с учетом множества параметров; и ретросинтез. GPT-Rosalind превосходит GPT-5.5 на MedChemBench с показателем 27,5% против 25,1%, при этом используя на 7,2% меньше токенов.

Геномика и количественная биология

В GeneBench, нашей оценке эффективности работы агентов в рамках долгосрочного комплексного анализа в геномике и количественной биологии, GPT-Rosalind использует на 31% меньше токенов, чем GPT-5.5, при этом достигая более высокой точности — 21,6% против 20,4%. GeneBench оценивает производительность агентов в долгосрочных количественных задачах: может ли агент, основываясь на реалистичных научных данных, спланировать корректный анализ, контроль качества, моделирование и корректировки для получения ответов, позволяющих принимать решения? Включенные задачи охватывают различные области, включая функциональную геномику, пространственную транскриптомику, протеомику, эпигеномику и прикладную генетику.

Оказание помощи в проведении лабораторных работ в реальных условиях.

Мы представляем новую оценку для проверки способности GPT-Rosalind помогать ученым, проводящим лабораторные исследования в реальных условиях. LabWorkBench проверяет способность модели связывать возмущения с результатами экспериментов в реальных лабораторных протоколах, используемых учеными, для целей от устранения неполадок до оптимизации. Данные, используемые LabWorkBench, являются собственностью компании и, следовательно, не содержат примесей. GPT-Rosalind набирает 63,2% против 55,8% у GPT-5.5, используя при этом на 5,3% меньше токенов.

От логических рассуждений до реализованных рабочих процессов

Мы разработали плагины Life Sciences Research (открывается в новом окне) и Life Sciences NGS Analysis (открывается в новом окне) , чтобы расширить интеллектуальные возможности GPT-Rosalind за счет практического уровня выполнения для повторяемых научных рабочих процессов. Вместе эти плагины объединяют поиск исходных данных, биологическую интерпретацию и выполнение биоинформатических операций в одном рабочем пространстве, помогая исследователям связывать внешние данные с внутренними омиксными анализами, сохраняя при этом артефакты и происхождение. Теперь все пользователи могут получить доступ к обоим плагинам через Codex. Квалифицированные корпоративные пользователи GPT-Rosalind могут дополнительно использовать GPT-Rosalind для работы с этими плагинами.

Чтобы эффективнее использовать Codex в качестве динамичной рабочей среды для ученых, мы добавили интерактивные средства просмотра для файлов биологических типов. Первоначальный набор средств просмотра последовательностей, выравниваний и структур разработан для того, чтобы ученые могли оставаться в курсе доказательств, пока GPT-Rosalind анализирует данные в рамках рабочего процесса, и напрямую отвечать на дополнительные вопросы, используя активное средство просмотра в контексте.

На экране компьютера отображается рабочая область, демонстрирующая использование плагина NGS Analysis для изучения данных о мутациях циркулирующей ДНК (ctDNA). Экран включает несколько гистограмм с надписями «Наиболее подробные гистологические данные» и «Наиболее измененные гены в образцах циркулирующей ДНК», отображающих данные о типах рака и изменениях генов. Текст описывает набор данных, основные результаты и параметры анализа.

Контроль качества и аннотирование scRNA-seq

Контроль качества FASTQ-секвенирования РНК в больших объемах

Расширенный доступ для организаций, пользующихся доверием.

Мы расширяем доступ к серии GPT-Rosalind для соответствующих организаций по всему миру. GPT-Rosalind будет доступен в режиме предварительного просмотра для исследовательских целей через нашу структуру развертывания с доверенным доступом для организаций, которые проводят законные научные исследования, имеющие очевидную общественную пользу, обладают строгим контролем за управлением и безопасностью, а также контролируемым доступом с обеспечением безопасности корпоративного уровня.

В рамках этой глобальной экспансии мы рады поддержать миссию Novo Nordisk по более быстрому предоставлению пациентам инновационных вариантов лечения, помогая масштабировать их медицинские исследования с помощью GPT-Rosalind. Novo Nordisk использует передовые возможности искусственного интеллекта, чтобы помочь исследователям анализировать сложные наборы данных, выявлять полезные закономерности и быстрее проверять гипотезы. Более глубокое биологическое понимание, обеспечиваемое GPT-Rosalind, поможет командам связать данные из литературы, геномики, транскриптомики, секвенирования, структуры и экспериментальных результатов, упрощая переход от данных к более четким исследовательским решениям.

«Науки о жизни — это сложные, насыщенные данными и междисциплинарные исследования. Чтобы принести значимую пользу исследователям, передовые модели ИИ должны основываться на достоверных научных данных, быть связаны с проверенными инструментами и интегрированы в реальные рабочие процессы, которые исследователи используют каждый день. Мы рады нашему партнерству с OpenAI и возможности изучить, как GPT-Rosalind может поддержать более строгие и практичные подходы к разработке лекарств».

Мишал Патель, вице-президент группы компаний Novo Nordisk по искусственному интеллекту и цифровым инновациям в сфере исследований и разработок.

Теперь мы также предлагаем управляемое рабочее пространство OpenAI для организаций, отвечающих установленным требованиям и не имеющих корпоративного аккаунта.

Запросить доступ

Что дальше?

Обновленная версия GPT-Rosalind — это следующий шаг в нашем более широком стремлении к созданию систем искусственного интеллекта, которые могут помочь ускорить научные открытия, обеспечивая при этом использование передовых биологических возможностей с соответствующими мерами безопасности. Мы продолжим совершенствовать биологическое мышление модели, расширять поддержку ресурсоемких и долгосрочных исследовательских рабочих процессов, а также сотрудничать с квалифицированными организациями в разных регионах для оценки реального воздействия.

Это также означает применение ИИ в биологических науках к работе, имеющей большое значение для общества, от разработки лекарств и трансляционной медицины до общественного здравоохранения, готовности к чрезвычайным ситуациям и биологической защиты. С помощью Rosalind Biodefense и нашей модели развертывания с доверенным доступом мы стремимся предоставить передовые биологические возможности исследователям, учреждениям и специалистам по защите, работающим над улучшением здоровья человека и укреплением устойчивости общества.

Мы продолжим развивать GPT-Rosalind , чтобы стать более компетентным партнером на протяжении всего жизненного цикла научных исследований, помогая ученым быстрее переходить от правильных вопросов к более четким доказательствам, лучшим экспериментам и, в конечном итоге, к новым методам лечения пациентов.

Продолжайте читать

Просмотреть все Улучшенная память для более полезного использования ChatGPTDreaming: Улучшенная память для более полезного использования ChatGPT

Исследование, 4 июня 2026 г.

Кодекс для каждой роли, инструмента и рабочего процесса.

Продукт выпущен 2 июня 2026 г.

Передовые модели OpenAI и Codex теперь доступны на WS.

Продукт выпущен 1 июня 2026 г.

Источник: openai.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Представляем новые возможности GPT-Rosalind | OpenAI

Повышение эффективности выполнения задач, имеющих научное значение.

Пример оценки

Ответ кандидата

Критерии оценки и баллы