Представляем новые возможности GPT-Rosalind | OpenAI
Внедрение более интеллектуальных решений, основанных на реальных научных рабочих процессах, в медико-биологическую отрасль.
Запросить доступ
- Повышение эффективности выполнения задач, имеющих научное значение.
- Более убедительные научные доводы
- От логических рассуждений до реализованных рабочих процессов
- Расширенный доступ для организаций, пользующихся доверием.
- Что дальше?
Оглавление
- Повышение эффективности выполнения задач, имеющих научное значение.
- Более убедительные научные доводы
- От логических рассуждений до реализованных рабочих процессов
- Расширенный доступ для организаций, пользующихся доверием.
- Что дальше?
Мы представляем новое обновление модели для нашей серии GPT-Rosalind, специально разработанной для исследований в области биологических наук в масштабах предприятия. Оно сочетает в себе возможности агентного кодирования и использования инструментов GPT-5.5 с более мощным интеллектом модели в ключевых областях разработки лекарств, таких как медицинская химия и геномика, одновременно повышая производительность в более широких областях анализа, проектирования и экспериментальных рабочих процессов в биологических науках.
Прогресс в биологических науках зависит от синтеза данных и доказательств в различных масштабах и форматах: молекулы, гены, метаболические пути и живые системы. В ходе наших оценок обновленная версия GPT-Rosalind демонстрирует значительное повышение эффективности при решении исследовательских задач, выполняемых экспертами в области биологии, сложных вопросов медицинской химии, количественной биологии и устранении неполадок в лабораторных условиях.
Теперь GPT-Rosalind доступен в режиме предварительного ознакомления для соответствующих организаций по всему миру через нашу структуру развертывания с гарантированным доступом.
Повышение эффективности выполнения задач, имеющих научное значение.
Для измерения и постоянного улучшения реального влияния GPT-Rosalind мы разработали LifeSciBench — бенчмарк, оцениваемый внешними экспертами и сфокусированный на фундаментальных аспектах исследований в области биологических наук. В отличие от существующих бенчмарков, которые оценивают отдельный компонент производительности модели или биологическую область изолированно, LifeSciBench рассматривает научно значимую работу в комплексе, объединяя задачи из шести областей рабочего процесса, центральных для исследований в области биологических наук: обработка данных, анализ, проектирование и оптимизация, научное обоснование, валидация и эксплуатация, а также перевод и коммуникация. Мы используем этот бенчмарк для согласования прогресса с потребностями и реалиями исследований в области биологических наук.
GPT-Rosalind лидирует по результатам выполнения научно значимых задач, определенных экспертами из промышленности и академической среды.
Извлечение, сопоставление и проверка научных данных из статей, рисунков, таблиц и экспериментальных записей.
Пример оценки
Мы готовимся к встрече с FDA типа B по поводу AAV9-microDys-X, генной терапии на основе микродистрофина с использованием AAV9 для лечения мышечной дистрофии Дюшенна, которая экспрессирует конструкцию с молекулярной массой 138 кДа под контролем промотора MCK, и нам нужна объективная критика того, действительно ли наш текущий пакет документов поддерживает ускоренное одобрение экспрессии микродистрофина в качестве суррогатного показателя, который с достаточной вероятностью предсказывает клиническую пользу.
Контекст исследования: открытое исследование фазы 1b/2 с участием 12 амбулаторных мальчиков в возрасте 4–7 лет с подтвержденной мышечной дистрофией Дюшенна и делециями стержневых доменов с нарушением рамки считывания. В комплект входят:
- Биопсия латеральной широкой мышцы бедра до начала лечения: 0–3% дистрофина здоровых контрольных лиц, определенное количественным вестерн-блоттингом с использованием MANEX1A против N-концевого актин-связывающего домена.
- Биопсия контралатеральной латеральной широкой мышцы бедра через 12 недель после лечения: среднее содержание микродистрофина 38% от уровня у здоровых контрольных лиц (диапазон 18–61%) по данным того же вестерн-блота, нормализованное по общему количеству белка с помощью окрашивания Кумасси.
- Иммунофлуоресцентное исследование после обработки: сарколеммальный сигнал в 75–95% волокон с использованием поликлональных антител к С-концевому участку дистрофина.
- Функциональное состояние через 48 недель: среднее изменение NSAA на +1,4 балла по сравнению с исходным уровнем, тогда как в опубликованной внешней когорте естественного течения заболевания этот показатель составил −0,6 балла (p = 0,03 по непарному t-критерию).
- Безопасность: транзиторное повышение уровня трансаминаз у 8 из 12 пациентов, получавших лечение с постепенным снижением дозы стероидов; один случай купирования миокардита; летальных исходов не было.
- Биораспределение/персистенция: геномы вектора AAV9 обнаруживаются в мышцах через 12 недель в среднем по 2,3 генома вектора на ядро.
- Критерии отбора: отсутствие исходных нейтрализующих антител к AAV9 (титр <1:400) и отсутствие делеций в экзоне 44.
Пожалуйста, проверьте каждый пункт этого пакета на прочность: где, по мнению FDA или скептически настроенного эксперта, представленные доказательства не подтверждают наш вывод, и какие дополнительные данные, анализы или изменения в дизайне потребуются для устранения этих пробелов, если это возможно? В отношении всего, что не указано, следует исходить из того, что известно из других программ по разработке микродистрофина 138 кДа для клинического применения и соответствующих клинических испытаний до 31 декабря 2025 года.
Ответ кандидата
В итоге: представленный пакет документов недостаточно убедителен для ускоренного одобрения использования экспрессии микродистрофина в качестве суррогатного показателя, способного с достаточной вероятностью предсказать клиническую пользу. Скептически настроенный эксперт FDA, вероятно, сочтет доказательства, касающиеся биомаркеров, функциональных свойств, долговечности, безопасности и обобщаемости, недостаточно обоснованными.
|
Упаковочный товар |
Ключевой режим отказа |
Что потребуется |
|---|---|---|
|
Количественный анализ методом вестерн-блоттинга |
MANEX1A связывается с N-концевым эпитопом, общим для эндогенного полноразмерного дистрофина и трансгена микродистрофина, поэтому данный анализ не позволяет четко отличить трансген от остаточного/ревертантного дистрофина. Количественное определение микродистрофина с молекулярной массой 138 кДа по сравнению со стандартным образцом полноразмерного дистрофина у здоровых людей также некорректно. |
Используйте рекомбинантный микродистрофиновый стандарт и ортогональный метод, позволяющий отличить трансген от эндогенного дистрофина, например, целевую масс-спектрометрию или анализ, специфичный для трансгена/эпитопа. |
|
Иммунофлуоресценция |
Поликлональные антитела к С-концу плохо подходят, поскольку в конструкции с молекулярной массой 138 кДа отсутствует С-концевой домен. У многих пациентов с ДМД наблюдаются ревертантные волокна, а ревертантный дистрофин может сохранять С-концевые эпитопы. Ревертантные волокна могут клонально размножаться с возрастом, искажая сигнал иммунофлуоресценции, особенно у мальчиков старшего возраста. |
Повторите иммунофлуоресцентный анализ с использованием антитела к эпитопу, присутствующему в трансгене, но отсутствующему в ревертантном дистрофине. Количественно оцените трансген-положительные волокна отдельно от ревертантных волокон. |
|
Валидность суррогатной конечной точки |
В инструкции смешивают количество белка с клинической функцией. Утверждение «38% от массы белка у здоровых людей» не означает 38% от нормальной функции дистрофина, поскольку микродистрофин имеет укороченную структуру. |
Прежде чем рассматривать экспрессию в качестве суррогатного показателя, необходимо эмпирически подтвердить взаимосвязь между массовой долей микродистрофина, локализацией в сарколеммальной области, восстановлением функций нижележащих звеньев и клинической пользой. |
|
дизайн биопсии |
Биопсия контралатеральной латеральной широкой мышцы бедра до и после лечения выявляет пространственную изменчивость между левой и правой сторонами, а также внутримышечную изменчивость. Прогрессирование заболевания и фиброзно-жировая инфильтрация также могут изменять сигнал, нормированный по общему количеству белка. |
Стандартизировать место биопсии, используя согласованные анатомические ориентиры, нормализовать результаты по белкам, специфичным для мышц, и параллельно измерить фиброзно-жировой состав. |
|
Сравнительный показатель/статистика NSAA |
Внешняя когорта с естественным течением заболевания не является рандомизированным контрольным исследованием. Критерии отбора участников исследования, поддерживающая терапия, эффекты участия, исходный уровень NSAA, режим стероидной терапии, возраст и класс экзона — все это может исказить результаты сравнения. Непарный t-тест недостаточен. Кроме того, изменение уровня NSAA на +1,4 находится в пределах вариабельности результатов повторного тестирования для данной возрастной группы. |
Провести рандомизированное плацебо-контролируемое исследование или, как минимум, использовать скорректированный анализ с учетом исходного уровня NSAA, возраста, режима приема стероидов, класса экзона и других искажающих факторов. |
|
Влияние возрастного окна на результаты |
У мальчиков в возрасте 4–7 лет наблюдается период развития, когда у амбулаторных пациентов с мышечной дистрофией Дюшенна, не получающих лечения, может наблюдаться улучшение двигательных функций до того, как начнется их ухудшение. Изменение показателей NSAA за 48 недель сочетает в себе улучшение развития, прогрессирование заболевания и возможный эффект лечения. |
Для разделения траектории развития и эффекта лечения используйте рандомизированное контролируемое исследование с возрастной стратификацией. |
|
Предшествующие клинические прецеденты |
Открытые исследования функциональных сигналов микродистрофина не дали надежных результатов в подтверждении положительного эффекта; в опубликованных прецедентах упоминаются подтверждающие исследования генной терапии микродистрофином, которые не смогли воспроизвести улучшения, отмеченные в открытых исследованиях NSAA. |
Не следует полагаться на изменения в NSAA, выявленные в ходе открытого исследования, как на решающее доказательство. Необходимо получить контролируемые функциональные данные. |
|
Структурные ограничения конструкции |
Конструкция массой 138 кДа удаляет спектриновые повторы R16/17, содержащие сайты связывания nNOS. Потеря связывания nNOS может нарушить функциональный симпатолиз и защиту от ишемии во время физических упражнений, создавая механистический потолок для восстановления, не зависящий от уровня экспрессии. |
Необходимо добавить механистические исследования, показывающие, восстанавливает ли данная конкретная конструкция функцию соответствующего комплекса, связанного с дистрофином, локализацию nNOS, физиологию физических упражнений и защиту мышц. |
|
долговечность AAV |
Геномы векторов через 12 недель не обеспечивают устойчивой экспрессии. Геномы AAV9 в основном представляют собой неинтегрирующиеся эписомы и могут снижаться со временем. Устойчивость генома вектора не то же самое, что устойчивая экспрессия белка. |
Оцените продольную экспрессию трансгенного белка и устойчивость функциональных биомаркеров в течение более чем 12 недель. |
|
Иммунный/профиль безопасности |
Повышение уровня трансаминаз у 8 из 12 пациентов соответствует иммунному ответу на клетки, трансдуцированные AAV, однако механизм этого явления не установлен. Один случай миокардита вызывает опасения, учитывая кардиотропизм AAV9. |
Необходимо обеспечить более глубокий иммунологический мониторинг, характеристику безопасности для печени и сердца, а также усиленное кардиологическое наблюдение. |
|
Отбор пациентов/обобщаемость результатов |
Исключение пациентов с положительным результатом на нейтрализующие антитела к AAV9 ограничивает возможность обобщения результатов. Исключение делеций в экзоне 44 ограничивает применимость к этой подгруппе пациентов с ДМД. Количество пациентов (n=12) слишком мало для характеристики безопасности и эффективности в более широкой популяции пациентов с ДМД. |
По возможности следует расширить круг лиц, имеющих право на участие, или заранее определить стратифицированный анализ по статусу антител, генотипу/классу экзона, возрасту и исходному состоянию здоровья, прежде чем использовать результаты для обоснования широкого одобрения. |
Регуляторный вывод: Упаковка может демонстрировать биологическую активность, но пока не установлено, что измеренная экспрессия микродистрофина является надежным суррогатным показателем, способным с достаточной вероятностью предсказать клиническую пользу. Основные недостатки заключаются в специфичности анализа, недействительных стандартах количественного определения, возможном смешивании с ревертантными волокнами, отсутствии рандомизированного контроля, смешивании с возрастными изменениями NSAA, неопределенной долговечности и нерешенных вопросах безопасности/обобщаемости.
Для устранения этого пробела программе потребуется контролируемый, стратифицированный по возрасту клинический дизайн с анализами экспрессии трансгенов, ортогональным количественным определением белков, контролем состава тканей, данными о долгосрочной устойчивости, механистическими функциональными анализами укороченной конструкции и более строгим мониторингом безопасности, особенно в отношении печени и сердца.
Критерии оценки и баллы
Критерии оценки: Выявляет проблемы анализа/измерения при количественном определении микродистрофина, включая совпадение эпитопа MANEX1A, недействительные стандарты полноразмерного дистрофина и необходимость измерения с использованием рекомбинантных или ортогональных трансгенов. +24 Объясняет, почему уровень экспрессии микродистрофина не является автоматически допустимым суррогатом функциональной клинической пользы. +22 Отмечает факторы, влияющие на результаты, связанные с местом биопсии, составом ткани и возрастным окном, которые ослабляют интерпретацию экспрессии и NSAA. +19 Критикует компаратор/статистику NSAA, особенно зависимость от внешних контрольных групп естественного течения заболевания. +12 Рассматривает долговечность AAV, иммунный ответ, трансаминит, миокардит и необходимость более длительного наблюдения за экспрессией/безопасностью. +15 Отмечает пробелы в отборе пациентов/обобщаемости результатов, включая исключение анти-AAV9, исключение экзона 44 и малый размер выборки. +8
Более убедительные научные доводы
Медицинская химия
GPT-Rosalind демонстрирует лучшие в отрасли показатели в области медицинской химии, которая занимается превращением молекул в полезные лекарственные препараты. Мы разработали MedChemBench, чтобы отразить реалистичные рабочие процессы медицинской химии, оценивая многомодальное понимание химической структуры; взаимосвязь структуры и активности (SAR); прогнозирование эффективности, токсичности и абсорбции, распределения, метаболизма и выведения лекарственных препаратов (ADME); принятие решений по оптимизации ведущего соединения с учетом множества параметров; и ретросинтез. GPT-Rosalind превосходит GPT-5.5 на MedChemBench с показателем 27,5% против 25,1%, при этом используя на 7,2% меньше токенов.
GPT-Rosalind демонстрирует лучшие возможности многомодального синтеза и механистического анализа в медицинской химии.
Геномика и количественная биология
В GeneBench, нашей оценке эффективности работы агентов в рамках долгосрочного комплексного анализа в геномике и количественной биологии, GPT-Rosalind использует на 31% меньше токенов, чем GPT-5.5, при этом достигая более высокой точности — 21,6% против 20,4%. GeneBench оценивает производительность агентов в долгосрочных количественных задачах: может ли агент, основываясь на реалистичных научных данных, спланировать корректный анализ, контроль качества, моделирование и корректировки для получения ответов, позволяющих принимать решения? Включенные задачи охватывают различные области, включая функциональную геномику, пространственную транскриптомику, протеомику, эпигеномику и прикладную генетику.
GPT-Rosalind использует на 31% меньше токенов, чем GPT-5.5, при этом повышая точность.
Оказание помощи в проведении лабораторных работ в реальных условиях.
Мы представляем новую оценку для проверки способности GPT-Rosalind помогать ученым, проводящим лабораторные исследования в реальных условиях. LabWorkBench проверяет способность модели связывать возмущения с результатами экспериментов в реальных лабораторных протоколах, используемых учеными, для целей от устранения неполадок до оптимизации. Данные, используемые LabWorkBench, являются собственностью компании и, следовательно, не содержат примесей. GPT-Rosalind набирает 63,2% против 55,8% у GPT-5.5, используя при этом на 5,3% меньше токенов.
В реальных условиях лабораторных работ GPT-Rosalind демонстрирует значительные преимущества по сравнению с GPT-5.5, одновременно повышая эффективность использования токенов.
От логических рассуждений до реализованных рабочих процессов
Мы разработали плагины Life Sciences Research (открывается в новом окне) и Life Sciences NGS Analysis (открывается в новом окне) , чтобы расширить интеллектуальные возможности GPT-Rosalind за счет практического уровня выполнения для повторяемых научных рабочих процессов. Вместе эти плагины объединяют поиск исходных данных, биологическую интерпретацию и выполнение биоинформатических операций в одном рабочем пространстве, помогая исследователям связывать внешние данные с внутренними омиксными анализами, сохраняя при этом артефакты и происхождение. Теперь все пользователи могут получить доступ к обоим плагинам через Codex. Квалифицированные корпоративные пользователи GPT-Rosalind могут дополнительно использовать GPT-Rosalind для работы с этими плагинами.
Чтобы эффективнее использовать Codex в качестве динамичной рабочей среды для ученых, мы добавили интерактивные средства просмотра для файлов биологических типов. Первоначальный набор средств просмотра последовательностей, выравниваний и структур разработан для того, чтобы ученые могли оставаться в курсе доказательств, пока GPT-Rosalind анализирует данные в рамках рабочего процесса, и напрямую отвечать на дополнительные вопросы, используя активное средство просмотра в контексте.
Демонстрация выше показывает эти возможности в действии, организованные GPT-Rosalind. Мы наблюдаем за учёным, исследующим жидкостную биопсию опухоли для выявления мутаций и других молекулярных изменений, которые могут повлиять на лечение. Плагин Life Sciences NGS Analysis превращает анализ обработанных записей ctDNA в интерактивный блокнот, выявляя повторяющиеся изменения, низкочастотные вызовы и траектории образцов, которые фокусируют исследование на KRAS G12C. Затем плагин Life Sciences Research добавляет контекст мишени, ингибитора и резистентности, а встроенные средства просмотра последовательности, выравнивания и структуры позволяют учёному изучить мутантный остаток 12, его консервативность в семействе RAS и непосредственно связанный с ингибитором карман. Рабочий процесс завершается преобразованием этих данных в конкретные варианты дальнейших действий, при этом каждый шаг и артефакт доступны для экспертной оценки.
Плагин для анализа NGS в области биологических наук
Контроль качества и аннотирование scRNA-seq

Превратите набор матричных данных в стиле 10x в отфильтрованные по контролю качества артефакты отдельных клеток, аннотации и UMAP-файлы, которые можно проверять и редактировать в Codex. Плагин Life Sciences NGS Analysis направляет запрос в scrna-seq-qc, выбирает пороговые значения контроля качества из данных, сохраняет информацию о происхождении данных при фильтрации и аннотировании, а также выявляет препятствия, такие как отсутствие зависимостей обнаружения дублетов.
Контроль качества FASTQ-секвенирования РНК в больших объемах

Превратите лист с образцами РНК-секвенирования, пакет FASTQ и эталонные файлы в проверенный на качество пакет данных, который можно проверить и повторно использовать в Codex. Плагин Life Sciences NGS Analysis направляет запрос, проверяет входные данные и возвращает проверяемый пакет результатов с матрицами MultiQC, Salmon, информацией о происхождении и подробными предупреждениями.
Расширенный доступ для организаций, пользующихся доверием.
Мы расширяем доступ к серии GPT-Rosalind для соответствующих организаций по всему миру. GPT-Rosalind будет доступен в режиме предварительного просмотра для исследовательских целей через нашу структуру развертывания с доверенным доступом для организаций, которые проводят законные научные исследования, имеющие очевидную общественную пользу, обладают строгим контролем за управлением и безопасностью, а также контролируемым доступом с обеспечением безопасности корпоративного уровня.
В рамках этой глобальной экспансии мы рады поддержать миссию Novo Nordisk по более быстрому предоставлению пациентам инновационных вариантов лечения, помогая масштабировать их медицинские исследования с помощью GPT-Rosalind. Novo Nordisk использует передовые возможности искусственного интеллекта, чтобы помочь исследователям анализировать сложные наборы данных, выявлять полезные закономерности и быстрее проверять гипотезы. Более глубокое биологическое понимание, обеспечиваемое GPT-Rosalind, поможет командам связать данные из литературы, геномики, транскриптомики, секвенирования, структуры и экспериментальных результатов, упрощая переход от данных к более четким исследовательским решениям.
«Науки о жизни — это сложные, насыщенные данными и междисциплинарные исследования. Чтобы принести значимую пользу исследователям, передовые модели ИИ должны основываться на достоверных научных данных, быть связаны с проверенными инструментами и интегрированы в реальные рабочие процессы, которые исследователи используют каждый день. Мы рады нашему партнерству с OpenAI и возможности изучить, как GPT-Rosalind может поддержать более строгие и практичные подходы к разработке лекарств».
Мишал Патель, вице-президент группы компаний Novo Nordisk по искусственному интеллекту и цифровым инновациям в сфере исследований и разработок.
Теперь мы также предлагаем управляемое рабочее пространство OpenAI для организаций, отвечающих установленным требованиям и не имеющих корпоративного аккаунта.
- Запросить доступ
Что дальше?
Обновленная версия GPT-Rosalind — это следующий шаг в нашем более широком стремлении к созданию систем искусственного интеллекта, которые могут помочь ускорить научные открытия, обеспечивая при этом использование передовых биологических возможностей с соответствующими мерами безопасности. Мы продолжим совершенствовать биологическое мышление модели, расширять поддержку ресурсоемких и долгосрочных исследовательских рабочих процессов, а также сотрудничать с квалифицированными организациями в разных регионах для оценки реального воздействия.
Это также означает применение ИИ в биологических науках к работе, имеющей большое значение для общества, от разработки лекарств и трансляционной медицины до общественного здравоохранения, готовности к чрезвычайным ситуациям и биологической защиты. С помощью Rosalind Biodefense и нашей модели развертывания с доверенным доступом мы стремимся предоставить передовые биологические возможности исследователям, учреждениям и специалистам по защите, работающим над улучшением здоровья человека и укреплением устойчивости общества.
Мы продолжим развивать GPT-Rosalind , чтобы стать более компетентным партнером на протяжении всего жизненного цикла научных исследований, помогая ученым быстрее переходить от правильных вопросов к более четким доказательствам, лучшим экспериментам и, в конечном итоге, к новым методам лечения пациентов.
Продолжайте читать
Просмотреть все
Улучшенная память для более полезного использования ChatGPTDreaming: Улучшенная память для более полезного использования ChatGPT
Исследование, 4 июня 2026 г.
Кодекс для каждой роли, инструмента и рабочего процесса.
Продукт выпущен 2 июня 2026 г.
Передовые модели OpenAI и Codex теперь доступны на WS.
Продукт выпущен 1 июня 2026 г.
Источник: openai.com
Похожие записи
- Французский Deezer запустил бесплатный инструмент для распознавания сгенерированной музыки на сторонних стримингах
- Я попросила Claude Fable 5 сделать игру одним промптом. Получился симулятор админа ИИ-канала
- Ногти поведали о тяжелой болезни потомка основателя империи Сун. Его состояние резко ухудшилось за десять недель до смерти
Похожие записи
Скоро грянет космобуря: чем опасен для спутников геомагнитный шторм
12.11.2025
DoorDash будет использовать уличных роботов Serve Robotics для доставки в Лос-Анджелесе
09.10.2025
