Использование ИИ для помощи врачам в диагностике редких генетических заболеваний у детей | OpenAI

18.06.2026 ideipro.ru

В исследовании, опубликованном в журнале NEJM AI, эксперты использовали модель логического мышления OpenAI для повторного анализа 376 ранее нераскрытых дел и выявления зацепок для 18 диагнозов.

Ознакомиться с аннотацией исследования можно в журнале NEJM AI (откроется в новом окне).

Почему в старом деле может содержаться новый ответ
Как работал повторный анализ
Что обнаружили исследователи
- Результаты по когортам
Проявление гибкости при выявлении вариантов.
Формулирование проверяемой, биологически обоснованной гипотезы
Ограничения
Что будет дальше?

Оглавление

Почему в старом деле может содержаться новый ответ
Как работал повторный анализ
Что обнаружили исследователи
- Результаты по когортам
Проявление гибкости при выявлении вариантов.
Формулирование проверяемой, биологически обоснованной гипотезы
Ограничения
Что будет дальше?

Даже при использовании геномного секвенирования многие люди с редкими заболеваниями так и не получают четкого генетического диагноза. Примерно половина из них остаются без диагноза после обширных исследований и консультаций специалистов. Их медицинские данные могут содержать подсказки, но для их поиска может потребоваться просеивание тысяч или миллионов возможных генетических вариантов, фрагментированных клинических записей и быстро меняющейся научной литературы.

По мере накопления новых данных о взаимосвязи генов и заболеваний, описаний клинических случаев и классификационных доказательств, нераскрытые дела могут приобретать новые интерпретационные свойства.

Исследователи из Центра исследований редких заболеваний имени Мантона при Бостонской детской больнице, Гарвардского университета и OpenAI использовали модель логического мышления OpenAI o3 Deep Research для анализа обезличенной клинической и геномной информации из 376 ранее проанализированных случаев, остававшихся нераскрытыми. Модель выявила связанные с доказательствами возможные объяснения для исследователей и клиницистов. После экспертной оценки, дополнительных исследований и клинического подтверждения врачи установили диагнозы в 18 случаях — дополнительный диагностический показатель в 4,8% после предварительного анализа специалистами. Это исследование было опубликовано 18 июня 2026 года в журнале NEJM AI и показывает, как рабочий процесс исследования с использованием ИИ может помочь экспертам генерировать зацепки при повторном рассмотрении некоторых из самых сложных случаев.

Многие из этих случаев ускользали от многолетнего анализа экспертов. В этом исследовании OpenAI o3 Deep Research помог исследователям выявить потенциальные проблемы, которые впоследствии были оценены в рамках установленных клинических процессов, что позволяет предположить, что периодический повторный анализ под руководством экспертов может стать более масштабируемым по мере развития знаний. Модель не ставила диагноз ни одному пациенту и не принимала никаких клинических решений. Она выдавала гипотезы, связанные с имеющимися данными, для рассмотрения специалистами и, при необходимости, для дальнейшего исследования с помощью дополнительных тестов и подтверждения в клинической лаборатории.

Почему в старом деле может содержаться новый ответ

Неоднозначный результат генетического теста не всегда является окончательным заключением. Описание фенотипа пациента, результаты анализов и семейный анамнез могут быть разрознены по базам данных, использующим различные идентификаторы, форматы и терминологию. Связать эти записи сложно, поэтому даже специалисты могут пропустить диагноз. Эксперты также могут секвенировать геном ребенка до того, как соответствующий ген или его варианты будут связаны с заболеванием. По мере развития научных знаний одни и те же данные могут дать ответы, которые ранее было невозможно найти.

Переанализ редких заболеваний представляет собой как научную, так и техническую проблему. Геном пациента может оставаться неизменным, но имеющиеся данные постоянно меняются: исследователи связывают новые гены и варианты с заболеваниями, лаборатории переклассифицируют старые варианты, а базы данных случаев и научные статьи накапливают новые наблюдения. Каждое обновление может сделать старый, неубедительный случай достойным повторного изучения, поэтому многие учреждения накапливают все большее количество геномов, которые необходимо поддерживать в актуальном состоянии в соответствии с постоянно меняющейся базой знаний.

В этом исследовании ученые разработали рабочий процесс таким образом, чтобы модель выступала в качестве слоя рассуждений, ориентированного на объяснение, поверх существующих геномных конвейеров. Вместо того чтобы возвращать только ранжированный ген, ей было предложено связать клинические характеристики, модель наследования, данные о вариантах и научную литературу в обоснование, которое мог бы проанализировать эксперт.

Как работал повторный анализ

Для каждого случая команда составляла обезличенный пакет, содержащий стандартизированные термины онтологии фенотипов человека (Human Phenotype Ontology) для описания клинической картины пациента, отдельные заметки врача и любые описательные клинические диагнозы, метаданные, такие как возраст и пол, а также отфильтрованную таблицу вариантов. В таблице указывалась редкость каждого варианта, его прогнозируемое влияние на кодируемый белок, классификация ClinVar и качество сигнала у доступных членов семьи. В большинстве случаев данные включали информацию о ребенке и обоих биологических родителях.

Команда попросила модель предложить наиболее правдоподобное молекулярное объяснение и продемонстрировать свою работу. Затем исследователи проанализировали результаты, используя ту же структуру ACMG/AMP, которую клинические лаборатории используют для классификации генетических вариантов. По меньшей мере два члена команды рассмотрели каждый вариант, разногласия разрешались путем консенсуса, и результат работы модели никогда не рассматривался как диагноз. Результат считался диагнозом только после того, как квалифицированные эксперты рассмотрели доказательства, вариант был классифицирован как патогенный или вероятно патогенный, сертифицированная лаборатория CLIA подтвердила его, и клиническая команда вернула результат семье.

Перед анализом нераскрытых дел команда усовершенствовала рабочий процесс для случаев с установленными диагнозами. В 48 из 51 случаев, включавших различные редкие заболевания, удалось восстановить правильный ген и вариант в двух повторах. В наборе из 57 случаев нервно-мышечных заболеваний рабочий процесс позволил установить правильный диагноз в двух повторах для 45 случаев. В наборе из 15 случаев, полученных методом секвенирования генома с длинным прочтением, был определен правильный ген в каждом случае и оба вызывающих заболевание аллеля в 12 случаях. Эти оценки способствовали быстрой разработке и показали, где экспертная оценка по-прежнему необходима.

Оценки уверенности модели, полученные на основе самооценки, коррелировали с правильными диагнозами в ранее раскрытых случаях: средний минимальный балл составлял 85,6 для неизменно правильных диагнозов и 42,1 для неправильных или неизвестных диагнозов. Эти оценки не являлись калиброванными вероятностями, и команда не использовала их в качестве замены доказательств или клинической оценки. Однако они помогли экспертам-рецензентам сосредоточиться на наиболее перспективных вариантах диагнозов.

Что обнаружили исследователи

Затем команда применила этот алгоритм к четырем группам ранее нераскрытых дел: дети с нарушениями нейропсихического развития, люди с редкими нервно-мышечными заболеваниями, дети и подростки с ранним психозом, а также случаи внезапной неожиданной смерти в педиатрии. Это были не новые случаи, ожидающие первого рассмотрения. Многие из них уже были изучены с помощью нескольких коммерческих или институциональных программ и обсуждены междисциплинарными группами.

Результаты по когортам

Когорта	Случаи	Диагнозы всплыли	Урожай
Нейроразвитие	100	10	10,0%
Нервно-мышечные заболевания	61	4	6,6%
Внезапная неожиданная смерть в педиатрии	200	2	1,0%
Ранний психоз	15	2	13,3%
Общий	376	18	4,8%

Когорта пациентов с ранним психозом была небольшой, поэтому ее процентное соотношение имеет широкий доверительный интервал. Показатель эффективности также отражает вероятность того, что в каждой когорте имелось объяснение, связанное с одним геном.

После того, как модель выявила потенциальных кандидатов, а эксперты завершили анализ и клиническое подтверждение, врачи установили диагнозы в 4,8% случаев. Этот показатель скромный, но значимый для данной популяции, поскольку предыдущие экспертные оценки не дали однозначного результата. Аналогичные исследования по повторному анализу сообщают об однозначных показателях улучшения в случаях, подвергнутых тщательному анализу; более высокие результаты обычно достигаются в исследованиях, содержащих новые случаи или хорошо известные заболевания, ожидающие генетического подтверждения.

Из 18 диагнозов 7 были повторными обнаружениями: диагнозы, установленные вне рамок локального исследовательского процесса, но отсутствующие в документации, которую изучала группа. В нескольких случаях варианты уже были указаны как патогенные или вероятно патогенные в общедоступных базах данных, что подчеркивает операционную сложность синтеза информации из разных источников данных.

Проявление гибкости при выявлении вариантов.

В одном случае раннего психоза модель выявила структурное событие в геноме, которое не было указано во входных данных. Она связала последовательность низкокачественных результатов анализа хромосомы 22 с сердечными, иммунными, нейропсихологическими и психиатрическими особенностями ребенка, а затем выдвинула гипотезу о делеции 22q11.2, связанной с синдромом ДиДжорджа. Эта гипотеза была подтверждена последующим секвенированием генома.

Хотя в задании требовалось указать одну моногенную причину, модель иногда выявляла два гена, которые лучше объясняли сложную картину. Варианты генов LAMA2 и FOXP1 вместе помогли объяснить особенности развития мышц и нервной системы в одном случае; в другом было обнаружено ранее нераспознанное дигенное объяснение, включающее гены TTN и SRPK3 .

Формулирование проверяемой, биологически обоснованной гипотезы

Помимо диагностики, модель также выявила возможное новое механистическое объяснение состояния, называемого витилиго. В одном случае нейроразвития модель выявила делецию 11 аминокислот в гене S1PR1 у человека с витилиго. Ген S1PR1 кодирует клеточный рецептор, участвующий в передаче сигналов, перемещении иммунных клеток и биологии тканей. Модель интегрировала данные, свидетельствующие о том, что делеция может изменять структуру рецептора и передачу сигналов таким образом, что это снижает выработку пигмента, одновременно помогая иммунным клеткам сохраняться в коже.

Предложенная взаимосвязь между S1PR1 и витилиго требует дополнительной экспериментальной проверки, но она демонстрирует важную роль искусственного интеллекта в преобразовании разрозненных результатов структурной биологии, иммунологии и клинической генетики в конкретные, проверяемые гипотезы.

Команда исследователей также обнаружила возможное расширение фенотипа в группе пациентов с нервно-мышечными заболеваниями. Вредоносные варианты в генах HSPB8 и CDK13 не совсем точно соответствовали наиболее известным заболеваниям, связанным с этими генами, что указывает на более широкий клинический спектр, для проверки которого потребуется больше случаев и лабораторных исследований.

Пример из практики: диагноз, поставленный Кире спустя почти два десятилетия.

Всё началось на занятиях карате, когда мать Киры заметила, что её 9-летняя дочь стала хуже опускаться в стойку. Кира также стала медленнее двигаться во время футбольных тренировок и стоять на носках при ходьбе и беге. Педиатр не смог определить причину мышечной слабости и направил её к специалисту. За этим последовало почти 20-летнее путешествие, включавшее обследования, лечение и консультации, но безрезультатно.

Случай Киры был одним из четырех диагнозов, выявленных в когорте пациентов с нервно-мышечными заболеваниями. Команда связала ее состояние с вариантом со сдвигом рамки считывания в гене HSPB8 и диагностировала форму миофибриллярной миопатии, при которой аномальные белковые структуры накапливаются в мышечных волокнах и способствуют слабости. Генетический консультант из Центра Мантона позвонил Кире примерно за неделю до ее 28-летия.

К тому времени Кира большую часть своей жизни провела, приспосабливаясь к болезни. К 13 годам она уже была зависима от аппарата искусственной вентиляции легких и передвигалась в инвалидном кресле, хотя с тех пор ее состояние стабилизировалось. Хотя форма миофибриллярной миопатии, которой страдает Кира, настолько редка, что о ее долгосрочном течении известно немного, этот диагноз принес некоторое успокоение.

Ограничения

Данное исследование показывает, что универсальная модель рассуждений может способствовать ретроспективному геномному переанализу, объединяя фенотип, наследование, аннотации вариантов, закономерности качества данных и научную литературу в проверяемые гипотезы. Оно также демонстрирует, почему периодический переанализ имеет значение: некоторые ответы появляются только после того, как знания расширяются или разрозненные записи объединяются.

Данное исследование не является доказательством того, что пациенты, врачи или клиенты должны использовать модели OpenAI для диагностики заболеваний или принятия медицинских решений. Оно не описывает и не одобряет предполагаемое использование клиентами OpenAI o3 Deep Research, ChatGPT или любого другого продукта OpenAI для диагностики. Модель не ставила диагноз ни одному из участников; каждый диагноз был поставлен врачами и другими квалифицированными клиническими экспертами посредством установленных процессов проверки, тестирования и клинического подтверждения.

Исследование носило ретроспективный характер, когорты были неоднородными, и эксперты не были осведомлены о достоверности модели. Исследователи не измеряли сэкономленное время, затраты, усилия врачей, количество ложноположительных результатов или изменения в лечении. Они также не проводили систематической оценки других форм генетической изменчивости, таких как структурные варианты, экспансии повторов, глубокие интронные изменения или мозаицизм.

Крупные языковые модели могут неправильно интерпретировать контекст или выдавать правдоподобные объяснения, которые оказываются несостоятельными при более тщательном анализе. Поэтому каждый результат проходил проверку человеком и клиническое подтверждение. Модель расширяла область поиска и фокусировала последующий анализ, проводимый человеком; она не решала, какая информация или диагноз должны быть предоставлены семье.

В данном исследовании использовалась обезличенная информация, при этом никакая защищенная медицинская информация не использовалась и не передавалась за пределы утвержденных сред. Более широкое клиническое внедрение потребует такого же внимания к конфиденциальности, безопасности, возможности аудита и местному регулированию, которое применяется ко всем видам медицинской помощи. Доступ к модели не заменяет инфраструктуру секвенирования, генетическое консультирование, подтверждающее тестирование или экспертное мнение специалистов.

Абстрактный синий градиентный фон с плавными переходами между светло-голубыми, голубыми и темно-синими тонами, создающий эффект размытия.

«Главная проблема — это время. Специалист может посвятить определенное количество времени в течение дня одному конкретному человеку».

Доктор Кэтрин Браунштейн , Центр исследований редких заболеваний им. Мантона при Бостонской детской больнице.

«Исследователи, подобные Кэтрин и мне, просто не могут запомнить 8000 различных заболеваний. В этом и заключается сила искусственного интеллекта».

Алан Беггс , директор Мантонского центра исследований редких заболеваний.

Что будет дальше?

В перспективных многоцентровых исследованиях следует сравнить повторный анализ с помощью LLM со стандартной практикой по таким параметрам, как диагностическая эффективность, время до получения кандидата, трудозатраты врача, количество ложноположительных результатов, стоимость и влияние на лечение. Версионированные подсказки, проверка ссылок, журналы аудита и калиброванная неопределенность будут важны для воспроизводимости и безопасности. Такие исследования по-прежнему потребуют квалифицированных врачей для оценки доказательств, назначения соответствующих анализов и принятия решения о диагнозе или лечении.

В данном исследовании использовалась платформа OpenAI o3 Deep Research. Более новые модели общего назначения способны осуществлять поиск и синтез большего объема научного материала, в то время как специализированные системы, такие как GPT-Rosalind, предназначены для более глубокой работы в области биологических наук, включая изучение влияния вариантов на структуру и функцию белков. Эти возможности не тестировались в данном исследовании и потребуют отдельной оценки и контроля доступа.

Хотя OpenAI оказала поддержку этому первоначальному исследованию, Центр Мантона возглавит следующий этап работы благодаря гранту от Фонда OpenAI. Грант поддержит более масштабные усилия Центра по разработке платформенно-независимого, недорогого пилотного проекта в области генетики на основе искусственного интеллекта, который поможет клиническим группам быстрее и точнее анализировать случаи редких заболеваний.

Долгосрочная перспектива исследований заключается в изучении того, может ли экспертный переанализ с помощью ИИ помочь научному пониманию идти в ногу с открытиями. Речь идёт не о замене врачебного диагноза ИИ, а о том, что тщательно оцененные исследовательские инструменты могут помочь специалистам выявлять доказательства, заслуживающие изучения. Для тысяч семей сегодняшние нерешенные вопросы не должны оставаться нерешенными навсегда.

Источник: openai.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Почему в старом деле может содержаться новый ответ

Как работал повторный анализ

Что обнаружили исследователи

Результаты по когортам

Проявление гибкости при выявлении вариантов.

Формулирование проверяемой, биологически обоснованной гипотезы

Пример из практики: диагноз, поставленный Кире спустя почти два десятилетия.

Ограничения

Что будет дальше?

Похожие записи

Похожие записи

Рой Ли из Cluely намекает, что вирусной шумихи недостаточно

Да, LinkedIn заблокировал стартап Artisan, занимающийся разработкой ИИ-агентств, но теперь он вернулся.

Восстановление древней пирамиды в Гизе временно приостановили

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email