Покажите нам доказательства ценности медицинского ИИ.

Утверждения о том, что медицинский ИИ улучшает качество медицинской помощи, должны быть подкреплены соответствующими доказательствами.

Внедрение инструментов на основе искусственного интеллекта (ИИ) стремительно растет на всех уровнях систем здравоохранения. Прогностические модели, инструменты поддержки принятия решений и генеративные инструменты уже проникли в клиническую практику¹, а большие языковые модели все чаще используются широкой общественностью для поиска медицинской информации и консультаций². Однако доказательств того, что инструменты ИИ приносят пользу пациентам, поставщикам медицинских услуг или системам здравоохранения, по-прежнему мало.

Тем не менее, в публикациях и материалах по продуктам все чаще встречаются заявления о клиническом воздействии, хотя нет четкого согласия относительно того, какой уровень доказательств должен требоваться, прежде чем такие заявления будут считаться достоверными. Результатом является не только научная неопределенность, но и зачастую преждевременное внедрение и использование. Если ИИ должен существенно улучшить качество медицинской помощи, необходимо начать систематически и последовательно связывать заявления о воздействии с соответствующими, соразмерными доказательствами. Срочно необходима система оценки медицинских технологий на основе ИИ, с использованием каких показателей и по каким критериям.

До сих пор оценка медицинского ИИ в основном основывалась на статистических показателях — таких как дискриминация, калибровка, чувствительность и специфичность — которые измеряют вычислительные возможности и производительность инструмента. Хотя эти показатели, безусловно, важны, сами по себе они не устанавливают клиническое воздействие. Система может очень хорошо работать при ретроспективной проверке, но при этом не улучшить качество медицинской помощи, если ее результаты несвоевременны, сложны для интерпретации, непоследовательно обрабатываются или нарушают клинические рабочие процессы. В результате, когда такие инструменты внедряются без более конкретных показателей их клинического воздействия, системы здравоохранения и пользователи могут инвестировать в продукты, реальная ценность которых в лучшем случае остается неопределенной, а непредвиденные последствия могут быть существенными.

Исторически сложилось так, что для подтверждения клинического эффекта в медицине требовалось нечто большее, чем просто демонстрация технических характеристик. Например, разработка лекарств обычно требует все более убедительных доказательств, прежде чем будет признана клиническая польза, а механизмы надзора со стороны государственных органов помогают определить, когда доказательств достаточно для одобрения, рекомендации или возмещения затрат. По многим причинам, включая быстрые темпы технологических изменений, разнородные области применения и различные стимулы для сбора доказательств, в области медицинского ИИ до сих пор не разработаны сопоставимые нормы. Хотя нормативно-правовые рамки являются предметом постоянных дискуссий и разработок, они остаются неадекватными3. Опубликованные исследования часто делают акцент на технической обоснованности, а не на клинической полезности4. Решения о внедрении часто принимаются до того, как будут адекватно рассмотрены основные вопросы практической применимости, осуществимости, безопасности и эффективности5. В отсутствие консенсуса по стандартам доказательств эти решения могут в большей степени основываться на энтузиазме на раннем этапе внедрения, чем на последовательных критериях. Без более четких правил и прямого требования предоставлять убедительные доказательства порог для заявления о ценности остается слишком изменчивым.

В дальнейшем в области медицинского ИИ необходимо разработать последовательную структуру, связывающую утверждения о клинической ценности инструмента ИИ с соответствующими доказательствами, необходимыми для подтверждения этих утверждений. Например, утверждения об аналитической эффективности должны требовать надежной валидации в предполагаемых условиях и для целевой популяции, тогда как утверждения о клинической применимости должны требовать доказательств того, что результаты интерпретируемы и могут способствовать принятию обоснованных решений. Утверждения о пользе для рабочих процессов должны требовать исследований по внедрению, показывающих, что инструменты могут быть интегрированы без задержек, обременений или непредвиденного вреда. Утверждения об улучшении результатов или эффективности должны требовать более убедительных перспективных доказательств, включая сравнительные оценки со стандартами лечения, где это уместно. Более того, поскольку производительность модели может меняться со временем, мониторинг после внедрения следует рассматривать как институциональное ожидание, а не как позднее, необязательное дополнение.

Наличие такой структуры не означает, что каждый инструмент ИИ должен пройти все этапы тестирования вплоть до рандомизированного контролируемого исследования, прежде чем его внедрять, как это обычно требуется для других медицинских вмешательств. Во многих случаях это было бы нецелесообразно, учитывая высокие затраты, быстрое обновление моделей, лежащих в основе инструментов, а также общую сложность и время, необходимые для проведения таких исследований. В то же время, принятие одних лишь ретроспективных показателей в качестве достаточного основания для доверия не является научно обоснованным. Поэтому целью должна быть соразмерность доказательств, то есть чем сильнее утверждение, тем сильнее доказательства, необходимые для его подтверждения.

Этот принцип имеет практическое значение для всех заинтересованных сторон. Например, регулирующие органы должны лучше разъяснить, какие категории медицинских инструментов ИИ требуют предварительных доказательств клинического воздействия, а какие могут быть внедрены в практику на основании более ограниченных заявлений. Медицинские организации и администраторы должны различать пилотное внедрение, оперативное использование и доказательства пользы, а не объединять их в одно решение. Во всех этих условиях стандарты доказательств должны быть прозрачными, специфичными для конкретных заявлений и открытыми для пересмотра по мере развития инструментов.

Научные журналы, как часть исследовательской экосистемы, обладают уникальной возможностью определять приемлемые типы доказательств. В развивающихся областях опубликованная литература часто рассматривается как установление того, что представляет собой достоверное доказательство для той или иной области исследований или практики. Внедряя соразмерные стандарты доказательности, журналы могут гарантировать, что опубликованные исследования отражают подлинные клинические утверждения, а не просто технические обещания, и эту роль мы будем продолжать поддерживать в Nature Medicine .

Следующий этап прогресса будет зависеть не только от более совершенных моделей и новых приложений, но и от более четких ожиданий в отношении того, как определяется, оценивается и сообщается о клиническом воздействии. Без четкой связи между утверждениями и доказательствами медицинский ИИ рискует внедряться быстрее, чем будет понята его реальная ценность.

Ссылки

  1. Хван, Ю.М., Нг, М.Й., Пиллай, М., Сахай, М.П. и Эрнандес-Буссар, Т. Nat. Health 1 , 99–112 (2026).

    Статья в Google Scholar

  2. Коста-Гомес, Б. и др. Препринт доступен по адресу https://doi.org/10.48550/arXiv.2512.11879 (2025).

  3. Фрейер О. и др. Нат. Мед. 31 , 3239–3243 (2025).

    Статья CAS PubMed Google Scholar

  4. Шуффани Эль Фасси, С. и др. Нат. Мед. 30 , 2718–2720 (2024).

    Статья CAS PubMed Google Scholar

  5. Ангус, округ Колумбия и др. JAMA 334 , 1650–1664 (2025 г.).

    Статья в PubMed Google Scholar

Скачать ссылки

Права и разрешения

Источник: www.nature.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Sceye завершает исторический 12-дневный полет в стратосфере дальностью 6 400 миль, продвигая новый уровень инфраструктуры для человечества
От пикселей до ДНК: почему будущее сжатия связано со всеми видами данных
Кристаллографы модифицировали синтетический аналог минерала для повышения качества керамики: Химия и науки о материалах
Ураган «Катрина» повлиял на жизнь и работу этого прибрежного эколога
Ураган «Катрина» повлиял на жизнь и работу этого прибрежного эколога
dummy-img
dummy-img
Робот пробежал полумарафон быстрее человека. Вот почему складывать белье все еще сложнее
Как быстро освоить Python для анализа данных в 2026 году (без потери времени)
Image Not Found
Sceye завершает исторический 12-дневный полет в стратосфере дальностью 6 400 миль, продвигая новый уровень инфраструктуры для человечества

Sceye завершает исторический 12-дневный полет в стратосфере дальностью 6 400 миль, продвигая новый уровень инфраструктуры для человечества

Sceye, американская аэрокосмическая и материаловедческая компания, специализирующаяся на высотных платформенных системах (HAPS) для телекоммуникаций и мониторинга окружающей среды в режиме реального времени, объявила об успешном завершении своей программы Endurance, в ходе которой Sceye HAPS SE2 преодолел более…

Апр 23, 2026
От пикселей до ДНК: почему будущее сжатия связано со всеми видами данных

От пикселей до ДНК: почему будущее сжатия связано со всеми видами данных

Как JPEG, MPEG и стандарты, разработанные специально для ИИ, меняют представление о медиа, машинном зрении и даже ДНК в нашем мире, перенасыщенном данными. Делиться Речь уже не идёт об аудио и видео. Раньше мы говорили о сжатии…

Апр 23, 2026
Кристаллографы модифицировали синтетический аналог минерала для повышения качества керамики: Химия и науки о материалах

Кристаллографы модифицировали синтетический аналог минерала для повышения качества керамики: Химия и науки о материалах

Кристалл исследуемого вещества на кончике стеклянной иголки (при 27 С°) и в кварцевом капилляре (при 500 и 1000 С°) — для рентгеноструктурных исследований. © Людмилой Гореловой Ученые Санкт-Петербургского государственного университета исследовали структуру редкого синтетического минерала цинкофосфата и…

Апр 23, 2026
dummy-img

SPT Labtech и EMBL GeneCore объединили усилия для создания полностью автоматизированных рабочих процессов в области геномики.

Автор: сотрудники Bio-IT World 16 апреля 2026 г. | Компания SPT Labtech и Центр геномики Европейской лаборатории молекулярной биологии (EMBL GeneCore) заключили соглашение о сотрудничестве для развития полностью автоматизированных рабочих процессов в области геномики. Универсальная платформа для…

Апр 23, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых