Image

Сдача части экзамена на получение лицензии на медицинское обслуживание не делает ЧатгПТА хорошим врачом

Тест на медицинскую сертификацию программного обеспечения прошел нормально, но его диагнозы не соответствуют действительности.

Smiling doctor discussing medical results with a woman.

В ходе исследования, проведенного в 2022 году, ChatGPT смог пройти некоторые тесты на получение лицензии на медицинское обслуживание в Соединенных Штатах (USMLE). В этом году команда канадских медиков проверила, насколько это полезно для реального врачевания. И это не так.

ChatGPT против Medscape

“Нашим источником медицинских вопросов был банк вопросов Medscape”, — сказал Амрит Кирпалани, преподаватель медицины из Западного университета в Онтарио, Канада, который руководил новым исследованием эффективности ChatGPT в качестве диагностического инструмента. USMLE содержал в основном тестовые вопросы с несколькими вариантами ответов; в Medscape есть полные медицинские кейсы, основанные на реальных пациентах, с результатами физикального обследования, лабораторных анализов и так далее.

Идея, стоящая за этим, состоит в том, чтобы усложнить эти случаи для практикующих врачей из-за таких осложнений, как множественные сопутствующие заболевания, когда два или более заболевания присутствуют одновременно, и различных диагностических дилемм, которые делают правильные ответы менее очевидными. Команда Кирпалани превратила 150 таких случаев из Medscape в подсказки, которые ChatGPT смог понять и обработать.

Это было немного непросто, потому что у OpenAI, компании, создавшей ChatGPT, есть ограничения на использование его для медицинских консультаций, поэтому запрос на прямую диагностику случая не сработал. Однако это было легко обойти, сообщив ИИ, что диагнозы необходимы для академической исследовательской работы, которую писала команда. Затем команда предоставила ему различные варианты ответов, скопировала / вставила всю информацию о случае, доступную в Medscape, и попросила ChatGPT предоставить обоснование выбранных ответов.

Оказалось, что в 76 из 150 случаев ChatGPT ошибался. Но предполагалось, что чат-бот будет хорош в диагностике, не так ли?

Специальные инструменты

В начале 2024 года. Google опубликовала исследование, посвященное Articulate Medical Intelligence Explorer (AMIE), большой языковой модели, специально разработанной для диагностики заболеваний на основе бесед с пациентами. По данным New England Journal of Medicine и Clinicopathological Conferences, AMIE превзошла обычных врачей в диагностике 303 случаев. И AMIE — не исключение; за последний год не проходило и недели, чтобы не было опубликовано исследование, демонстрирующее поразительные результаты искусственного интеллекта в диагностике рака и диабета и даже в прогнозировании мужского бесплодия на основе результатов анализа крови.

Разница между такими специализированными медицинскими ИИ и ChatGPT, однако, заключается в данных, на которых они были обучены. “Такие ИИ, возможно, изучали тонны медицинской литературы и, возможно, даже были обучены аналогичным сложным случаям”, — объяснил Кирпалани. “Они могут быть адаптированы для понимания медицинской терминологии, интерпретации диагностических тестов и распознавания закономерностей в медицинских данных, относящихся к конкретным заболеваниям или состояниям. В отличие от этого, магистры общего профиля, такие как ChatGPT, обучены широкому кругу тем и не обладают глубокими знаниями в этой области, необходимыми для постановки медицинского диагноза”.

❌ Нет тегов для этой статьи
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых