Изображение смартфона с логотипом ИИ и двумя анатомическими фигурами на синем фоне.

У «Доктора Гугла» были свои проблемы. Сможет ли ChatGPT Health добиться лучших результатов?

Новейший продукт OpenAI не заменит врача. Но он может быть лучше, чем поиск информации о ваших симптомах в интернете.

Две старые анатомические гравюры с изображением мышц и кровеносной системы человека обрамляют мобильный телефон с логотипом OpenAI. Одна из фигур выбрасывает маленькую иконку Google.

Стефани Арнетт/MIT Technology Review | Getty Images, Envato

В течение последних двух десятилетий для любого, кто начинает испытывать новые медицинские симптомы, существовал очевидный первый шаг: поиск информации в интернете. Эта практика была настолько распространена, что получила уничижительное прозвище «доктор Google». Но времена меняются, и многие люди, ищущие медицинскую информацию, теперь используют программы магистратуры в области медицины (LLM). По данным OpenAI, 230 миллионов человек еженедельно задают вопросы, связанные со здоровьем, через ChatGPT.

Таков контекст запуска нового продукта OpenAI — ChatGPT Health, который дебютировал в начале этого месяца. Его появление произошло в неподходящее время: двумя днями ранее новостной сайт SFGate опубликовал историю Сэма Нельсона, подростка, умершего от передозировки в прошлом году после продолжительных обсуждений с ChatGPT о том, как лучше всего комбинировать различные лекарства. После этих двух новостей многие журналисты поставили под сомнение целесообразность использования инструмента, способного причинить столь серьезный вред, в качестве медицинского совета.

Хотя ChatGPT Health находится в отдельной вкладке боковой панели от остальной части ChatGPT, это не новая модель. Это скорее оболочка, которая предоставляет одной из существующих моделей OpenAI руководство и инструменты, которые она может использовать для предоставления медицинских рекомендаций, включая некоторые, позволяющие ей получать доступ к электронным медицинским картам пользователя и данным фитнес-приложения, если ей предоставлено разрешение. Нет сомнений в том, что ChatGPT и другие крупные языковые модели могут допускать медицинские ошибки, и OpenAI подчеркивает, что ChatGPT Health предназначен в качестве дополнительной поддержки, а не замены врача. Но когда врачи недоступны или не могут помочь, люди будут обращаться к альтернативам.

Компании, занимающиеся искусственным интеллектом, перестали предупреждать вас о том, что их чат-боты не являются врачами. Читайте далее.

Некоторые врачи считают, что программы магистратуры в области медицины (LLM) способствуют повышению медицинской грамотности. Среднестатистическому пациенту может быть сложно ориентироваться в огромном массиве медицинской информации в интернете — и, в частности, отличать качественные источники от отполированных, но сомнительных с фактической точки зрения веб-сайтов, — но программы LLM могут сделать эту работу за них, по крайней мере, в теории. Лечение пациентов, которые искали информацию о своих симптомах в Google, требовало «много усилий по борьбе с тревожностью пациентов и уменьшению количества дезинформации», — говорит Марк Суччи, доцент Гарвардской медицинской школы и практикующий радиолог. Но теперь, по его словам, «вы видите пациентов с высшим образованием, со средним образованием, задающих вопросы на уровне, который мог бы задать начинающий студент-медик».

Выпуск ChatGPT Health и последующее объявление Anthropic о новых интеграциях Claude в сферу здравоохранения свидетельствуют о том, что гиганты в области ИИ все чаще готовы признавать и поощрять использование своих моделей в медицинских целях. Такое использование, безусловно, сопряжено с рисками, учитывая хорошо задокументированную тенденцию моделей с расширенными правами и возможностями (LLM) соглашаться с пользователями и выдумывать информацию, вместо того чтобы признать свое незнание.

Но эти риски также необходимо сопоставлять с потенциальными преимуществами. Здесь уместна аналогия с беспилотными автомобилями: когда политики рассматривают вопрос о разрешении Waymo в своем городе, ключевым показателем является не то, попадают ли их автомобили в аварии, а то, причиняют ли они меньше вреда, чем нынешнее положение дел, когда автомобили управляются людьми. Если Dr. ChatGPT — это улучшение по сравнению с Dr. Google (а предварительные данные говорят об обратном), то он потенциально может уменьшить огромное бремя медицинской дезинформации и ненужной тревоги по поводу здоровья, которые породил интернет.

Однако определить эффективность чат-ботов, таких как ChatGPT или Claude, для потребителей медицинских услуг непросто. «Оценить чат-бот с открытым концом крайне сложно», — говорит Даниэль Биттерман, руководитель клинического направления анализа данных и искусственного интеллекта в системе здравоохранения Mass General Brigham. Крупные языковые модели показывают хорошие результаты на экзаменах для получения медицинской лицензии, но эти экзамены используют вопросы с множественным выбором, которые не отражают того, как люди используют чат-боты для поиска медицинской информации.

Сириша Рамбхатла, доцент кафедры управления наукой и инженерией в Университете Ватерлоо, попыталась восполнить этот пробел, оценив, как GPT-4 реагирует на вопросы лицензионного экзамена, когда у него нет доступа к списку возможных ответов. Медицинские эксперты, оценивавшие ответы, признали правильной лишь около половины из них. Но вопросы с множественным выбором на экзамене разработаны таким образом, чтобы быть достаточно сложными, чтобы варианты ответов не раскрывали их полностью, и они все еще довольно далеки от того, что пользователь мог бы ввести в ChatGPT.

Другое исследование, в котором GPT-4o тестировался на более реалистичных вопросах, заданных добровольцами, показало, что он правильно отвечал на медицинские вопросы примерно в 85% случаев. Когда я разговаривал с Амульей Ядавом, доцентом Пенсильванского государственного университета, руководителем лаборатории «Ответственный ИИ для социальной эмансипации» и руководителем исследования, он ясно дал понять, что лично он не является поклонником медицинских программ магистратуры, ориентированных на пациентов. Но он откровенно признает, что, технически говоря, они, кажется, справляются со своей задачей — в конце концов, говорит он, врачи-люди ставят неверные диагнозы пациентам в 10-15% случаев. «Если посмотреть на это беспристрастно, кажется, что мир изменится, нравится мне это или нет», — говорит он.

По словам Ядава, для людей, ищущих медицинскую информацию в интернете, LLM-ы, похоже, являются лучшим выбором, чем Google. Рентгенолог Суччи также пришел к выводу, что LLM-ы могут быть лучшей альтернативой веб-поиску, сравнив ответы GPT-4 на вопросы о распространенных хронических заболеваниях с информацией, представленной в информационной панели Google — блоке, который иногда появляется справа от результатов поиска.

С момента публикации исследований Ядава и Суччи в интернете, в первой половине 2025 года, OpenAI выпустила несколько новых версий GPT, и вполне логично ожидать, что GPT-5.2 покажет еще лучшие результаты, чем ее предшественники. Однако у этих исследований есть важные ограничения: они сосредоточены на простых, фактических вопросах и рассматривают только краткие взаимодействия между пользователями и чат-ботами или инструментами веб-поиска. Некоторые из недостатков LLM — прежде всего, их подхалимство и склонность к галлюцинациям — могут проявиться в более продолжительных разговорах и с людьми, которые сталкиваются с более сложными проблемами. Рива Ледерман, профессор Мельбурнского университета, изучающая технологии и здравоохранение, отмечает, что пациенты, которым не нравится диагноз или рекомендации по лечению, полученные от врача, могут обратиться за другим мнением к LLM — и LLM, если он будет подхалимствовать, может побудить их отказаться от советов врача.

Некоторые исследования показали, что люди с ограниченными возможностями могут испытывать галлюцинации и проявлять подобострастие в ответ на вопросы, касающиеся здоровья. Например, одно исследование показало, что GPT-4 и GPT-4o с радостью принимают и используют неверную информацию о лекарствах, содержащуюся в вопросе пользователя. В другом исследовании GPT-4o часто придумывал определения для вымышленных синдромов и лабораторных анализов, упомянутых в вопросе пользователя. Учитывая обилие сомнительных с медицинской точки зрения диагнозов и методов лечения, циркулирующих в интернете, подобные модели поведения людей с ограниченными возможностями могут способствовать распространению медицинской дезинформации, особенно если люди считают таких людей заслуживающими доверия.

Компания OpenAI сообщила, что модели серии GPT-5 значительно менее склонны к подобострастию и галлюцинациям, чем их предшественники, поэтому результаты этих исследований могут не относиться к ChatGPT Health. Компания также оценила модель, лежащую в основе ChatGPT Health, по её ответам на вопросы, касающиеся здоровья, используя свой общедоступный бенчмарк HealthBench. HealthBench поощряет модели, которые выражают неуверенность, когда это уместно, рекомендуют пользователям обратиться за медицинской помощью при необходимости и воздерживаются от причинения пользователям ненужного стресса, сообщая им, что их состояние серьезнее, чем оно есть на самом деле. Разумно предположить, что модель, лежащая в основе ChatGPT Health, демонстрировала такое поведение в ходе тестирования, хотя Биттерман отмечает, что некоторые подсказки в HealthBench были сгенерированы LLM-моделями, а не пользователями, что может ограничить применимость бенчмарка к реальной жизни.

Языковая модель, избегающая паникерства, кажется явным улучшением по сравнению с системами, которые заставляют людей убеждать себя в наличии рака после нескольких минут поиска информации. И по мере дальнейшего развития больших языковых моделей и продуктов, созданных на их основе, преимущество, которое имеет доктор ChatGPT перед доктором Google, вероятно, будет расти. Внедрение ChatGPT Health, безусловно, является шагом в этом направлении: просматривая ваши медицинские записи, ChatGPT потенциально может получить гораздо больше информации о вашей конкретной ситуации со здоровьем, чем это может быть включено в любой поиск Google, хотя многие эксперты предостерегают от предоставления ChatGPT такого доступа по соображениям конфиденциальности.

Даже если ChatGPT Health и другие новые инструменты действительно представляют собой существенное улучшение по сравнению с поиском в Google, они все равно могут оказать негативное влияние на здоровье в целом. Подобно тому, как автоматизированные транспортные средства, даже если они безопаснее автомобилей с водителем-человеком, могут в конечном итоге оказаться вредными, если они побуждают людей меньше пользоваться общественным транспортом, LLM-ы могут подорвать здоровье пользователей, если они заставят людей полагаться на интернет вместо врачей-людей, даже если они повысят качество медицинской информации, доступной в интернете.

Ледерман утверждает, что такой исход вполне вероятен. В своих исследованиях она обнаружила, что участники онлайн-сообществ, посвященных здоровью, склонны доверять пользователям, которые умеют хорошо выражать свои мысли, независимо от достоверности предоставляемой ими информации. Поскольку ChatGPT общается как грамотный человек, некоторые могут слишком ему доверять, потенциально исключая из числа потенциальных кандидатов своего врача. Но специалисты по обучению грамоте, безусловно, не могут заменить врача — по крайней мере, пока.

Исправление 1/26: В предыдущей версии этой статьи ошибочно указывалась версия ChatGPT, которую тестировал Рамбхатла. Это была GPT-4, а не GPT-4o.

Источник: www.technologyreview.com

✅ Найденные теги: ChatGPT Health, Доктор Гугл, новости, Проблемы, Результаты, У

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.
Спутник исследует черную дыру в космосе, испускающий световой луч.
Пикачу использует электрический разряд на фоне неба.
Черный углеродное волокно с текстурой плетения, отражающий свет.
Круглый экран с изображением замка и горы, рядом электронная плата.
Код на экране компьютера, программирование, интерфейс разработчика.
Статистика использования видеокарт NVIDIA RTX, показывающая изменения за октябрь-февраль.
Макросъемка клетки под микроскопом, текстура и форма на голубом фоне.
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых