На конференции HIMSS26 руководители Emory Healthcare и Mass General Brigham обсудили, как такие инициативы, как Healthcare AI Challenge, призваны помочь системам здравоохранения принимать более безопасные решения о внедрении ИИ. 
Набиле Сафдар, директор по искусственному интеллекту в Emory Healthcare, и Бернардо Биццо, старший директор по искусственному интеллекту в Mass General Brigham.
Фото предоставлено Натаном Эдди.
ЛАС-ВЕГАС – В ходе выступления на Глобальной конференции и выставке здравоохранения HIMSS 2026, состоявшейся в среду, Набиле Сафдар, главный специалист по искусственному интеллекту в Emory Healthcare, и Бернардо Биццо, старший директор по искусственному интеллекту в Mass General Brigham, обсудили, как руководители здравоохранения могут принимать более взвешенные решения о внедрении ИИ на основе данных, объединяя данные и создавая доступные для всех контрольные показатели.
Инструменты искусственного интеллекта в здравоохранении быстро развиваются, однако многим врачам не хватает четких рамок для оценки их безопасности, надежности и клинической полезности.
Такие инициативы, как Healthcare AI Challenge, направлены на устранение этого пробела путем предоставления поставщикам медицинских услуг структурированных методов тестирования новых инструментов ИИ и получения обратной связи, которая может способствовать более безопасному внедрению этих инструментов в системах здравоохранения.
«Возможность использования ИИ заключается в повышении эффективности рабочих процессов в здравоохранении, — сказал Биццо. — Но системам здравоохранения не хватает инструментов для оценки безопасности и эффективности базовых моделей».
Сафдар отметил, что организации часто сталкиваются со сложным процессом оценки, прежде чем принять решение о внедрении новой системы искусственного интеллекта. Внедрение этих инструментов требует инвестиций в реализацию, обучение персонала и интеграцию рабочих процессов.
«Клинические руководители не уверены, приносит ли это им пользу», — сказал Сафдар.
Хотя такие технологии, как документирование окружающей среды и искусственный интеллект для обработки изображений, продемонстрировали ощутимые преимущества, в целом ситуация становится все сложнее.
Биззо объяснил, что окупаемость инвестиций во многие инструменты ИИ остается неопределенной. Несмотря на мощь технологии, большинство базовых моделей были разработаны как системы общего назначения, а не как инструменты, предназначенные для сферы здравоохранения.
«Самая большая проблема, с которой мы сталкиваемся, заключается в отсутствии контрольных показателей для оценки эффективности этих инструментов и того, насколько хорошо они могут нам помочь», — сказал Биццо.
Для решения этой проблемы Биццо и его коллеги создали инициативу, направленную на систематическую оценку систем искусственного интеллекта в различных клинических сценариях.
Конкурс Healthcare AI Challenge позволяет врачам и исследователям из участвующих учреждений тестировать различные модели ИИ, используя общие наборы данных и стандартизированные методы оценки.
В рамках инициативы создана платформа «AI Arena», где клинические эксперты анализируют результаты работы различных моделей ИИ и сравнивают их производительность в таких задачах, как составление радиологических отчетов или обобщение медицинских записей.
На данный момент в рамках конкурса Healthcare AI Challenge было проведено пять этапов, в которых приняли участие более 4500 человек (примерно 200 из 40 учреждений), представивших свои результаты. Исследователи протестировали 18 базовых моделей, включая как системы общего назначения, так и модели, разработанные специально для здравоохранения.
Платформа позволяет врачам оценивать инструменты искусственного интеллекта по нескольким параметрам, а не только по технической точности.
«Когда речь заходит об ИИ, многие из нас зацикливаются на точности, — сказал Сафдар. — Но часто врач общей практики думает: „Сделает ли это меня быстрее?“»
В рамках платформы AI Arena эксперты могут сравнивать результаты работы человека с результатами ИИ или анализировать, как различные модели показывают себя по сравнению друг с другом. Они также могут оценивать такие факторы, как скорость, клиническая полезность и соответствие результатов приемлемому порогу для клинических рабочих процессов.
Биззо заявил, что цель состоит в создании повторяемого процесса оценки систем искусственного интеллекта до того, как системы здравоохранения начнут вкладывать в них значительные средства.
«Для медицинских работников это информация, которую необходимо знать, прежде чем инвестировать в ту или иную модель», — сказал он.
Заглядывая в будущее, Биццо отметил, что планируется расширение платформы для прямой интеграции с системами электронных медицинских карт и оценка новых рабочих процессов на основе агентного ИИ. Эти усилия направлены на измерение не только технических характеристик, но и реального повышения производительности труда врачей, использующих эту технологию на практике.
«Мы хотим измерить, насколько эффективнее стали работать пользователи, и предоставить эту информацию, чтобы вы знали, какой отдачи от инвестиций можно ожидать», — добавил он.
Теги: HIMSS26, Mass General Brigham, Emory Healthcare
Источник: www.healthcareitnews.com





















