Абстрактная визуализация: знаки вопроса и галочки, потоки данных на черном фоне.

Более эффективный метод выявления чрезмерно самоуверенных больших языковых моделей.

Этот новый показатель для измерения неопределенности может помочь выявить галлюцинации и определить, можно ли доверять модели ИИ. Линии, образующие конусы, соединяются с галочками, вопросительными знаками и значками «x». Новая методика позволяет более надежно определять, когда крупная языковая модель проявляет чрезмерную уверенность, но при этом допускает ошибки, что может помочь пользователям понять, можно ли доверять прогнозам модели. Изображение: MIT News; iStock

Большие языковые модели (БЛМ) могут генерировать достоверные, но неточные ответы, поэтому исследователи разработали методы количественной оценки неопределенности для проверки надежности прогнозов. Один из популярных методов заключается в многократной отправке одного и того же запроса, чтобы проверить, генерирует ли модель один и тот же ответ.

Однако этот метод измеряет уверенность в себе, и даже самый впечатляющий человек с высоким уровнем интеллекта может с уверенностью ошибиться. Чрезмерная самоуверенность может ввести пользователей в заблуждение относительно точности прогноза, что может привести к катастрофическим последствиям в таких важных сферах, как здравоохранение или финансы.

Для устранения этого недостатка исследователи из Массачусетского технологического института разработали новый метод измерения другого типа неопределенности, который позволяет более надежно выявлять уверенные, но неверные ответы LLM.

Их метод заключается в сравнении реакции целевой модели с реакциями группы аналогичных моделей с линейными зависимостями. Они обнаружили, что измерение расхождений между моделями более точно отражает этот тип неопределенности, чем традиционные подходы.

Они объединили свой подход с показателем самосогласованности LLM для создания метрики общей неопределенности и оценили ее на 10 реалистичных задачах, таких как ответы на вопросы и математическое мышление. Эта метрика общей неопределенности неизменно превосходила другие показатели и лучше выявляла ненадежные прогнозы.

«Самосогласованность используется во многих различных подходах к количественной оценке неопределенности, но если ваша оценка неопределенности основана только на результатах одной модели, она не обязательно заслуживает доверия. Мы вернулись к истокам, чтобы понять ограничения существующих подходов, и использовали их в качестве отправной точки для разработки дополнительного метода, который может эмпирически улучшить результаты», — говорит Кимия Хамидие, аспирантка факультета электротехники и информатики Массачусетского технологического института и ведущий автор статьи об этой методике.

Вместе с ней в работе над статьей приняли участие Вероника Тост, научный сотрудник лаборатории искусственного интеллекта MIT-IBM Watson; Уолтер Герич, бывший постдокторант MIT, ныне доцент Вустерского политехнического института; Михаил Юрочкин, научный сотрудник лаборатории искусственного интеллекта MIT-IBM Watson; и старший автор Марзие Гассеми, доцент кафедры электротехники и информатики, член Института медицинских инженерных наук и Лаборатории информационных и систем принятия решений.

Понимание чрезмерной самоуверенности

Многие популярные методы количественной оценки неопределенности включают в себя запрос к модели оценки уровня достоверности или проверку согласованности ее ответов на один и тот же вопрос. Эти методы позволяют оценить алеаторную неопределенность, или то, насколько модель уверена в своем собственном прогнозе.

Однако модели с линейным выравниванием вероятностей (LLM) могут быть уверены в правильности своих выводов, даже если они совершенно неверны. Исследования показали, что эпистемическая неопределенность, или неуверенность в том, используется ли правильная модель, может быть лучшим способом оценки истинной неопределенности, когда модель чрезмерно самоуверенна.

Исследователи из Массачусетского технологического института оценивают эпистемическую неопределенность, измеряя разногласия в аналогичной группе моделей LLM.

«Если я задаю один и тот же вопрос ChatGPT несколько раз, и получаю один и тот же ответ снова и снова, это не значит, что ответ обязательно правильный. Если же я переключусь на Клода или Близнецов и задам им тот же вопрос, и получу другой ответ, это даст мне представление об эпистемической неопределенности», — объясняет Хамидие.

Эпистемическая неопределенность пытается определить, насколько целевая модель отклоняется от идеальной модели для данной задачи. Но поскольку построить идеальную модель невозможно, исследователи используют заменители или приближения, которые часто основаны на ошибочных предположениях.

Для улучшения количественной оценки неопределенности исследователям из Массачусетского технологического института потребовался более точный способ оценки эпистемической неопределенности.

Ансамблевый подход

Разработанный ими метод включает измерение расхождения между целевой моделью и небольшим ансамблем моделей аналогичного размера и архитектуры. Они обнаружили, что сравнение семантического сходства, или того, насколько точно совпадают значения ответов, может дать более точную оценку эпистемической неопределенности.

Для получения наиболее точной оценки исследователям потребовался набор моделей LLM, охватывающих разнообразные ответы, не слишком похожих на целевую модель и взвешенных на основе достоверности.

«Мы обнаружили, что самый простой способ удовлетворить всем этим требованиям — использовать модели, обученные разными компаниями. Мы перепробовали множество более сложных подходов, но в итоге именно этот очень простой подход оказался наиболее эффективным», — говорит Хамидие.

Разработав этот метод оценки эпистемической неопределенности, они объединили его со стандартным подходом, измеряющим алеаторную неопределенность. Этот показатель общей неопределенности (ТУ) наиболее точно отражал, насколько уровень доверия к модели заслуживает доверия.

«Неопределенность зависит от неопределенности заданного вопроса, а также от того, насколько близка наша модель к оптимальной. Именно поэтому суммирование этих двух показателей неопределенности даст нам наилучшую оценку», — говорит Хамидие.

Метод TU мог бы более эффективно выявлять ситуации, когда LLM испытывает галлюцинации, поскольку эпистемическая неопределенность может уверенно указывать на неверные результаты, которые могут быть пропущены методом алеаторной неопределенности. Это также могло бы позволить исследователям подкреплять уверенно правильные ответы LLM во время обучения, что может улучшить производительность.

Они протестировали TU, используя несколько LLM на 10 распространенных задачах, таких как ответы на вопросы, составление резюме, перевод и математическое мышление. Их метод оказался более эффективным в выявлении ненадежных прогнозов, чем любой из методов по отдельности.

Для измерения полной неопределенности часто требовалось меньше запросов, чем для расчета алеаторной неопределенности, что позволяло снизить вычислительные затраты и сэкономить энергию.

Их эксперименты также показали, что эпистемическая неопределенность наиболее эффективна в задачах с единственным правильным ответом, таких как ответы на фактические вопросы, но может быть менее эффективной в задачах с более открытым концом.

В будущем исследователи могли бы адаптировать свою методику для повышения ее эффективности при обработке запросов с открытым ответом. Они также могли бы развить эту работу, изучив другие формы алеаторной неопределенности.

Данная работа частично финансируется лабораторией искусственного интеллекта MIT-IBM Watson.

Источник: news.mit.edu

✅ Найденные теги: Более, Большие Языковые Модели, Выявление, МЕТОД, новости, Самоуверенность

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Исследование показало, что искусственный интеллект выявляет значительные ошибки в диагностике типов рака.
Пояс астероидов в космосе с крупными каменными объектами на фоне звёзд.
Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network
Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network
ideipro logotyp
ideipro logotyp
Ученый в лаборатории, работающий с современным лабораторным оборудованием.
Блок-схема исследования: экспериментальная и контрольная группы в деревнях.
Танкерам, проходящим через Ормузский пролив, придется платить пошлину в криптовалюте.
Image Not Found
Исследование показало, что искусственный интеллект выявляет значительные ошибки в диагностике типов рака.

Исследование показало, что искусственный интеллект выявляет значительные ошибки в диагностике типов рака.

Врачи, использующие алгоритм одного из поставщиков, обнаружили ошибки в диагностике плоскоклеточного рака легких, влияющие на решения о лечении и результаты лечения пациентов. Главный клинический директор компании подробно рассказывает об исследовании, опубликованном в журнале JAMA. Global Artificial Intelligence…

Апр 10, 2026
Пояс астероидов в космосе с крупными каменными объектами на фоне звёзд.

Мы обнаружили огромный астероид, вращающийся с невероятной скоростью.

Астрономы обнаружили астероид шириной 710 метров, который совершает один оборот за 1,9 минуты, что настолько быстро, что он должен был бы разлететься на части. Художественное изображение астероида 2025 MN45 Обсерватория имени Веры К. Рубин, финансируемая Национальным научным…

Апр 10, 2026
Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network

Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network

Аналитики GlobalData прогнозируют, что интерфейсы мозг-компьютер находятся на пороге коммерциализации, а первый выход на рынок ожидается в 2030 году. Фото: Who is Danny / Shutterstock.com Интерфейс «мозг-компьютер» (BCI) компании CorTec получил от Управления по санитарному надзору за…

Апр 10, 2026
Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network

Компания CorTec получила от FDA статус прорывного продукта в области интерфейса мозг-компьютер для реабилитации после инсульта — Medical Device Network

Аналитики GlobalData прогнозируют, что интерфейсы мозг-компьютер находятся на пороге коммерциализации, а первый выход на рынок ожидается в 2030 году. Фото: Who is Danny / Shutterstock.com Интерфейс «мозг-компьютер» (BCI) компании CorTec получил от Управления по санитарному надзору за…

Апр 10, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых