Архив рубрики ~Коротко из Telegram~

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки» Исследователи из MIT…

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки» Исследователи из MIT…

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки»

Исследователи из MIT предложили способ, который заставляет модели честно признавать неуверенность.

Проблема:

— ИИ часто отвечает уверенно, даже когда ошибается
— классическое обучение награждает за результат, а не за честность

Что сделали:

— ввели штраф за разницу между
— заявленной уверенностью
— и реальной точностью

Результат:

— модели начинают говорить «не уверен»
— ошибка калибровки упала на ~90%

Вывод:

раньше ИИ учился выглядеть правым,
теперь — понимать, когда он может ошибаться.

Это шаг от «всезнающего ассистента» к инструменту, которому можно доверять именно потому, что он умеет сомневаться.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Лента новостей~ [Перевод] Cloudflare: Оркестрация AI-ревью кода в промышленных масштабах Архив рубрики ~Лента новостей~ Ранние земледельцы из неолитического поселения получали битум из двух источников. На это указал анализ находок из окрестностей Иерусалима Архив рубрики ~Лента новостей~ FDA одобрило второй вид мух, питающихся трупами животных, для лечения ран с помощью личинок. Архив рубрики ~Лента новостей~ Компания Snap выделила команду разработчиков видеоконтента с использованием ИИ в отдельную компанию Dotmo из-за финансовых затрат. Архив рубрики ~Лента новостей~ Видеокарта ROG Astral RTX 5090 оставила крупное пятно на радиаторе платы ProArt X870E Архив рубрики ~Лента новостей~ Мой личный джуниор. Часть 3. Учим агента ждать Архив рубрики ~Лента новостей~ Офисные работники всего мира, объединяйтесь: пришло время возродить обед с тремя мартини! | Андреа Явор Архив рубрики ~Лента новостей~ 25 июня форум «Три кита национальной повестки» переосмыслит подход к устойчивому развитию Архив рубрики ~Лента новостей~ Солнечная энергия впервые в истории США произвела больше электроэнергии, чем уголь Архив рубрики ~Лента новостей~ Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки Архив рубрики ~Лента новостей~ Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code) Архив рубрики ~Лента новостей~ Зарянка покормила птенца оляпки. Необычный случай зафиксирован в Шотландии Архив рубрики ~Лента новостей~ В преддверии IPO компания OpenAI привлекает к работе ряд крупных игроков. Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании. Архив рубрики ~Лента новостей~ [Перевод] Cloudflare: Оркестрация AI-ревью кода в промышленных масштабах Архив рубрики ~Лента новостей~ Ранние земледельцы из неолитического поселения получали битум из двух источников. На это указал анализ находок из окрестностей Иерусалима Архив рубрики ~Лента новостей~ FDA одобрило второй вид мух, питающихся трупами животных, для лечения ран с помощью личинок. Архив рубрики ~Лента новостей~ Компания Snap выделила команду разработчиков видеоконтента с использованием ИИ в отдельную компанию Dotmo из-за финансовых затрат. Архив рубрики ~Лента новостей~ Видеокарта ROG Astral RTX 5090 оставила крупное пятно на радиаторе платы ProArt X870E Архив рубрики ~Лента новостей~ Мой личный джуниор. Часть 3. Учим агента ждать Архив рубрики ~Лента новостей~ Офисные работники всего мира, объединяйтесь: пришло время возродить обед с тремя мартини! | Андреа Явор Архив рубрики ~Лента новостей~ 25 июня форум «Три кита национальной повестки» переосмыслит подход к устойчивому развитию Архив рубрики ~Лента новостей~ Солнечная энергия впервые в истории США произвела больше электроэнергии, чем уголь Архив рубрики ~Лента новостей~ Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки Архив рубрики ~Лента новостей~ Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code) Архив рубрики ~Лента новостей~ Зарянка покормила птенца оляпки. Необычный случай зафиксирован в Шотландии Архив рубрики ~Лента новостей~ В преддверии IPO компания OpenAI привлекает к работе ряд крупных игроков. Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании.

Оставить комментарий