Архив рубрики ~Коротко из Telegram~

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки» Исследователи из MIT…

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки» Исследователи из MIT…

ИИ научили сомневаться: MIT снижает «самоуверенные ошибки»

Исследователи из MIT предложили способ, который заставляет модели честно признавать неуверенность.

Проблема:

— ИИ часто отвечает уверенно, даже когда ошибается
— классическое обучение награждает за результат, а не за честность

Что сделали:

— ввели штраф за разницу между
— заявленной уверенностью
— и реальной точностью

Результат:

— модели начинают говорить «не уверен»
— ошибка калибровки упала на ~90%

Вывод:

раньше ИИ учился выглядеть правым,
теперь — понимать, когда он может ошибаться.

Это шаг от «всезнающего ассистента» к инструменту, которому можно доверять именно потому, что он умеет сомневаться.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Лента новостей~ Видеокарта ROG Astral RTX 5090 оставила крупное пятно на радиаторе платы ProArt X870E Архив рубрики ~Лента новостей~ КВАРТИРНЫЙ ВОПРОС: ПОЧЕМУ С 1 ИЮЛЯ ВАШЕ ЖИЛЬЕ В ЗОНЕ РИСКА? Архив рубрики ~Лента новостей~ Война научила этого украинского предпринимателя ценить стойкость. Архив рубрики ~Лента новостей~ In the Weights — это ваш новый поиск по стилю, основанный на искусственном интеллекте. Архив рубрики ~Лента новостей~ Мой личный джуниор. Часть 3. Учим агента ждать Архив рубрики ~Лента новостей~ Офисные работники всего мира, объединяйтесь: пришло время возродить обед с тремя мартини! | Андреа Явор Архив рубрики ~Лента новостей~ 25 июня форум «Три кита национальной повестки» переосмыслит подход к устойчивому развитию Архив рубрики ~Лента новостей~ Солнечная энергия впервые в истории США произвела больше электроэнергии, чем уголь Архив рубрики ~Лента новостей~ Как учить иностранные слова? Архив рубрики ~Лента новостей~ Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки Архив рубрики ~Лента новостей~ Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code) Архив рубрики ~Лента новостей~ Зарянка покормила птенца оляпки. Необычный случай зафиксирован в Шотландии Архив рубрики ~Лента новостей~ В преддверии IPO компания OpenAI привлекает к работе ряд крупных игроков. Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании. Архив рубрики ~Лента новостей~ Видеокарта ROG Astral RTX 5090 оставила крупное пятно на радиаторе платы ProArt X870E Архив рубрики ~Лента новостей~ КВАРТИРНЫЙ ВОПРОС: ПОЧЕМУ С 1 ИЮЛЯ ВАШЕ ЖИЛЬЕ В ЗОНЕ РИСКА? Архив рубрики ~Лента новостей~ Война научила этого украинского предпринимателя ценить стойкость. Архив рубрики ~Лента новостей~ In the Weights — это ваш новый поиск по стилю, основанный на искусственном интеллекте. Архив рубрики ~Лента новостей~ Мой личный джуниор. Часть 3. Учим агента ждать Архив рубрики ~Лента новостей~ Офисные работники всего мира, объединяйтесь: пришло время возродить обед с тремя мартини! | Андреа Явор Архив рубрики ~Лента новостей~ 25 июня форум «Три кита национальной повестки» переосмыслит подход к устойчивому развитию Архив рубрики ~Лента новостей~ Солнечная энергия впервые в истории США произвела больше электроэнергии, чем уголь Архив рубрики ~Лента новостей~ Как учить иностранные слова? Архив рубрики ~Лента новостей~ Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки Архив рубрики ~Лента новостей~ Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code) Архив рубрики ~Лента новостей~ Зарянка покормила птенца оляпки. Необычный случай зафиксирован в Шотландии Архив рубрики ~Лента новостей~ В преддверии IPO компания OpenAI привлекает к работе ряд крупных игроков. Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании.

Оставить комментарий