Текст "oh, wow." на розовом фоне, минималистичный дизайн.

Исследование Google: как «Ох!» и «Подожди-ка» удваивают точность LLM У…

Исследование Google: как «Ох!» и «Подожди-ка» удваивают точность LLM

У Google вышла неожиданно сильная и почти философская работа о том, что мы вообще называем «рассуждением» в больших языковых моделях.

Ключевая идея:
Reinforcement Learning учит модель не думать дольше, а думать коллективнее — через симуляцию внутреннего диалога.

Если вы замечали, что «думающая» модель:
• задаёт себе вопросы,
• сомневается,
• делает паузы,
• пересобирает позицию,

— то это не побочный эффект. Google утверждает: именно эта структура и есть механизм рассуждения.

Как они это проверили
1. Нашли конкретный нейронный признак, связанный с:
• удивлением,
• осознанием,
• сменой перспективы.
Он стабильно активируется в начале фраз вроде:
«О!», «Подожди-ка», «Ага, значит…»
2. Затем этот признак:
усилили во время генерации,
подавили,
• и сравнили результаты
(эксперимент на DeepSeek-R1-Llama-8B).
3. Результаты на сложных задачах комбинаторной арифметики:
• базовая модель — 27.1%
• с усилением «диалогового маркера» — 54.8%
• с подавлением — 23.8%

Эффект статистически значим и чётко выделяется на фоне других нейронных признаков. Более того, рост этого маркера коррелирует с улучшением стратегического мышления, а не просто с болтливостью.

Вывод (не самый удобный)

LLM, похоже, не столько рассуждают, сколько разыгрывают внутренний совет персонажей: сомневающийся, проверяющий, уточняющий, переосмысливающий.

И да — из этого следует практический, слегка ироничный вывод:
возможно, стоит попробовать в промпте что-то вроде

Используй больше “ах”, “точно”, “ага” — и пересобирай выводы

Исследование: arxiv.org/pdf/2601.10825

Текст "oh, wow." на розовом фоне, минималистичный дизайн.
✅ Найденные теги: Google, LLM, Исследование, новости, Ох, Подожди-ка, Точность

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Схема взаимодействия пользователя и LLM через построитель контекста и внешние ресурсы.
Яркая полоса от падающего метеора в ночном небе над городом, звезды и огни на фоне.
Эволюция Вселенной: инфографика расширения и структуры космоса после Большого взрыва.
Компания Philips выпустила систему компьютерной томографии Rembra для диагностики неотложных состояний.
ideipro logotyp
Руководители обсуждают, как искусственный интеллект меняет структуру рабочей силы в здравоохранении, часть 1 | MobiHealthNews
ideipro logotyp
Манекен со штрихкодом на лице смотрит на смартфон в темноте.
График потребления энергии дата-центров xAI Colossus 2 и других, планы до 2027 года.
Image Not Found
Манекен со штрихкодом на лице смотрит на смартфон в темноте.

ИИ-зависимость: где инструмент незаметно становится опорой Компания Anthropic проанализировала 1,5…

ИИ-зависимость: где инструмент незаметно становится опорой Компания Anthropic проанализировала 1,5 млн переписок пользователей с ИИ-ассистентами. Результат оказался неоднозначным. У небольшого, но заметного процента пользователей ИИ перестаёт быть инструментом и начинает выполнять роль: — гуру — жизненного советника…

Мар 7, 2026
График потребления энергии дата-центров xAI Colossus 2 и других, планы до 2027 года.

Илон Маск запускает Colossus 2: гигаваттный прорыв Илон Маск официально…

Илон Маск запускает Colossus 2: гигаваттный прорыв Илон Маск официально представил Colossus 2. Это первый в истории гигаваттный вычислительный кластер. Его мощность превышает пиковое энергопотребление такого города, как Сан-Франциско. В основе системы — примерно 550 тысяч видеокарт.…

Мар 7, 2026
Бланк медицинской квитанции с таблицей для заполнения услуг и стоимости.

Юта доверила ИИ продлять рецепты Впервые в США искусственный интеллект…

Юта доверила ИИ продлять рецепты Впервые в США искусственный интеллект получил право продлевать медицинские назначения без участия врача. Юта стала пилотным штатом, где такая практика узаконена. Что произошло — Специально обученная система анализирует историю лечения и актуальные…

Мар 7, 2026
Коллаж с лицом, схемой подключения и изображением глаза в зелёном цвете.

Gmail и «эра Gemini»: почта превращается в базу знаний Google…

Gmail и «эра Gemini»: почта превращается в базу знаний Google объявила, что теперь внутри Gmail работает Gemini. Сервис перестаёт быть только архивом писем и начинает отвечать на вопросы на обычном языке. Можно спросить: «Какой сантехник присылал смету…

Мар 7, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых