Текст "oh, wow." на розовом фоне, минималистичный дизайн.

Исследование Google: как «Ох!» и «Подожди-ка» удваивают точность LLM У…

Исследование Google: как «Ох!» и «Подожди-ка» удваивают точность LLM

У Google вышла неожиданно сильная и почти философская работа о том, что мы вообще называем «рассуждением» в больших языковых моделях.

Ключевая идея:
Reinforcement Learning учит модель не думать дольше, а думать коллективнее — через симуляцию внутреннего диалога.

Если вы замечали, что «думающая» модель:
• задаёт себе вопросы,
• сомневается,
• делает паузы,
• пересобирает позицию,

— то это не побочный эффект. Google утверждает: именно эта структура и есть механизм рассуждения.

Как они это проверили
1. Нашли конкретный нейронный признак, связанный с:
• удивлением,
• осознанием,
• сменой перспективы.
Он стабильно активируется в начале фраз вроде:
«О!», «Подожди-ка», «Ага, значит…»
2. Затем этот признак:
усилили во время генерации,
подавили,
• и сравнили результаты
(эксперимент на DeepSeek-R1-Llama-8B).
3. Результаты на сложных задачах комбинаторной арифметики:
• базовая модель — 27.1%
• с усилением «диалогового маркера» — 54.8%
• с подавлением — 23.8%

Эффект статистически значим и чётко выделяется на фоне других нейронных признаков. Более того, рост этого маркера коррелирует с улучшением стратегического мышления, а не просто с болтливостью.

Вывод (не самый удобный)

LLM, похоже, не столько рассуждают, сколько разыгрывают внутренний совет персонажей: сомневающийся, проверяющий, уточняющий, переосмысливающий.

И да — из этого следует практический, слегка ироничный вывод:
возможно, стоит попробовать в промпте что-то вроде

Используй больше “ах”, “точно”, “ага” — и пересобирай выводы

Исследование: arxiv.org/pdf/2601.10825

Текст "oh, wow." на розовом фоне, минималистичный дизайн.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Image Not Found
ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы Глава Дарио Амодеи уверен: после 2027 года ИИ сможет превзойти «почти всех людей почти во всём». Но текущая реальность сложнее: — LLM всё ещё галлюцинируют — проваливают…

Апр 21, 2026
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: —…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых