Anthropic выпустили Claude Opus 4.8 — новый лидер по агентским…
Anthropic выпустили Claude Opus 4.8 — новый лидер по агентским задачам и креативной работе
Модель набирает 69,2% в SWE-Bench Pro против 64,3% у Opus 4.7 и 57,9% в Humanity's Last Exam с инструментами, обходя GPT-5.5 и Gemini 3.1 Pro по большинству агентских бенчмарков.
Главные улучшения:
Модель стала заметно честнее — в 4 раза реже пропускает ошибки в коде без предупреждения, активнее признаёт неуверенность и реже выдумывает ответы.
В Claude Code добавили Dynamic Workflows: модель может разбивать огромные задачи на сотни параллельных подзадач, координировать их выполнение и проверять результаты. Например, Bun переписали с Zig на Rust (750 тысяч строк кода) всего за 11 дней.
Появился новый режим усилий (effort control) — можно выбирать между скоростью и глубиной проработки. Fast mode для Opus 4.8 работает в 2,5 раза быстрее и стал в 3 раза дешевле.
Цены не изменились: 5замиллионвходныхтокенови25 за миллион выходных. Fast mode — 10и50.
Уже можно тестить в Claude Code или на claude.ai


Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.