
В понедельник компания Anthropic анонсировала Opus 4.5, новейшую версию своей флагманской модели. Это последняя модель из серии Anthropic 4.5, выпущенная после запуска Sonnet 4.5 в сентябре и Haiku 4.5 в октябре.
Как и ожидалось, новая версия Opus демонстрирует высочайшую производительность в ряде тестов, включая тесты кодирования (SWE-Bench и Terminal-bench), использования инструментов (tau2-bench и MCP Atlas) и решения общих проблем (ARC-AGI 2, GPQA Diamond).
Примечательно, что Opus 4.5 — первая модель, набравшая более 80% на проверенном SWE-Bench, авторитетном тесте кодирования.
Anthropic также подчеркнула возможности Opus в работе с компьютером и электронными таблицами и выпустила ряд параллельных продуктов, демонстрирующих эффективность модели в этих условиях. Вместе с Opus 4.5 Anthropic сделает более доступными свои продукты Claude для Chrome и Claude для Excel, ранее находившиеся в стадии пилотного запуска. Расширение для Chrome будет доступно всем пользователям Max, а модель, ориентированная на Excel, — пользователям Max, Team и Enterprise.
В Opus 4.5 также реализованы улучшения в области памяти для операций с большим объемом данных, что потребовало существенных изменений в том, как модель управляет своей памятью.
«Мы добились улучшения общего качества длительного контекста при обучении с помощью Opus 4.5, но одних контекстных окон будет недостаточно», — рассказала TechCrunch Дайанн На Пенн, руководитель отдела управления исследовательскими продуктами Anthropic. «Знание нужных деталей для запоминания действительно важно в дополнение к простому более продолжительному контекстному окну».
Эти изменения также добавили давно ожидаемую функцию «бесконечного чата» для платных пользователей Claude, которая позволит чатам продолжаться без прерывания, когда модель достигает своего контекстного окна. Вместо этого модель будет сжимать свою контекстную память, не предупреждая пользователя.
Многие обновления разработаны с учётом сценариев использования агентами, особенно в сценариях, где Opus выступает в роли ведущего агента, командующего группой субагентов, использующих Haiku. Выполнение этих задач требует хорошего владения рабочей памятью, и именно здесь улучшения памяти, описанные Пенном, действительно показывают свою ценность.
«Именно здесь такие фундаментальные вещи, как память, становятся действительно важными», — говорит Пенн, — «потому что Клоду необходимо иметь возможность исследовать кодовые базы и большие документы, а также знать, когда следует вернуться и перепроверить что-то».
Opus 4.5 столкнется с жесткой конкуренцией со стороны других недавно выпущенных передовых моделей, в первую очередь GPT 5.1 от OpenAI (выпущена 12 ноября) и Gemini 3 от Google (выпущена 18 ноября).
Источник: techcrunch.com



























