
В понедельник компания Anthropic представила новую передовую модель под названием Claude Sonnet 4.5, которая, по её заявлению, обеспечивает высочайшую производительность в тестах программирования. Компания заявляет, что Claude Sonnet 4.5 способен создавать не только прототипы, но и «готовые к производству» приложения, что представляет собой скачок в надёжности по сравнению с предыдущими моделями ИИ.
Claude Sonnet 4.5 будет доступен через API Claude и в чат-боте Claude. Стоимость для разработчиков такая же, как и для Claude Sonnet 4: 3 доллара за миллион входящих токенов (примерно 750 000 слов, что больше, чем весь цикл «Властелин колец») и 15 долларов за миллион исходящих токенов.
За последний год ИИ-модели Anthropic стали фаворитами среди разработчиков и предприятий, во многом благодаря их высокой эффективности при решении задач разработки программного обеспечения. Apple и Meta, по имеющимся данным, используют ИИ-модели Claude для внутренних целей, а Anthropic добилась значительных успехов в продаже API-доступа к приложениям для программирования ИИ, таким как Cursor, Windsurf и Replit. Недавно GPT-5 от OpenAI бросил вызов доминированию Anthropic в этой области, превзойдя модели Claude в различных тестах программирования.
Anthropic утверждает, что Claude Sonnet 4.5 демонстрирует лучшую в отрасли производительность в нескольких бенчмарках, включая SWE-Bench Verified. Однако исследователь искусственного интеллекта Anthropic Дэвид Херши рассказал TechCrunch, что сложно оценить производительность Claude Sonnet 4.5 только по бенчмаркам.

Херши рассказал, что наблюдал, как Claude Sonnet 4.5 автономно кодировал до 30 часов во время первых испытаний у некоторых корпоративных клиентов. За это время он наблюдал, как ИИ-модель не только создавала приложение, но и запускала службы баз данных, приобретала доменные имена и проводила аудит SOC 2, чтобы убедиться в безопасности продукта.
В заявлении, предоставленном TechCrunch, генеральный директор Cursor Майкл Труэлл заявил, что Claude Sonnet 4.5 представляет собой передовой уровень производительности программирования, особенно для долгосрочных задач. Генеральный директор Windsurf Джефф Ван заявил, что Claude Sonnet 4.5 представляет собой «новое поколение моделей программирования».
Anthropic также утверждает, что Claude Sonnet 4.5 — самая совершенная на сегодняшний день передовая модель ИИ, с более низкими показателями подхалимства и обмана, чем у предыдущих моделей. Компания также заявляет, что Claude Sonnet стал менее восприимчивым к атакам с использованием подсказок.
Наряду с выпуском Claude Sonnet 4.5 компания Anthropic также выпускает Claude Agent SDK. Компания заявляет, что это та же инфраструктура, которая лежит в основе Claude Code, и её можно использовать для разработки собственных агентов.
Anthropic также выпускает временную исследовательскую версию под названием «Imagine with Claude» для подписчиков Max, которая демонстрирует, как ИИ-модель генерирует программное обеспечение «на лету». Компания заявляет, что модель будет реагировать на запросы пользователей в режиме реального времени, без предопределенной функциональности или написанного кода.
Из-за острой конкуренции в мире искусственного интеллекта компании часто выпускают флагманские модели каждые несколько месяцев. Claude Sonnet 4.5 выходит менее чем через два месяца после выхода последней модели искусственного интеллекта Anthropic, Claude Opus 4.1. Из-за таких быстрых производственных циклов любой компании сложно удерживать значительное лидерство в течение длительного времени.
Источник: techcrunch.com



























