Архив рубрики ~Лента новостей~

Компания Anthropic выпускает Claude Sonnet 5 со значительной скидкой по сравнению со своей топовой моделью, стремясь к успешному IPO.

Компания Anthropic выпускает Claude Sonnet 5 со значительной скидкой по сравнению со своей топовой моделью, стремясь к успешному IPO.
Компания Anthropic выпускает Claude Sonnet 5 со значительной скидкой по сравнению со своей топовой моделью, стремясь к успешному IPO.

Майкл Нуньес

Компания Anthropic сегодня выпустила Claude Sonnet 5, новую модель искусственного интеллекта, которая, по словам компании, обеспечивает производительность, близкую к флагманским моделям, по ценам среднего уровня. Этот шаг призван предоставить экономным корпоративным разработчикам доступ к мощным возможностям агентного управления как раз в тот момент, когда расположенная в Сан-Франциско лаборатория ИИ готовится к первичному публичному размещению акций, которое проверит, смогут ли ошеломляющие оценки частного рынка ИИ выдержать проверку общественности.

В результате релиза, который Anthropic описывает как «самую агентную модель Sonnet на сегодняшний день», Sonnet 5 становится моделью по умолчанию для пользователей бесплатных и Pro-планов Anthropic, а также становится доступным для клиентов Max, Team и Enterprise. Начальная цена API установлена на уровне 2 доллара за миллион входных токенов и 10 долларов за миллион выходных токенов до 31 августа, после чего она повысится до 3 и 15 долларов соответственно — что по-прежнему значительно ниже цен в 5 долларов за вход и 25 долларов за выход в топовой версии Opus 4.8 от Anthropic.

Стратегическая логика очевидна: Anthropic стремится демократизировать доступ к возможностям, которые до недавнего времени были доступны только в самых дорогих моделях, одновременно создавая такую широкую базу разработчиков, которая будет выглядеть привлекательно в заявке S-1.

Тесты производительности Sonnet 5

Результаты тестов Sonnet 5 показывают, что модель среднего уровня приближается к флагманской модели Anthropic — Opus.

Sonnet 5 демонстрирует значительное превосходство над своим предшественником, Sonnet 4.6, по всем показателям, опубликованным Anthropic. В SWE-bench Pro, тесте на определение агентных функций, Sonnet 5 набирает 63,2% против 58,1% у Sonnet 4.6 — этот скачок приближает его к показателю Opus 4.8 (69,2%). В Terminal-Bench 2.1, другом тесте на определение функций, разрыв сокращается еще больше: 80,4% для Sonnet 5 против 67,0% для Sonnet 4.6 и 82,7% для Opus 4.8.

В тесте Humanity's Last Exam по междисциплинарному мышлению Sonnet 5 набирает 43,2% без использования инструментов и 57,4% с использованием инструментов — последний показатель практически совпадает с 57,9% у Opus 4.8. В задачах на использование компьютера, оцененных с помощью OSWorld-Verified, Sonnet 5 достигает 81,2%, что выше показателя 78,5% ранее. А в тесте GDPval-AA v2, оценивающем интеллектуальный труд, он набирает 1618 баллов — превосходя 1615 баллов у Opus 4.8 и значительно превосходя 1395 баллов у Sonnet 4.6.

Результаты этих оценок говорят об одном и том же: Sonnet 5 не просто немного превосходит своего предшественника. Он выходит на уровень производительности, который в значительной степени совпадает с флагманской моделью Anthropic, при этом его стоимость примерно на 60% ниже за токен по стандартной цене и еще ниже в течение вводного периода.

Партнеры из числа корпоративных клиентов утверждают, что возможности Sonnet 5 в области агентного искусственного интеллекта завершают задачи, от которых отказались предыдущие модели.

Акцент на агентных возможностях — способности планировать, использовать такие инструменты, как браузеры и терминалы, и автономно выполнять многоэтапные рабочие процессы — отражает смещение центра тяжести индустрии ИИ в 2026 году. Предприятия больше не просто задают вопросы чат-ботам; они развертывают системы ИИ, которые могут ориентироваться в сложных программных средах, выполнять многоэтапные задачи кодирования и работать с минимальным участием человека.

Партнеры, получившие ранний доступ, описали модель, которая не просто начинает задачи, но и доводит их до конца. Суалех Асиф, соучредитель Cursor, редактора кода на основе ИИ, ставшего эталоном внедрения инструментов для разработчиков, сказал: «С Claude Sonnet 5 агенты придерживаются плана, следуют нашим соглашениям и вносят чистые многоэтапные изменения, и все это с эффективными затратами». Дэниел Шепард, старший инженер Zapier, описал, как он передал модели задачу автоматизации, состоящую из двух частей — обновление уровней учетных записей Salesforce и отправку объявления о запуске, — которая «раньше застревала на полпути» в предыдущих моделях, а теперь завершается от начала до конца.

Эти отзывы важны, потому что они точно описывают тот самый пробел в надежности, который мешал многим предприятиям перевести агентный ИИ из пилотных программ в производственные развертывания. Модель, которая выполняет 80% сложной задачи, прежде чем остановиться, создает больше проблем, чем решает; модель, которая надежно завершает весь рабочий процесс, меняет экономику автоматизации. Компания Anthropic также представила кривые зависимости затрат от производительности, показывающие, что разработчики теперь могут регулировать уровни усилий в Sonnet 5 и Opus 4.8, чтобы найти оптимальный баланс затрат и точности для своего конкретного случая использования — детализация, отражающая растущую сложность того, как предприятия используют сервисы ИИ.

Сонет 5, проверенный OSWorld.

Обновленный токенизатор повышает производительность Sonnet 5, но может незаметно увеличить затраты на некоторые рабочие нагрузки.

В сносках к объявлению есть одна техническая деталь, заслуживающая внимания: в Sonnet 5 используется обновленный токенизатор, который меняет способ обработки текста моделью, аналогично изменению, внесенному Anthropic в Opus 4.7.

Компромисс заключается в том, что один и тот же входной параметр может соответствовать примерно в 1,0–1,35 раза большему количеству токенов в зависимости от типа контента. Компания Anthropic заявляет, что начальная цена рассчитана таким образом, чтобы переход был «примерно нейтральным с точки зрения затрат», но корпоративным клиентам, работающим с большими объемами данных, следует тщательно оценить свои конкретные сценарии использования, прежде чем предполагать, что их счета не изменятся.

Компания Anthropic утверждает, что Sonnet 5 безопаснее своего предшественника, но её самые совершенные модели по-прежнему лидируют по точности выравнивания.

Информация о безопасности, предоставленная компанией Anthropic, раскрывает более сложную картину. Компания сообщает, что Sonnet 5 демонстрирует более низкий уровень галлюцинаций и подхалимства, чем Sonnet 4.6, лучше справляется с отказом от злонамеренных запросов и более устойчив к атакам с использованием мгновенных инъекций в агентных контекстах. В автоматизированном поведенческом аудите Anthropic, который проверяет широкий спектр несоответствующих действий, включая сотрудничество со злоупотреблением и обманом, Sonnet 5 получил более низкий балл (что означает большую безопасность) в целом, чем Sonnet 4.6.

Однако Sonnet 5 продемонстрировал «несколько более высокие показатели некорректного поведения» по сравнению с более мощными Opus 4.8 и Claude Mythos Preview от Anthropic, мощной, но строго ограниченной моделью компании, ориентированной на кибербезопасность. В ходе оценки разработки эксплойтов для Firefox 147, проведенной в сотрудничестве с Mozilla, ни одна из моделей Sonnet не смогла разработать работающий эксплойт — обе набрали 0,0% — хотя Sonnet 5 показал немного более высокий процент частичного успеха (13,2%), чем Sonnet 4.6 (8,8%). Обе модели по-прежнему значительно уступают Opus 4.8 (68,8% работающих эксплойтов) и Mythos 5 (88,4%).

Благодаря этим постепенным улучшениям возможностей, связанных с кибербезопасностью, Anthropic запустила Sonnet 5 с включенными по умолчанию средствами защиты от киберугроз — системами реального времени, которые обнаруживают и блокируют опасное использование кибербезопасности. Эти средства защиты аналогичны тем, что использовались в Opus 4.7 и 4.8, но менее строгие, чем те, что применялись в Fable 5, последней модели класса Mythos, о которой Bloomberg сообщил 10 июня, что она «заблокирована от ответа на запросы, связанные с кибербезопасностью и биологией». Организации, участвующие в программе киберверификации Anthropic, автоматически получают тот же доступ к Sonnet 5 без необходимости повторной подачи заявки.

Сонет 5 - Firefox 147

От 14 миллиардов до 47 миллиардов долларов выручки: выходит пятый сонет, и формируется предвыборная стратегия Anthropic перед IPO.

Запуск Sonnet 5 приходится на, возможно, самый важный момент в короткой истории Anthropic. В начале июня компания конфиденциально подала в Комиссию по ценным бумагам и биржам США (SEC) проспект IPO, что, по словам CNBC, стало «самым тщательно контролируемым публичным размещением акций в истории технологического сектора».

Финансовая динамика компании была необычайной. В феврале Anthropic привлекла 30 миллиардов долларов при оценке в 380 миллиардов долларов, при этом компания сообщила о годовой выручке в 14 миллиардов долларов, которая, как сообщила газета The Guardian, «увеличилась более чем в десять раз в каждом из последних трех лет».

К концу мая Anthropic завершила раунд финансирования серии H на сумму 65 миллиардов долларов при оценке компании в 965 миллиардов долларов после привлечения инвестиций — раунд возглавили Altimeter Capital, Sequoia Capital и другие — с годовым доходом, превышающим 47 миллиардов долларов. Харрисон Рольфес, аналитик PitchBook, заявил CNBC, что цифра, которая «либо подтвердит, либо опровергнет всю версию, которую частные рынки устанавливали в течение трех лет», будет не оценкой или доходом, а валовой прибылью — показателем, который еще не видел ни один сторонний наблюдатель.

В этом контексте Sonnet 5 выполняет двойную функцию. Для разработчиков он предлагает реальные улучшения возможностей по конкурентоспособным ценам. Для стратегии выхода Anthropic на IPO он демонстрирует, что компания может предложить привлекательный продукт по цене, которая может обеспечить широкое распространение, которое ценит Уолл-стрит — большой объем регулярного дохода от API от тысяч корпоративных клиентов.

Государственные контракты и растущая конкуренция определяют рынок, на который выходит Sonnet 5.

Время также совпадает с агрессивным стремлением Anthropic к заключению институциональных контрактов. Буквально вчера губернатор Калифорнии Гэвин Ньюсом объявил о первом в своем роде партнерстве, предоставляющем Claude всем государственным учреждениям со скидкой 50%, а также бесплатное обучение персонала.

Кейт Дженсен, глава подразделения Anthropic в Северной и Южной Америке, назвала это попыткой «заставить Клода работать на людей, которые обеспечивают функционирование этого штата». Эта сделка, распространяющаяся на города и округа Калифорнии, представляет собой именно тот тип устойчивого, регулярного использования, который может обеспечить доход далеко за пределами сообщества застройщиков.

Однако релиз Anthropic происходит на всё более переполненном рынке. OpenAI, которая в марте привлекла 122 миллиарда долларов инвестиций при оценке в 852 миллиарда долларов, планирует собственное IPO. SpaceX Илона Маска, объединившаяся с xAI, установила цену своего IPO на уровне 135 долларов за акцию при оценке в 1,77 триллиона долларов. Google, Meta и растущая волна хорошо финансируемых конкурентов, включая азиатские стартапы в области ИИ, которые, как сообщала Wall Street Journal, разрабатывают возможности кибербезопасности, подобные Mythos, — все они борются за один и тот же корпоративный рынок.

Гил Лурия, руководитель отдела технологических исследований в DA Davidson, заявил CNBC, что, хотя Anthropic «похоже, лидирует» в разработке передовых моделей ИИ, «большая часть их текущего использования приходится на испытания и эксперименты, и это может оказаться недолговечным». Это наблюдение затрагивает суть проблемы, стоящей перед каждой лабораторией, занимающейся разработкой передовых моделей ИИ: преобразование экспериментального использования разработчиками в устойчивый доход, пригодный для промышленного применения.

Сонет 5. Несогласованное поведение

Настоящая проверка для Sonnet 5 заключается не в бенчмарках, а в том, сможет ли более дешевый ИИ поддержать проект, оцениваемый в триллион долларов.

Позиционирование Sonnet 5 — предложение производительности, близкой к Opus, по цене Sonnet — является прямым шагом к такому переходу. Корпоративные клиенты, экспериментирующие с дорогими моделями класса Opus, могут обнаружить, что Sonnet 5 обеспечивает достаточное качество для производственных нагрузок по цене, которую финансовые отделы смогут одобрить в масштабах производства. Если это сработает, это может ускорить переход от экспериментов к внедрению, который необходим каждой компании, занимающейся ИИ, чтобы оправдать свою стоимость.

Три фактора определят, будет ли Sonnet 5 иметь значение помимо первоначальных сравнительных тестов. Во-первых, это реальная надежность работы агентов: сравнительные тесты измеряют возможности, а развертывание в производственной среде измеряет стабильность, и настоящая проверка наступит, когда тысячи разработчиков будут тестировать модель в сложных, непредсказуемых рабочих процессах в масштабе предприятия.

Вторая проблема — это экономика токенизатора: увеличение количества токенов в обновленном токенизаторе с 1,0 до 1,35x может незаметно снизить ценовое преимущество для определенных задач, и корпоративным клиентам следует проводить собственный анализ затрат, а не полагаться на заявленные цены за токен. Третья проблема — это сама концепция IPO: когда S-1 компании Anthropic наконец-то станет общедоступным, инвесторы будут внимательно изучать, какой из уровней — Sonnet (более дешевый, но с большим объемом продаж) или Opus (дорогой, но с высокой маржой) — обеспечивает основную часть выручки и, что особенно важно, валовой прибыли.

Как заявил Рольфес из PitchBook в интервью CNBC, период IPO 2026 года «либо станет самым значимым циклом IPO со времен эры доткомов, либо самым дорогим уроком о соотношении нарративных и фундаментальных факторов, который когда-либо преподавали публичные рынки».

Компания Anthropic делает ставку на то, что модель, достаточно хорошая, чтобы конкурировать с её флагманским продуктом, и достаточно дешёвая для масштабируемого производства, — это тот продукт, который сократит разрыв между этими двумя результатами. Вскоре публичные рынки решат, согласны ли они с этим.

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ UPD Для Pro, Max, Team и select Enterprise Fable 5… Архив рубрики ~Коротко из Telegram~ 🚨 Тест, проведённый The Washington Post, показал, что разные AI-модели… Архив рубрики ~Коротко из Telegram~ 🔥 Вышел «народный Opus 4.6» — энтузиасты с Hugging Face… Архив рубрики ~Коротко из Telegram~ Проверяем, готов ли ваш сайт к эпохе ИИ-агентов — Cloudflare… Архив рубрики ~Коротко из Telegram~ Аэропорт «Внуково» завершил импортозамещение программного комплекса для управления багажом, отказавшись… Архив рубрики ~Коротко из Telegram~ Удаленка разрушает отношения: у работающих из дома пар чаще возникают… Архив рубрики ~Коротко из Telegram~ Без особой помпы нам выкатили Sonnet 5. Классно, что пользоваться… Архив рубрики ~Обо всем~ Наверняка вы видели такие зеленовато-голубые огоньки на авто в крупных городах. Что же это такое? Архив рубрики ~Обо всем~ Расширяем наши данные об устойчивости к жаре на более чем 50 городов мира. Архив рубрики ~Обо всем~ Карим ЛАСКРИ: «Наша конечная цель состоит в том, чтобы как можно больше профессиональных энтузиастов поближе познакомились с FSP» Новости робототехники X Square Robot довел свою оценку до $2,8 млрд за четыре последовательных раунда финансирования Новости робототехники Умеют ли трансформеры водить машину Новости робототехники Мягкие роботизированные клетки по морфе встраивают физическую ИИ в оборудование Архив рубрики ~Обо всем~ 3 агента. 3 магистра права. 1 устаревающий графический процессор: разработка параллельного вывода на аппаратном уровне. Архив рубрики ~Коротко из Telegram~ UPD Для Pro, Max, Team и select Enterprise Fable 5… Архив рубрики ~Коротко из Telegram~ 🚨 Тест, проведённый The Washington Post, показал, что разные AI-модели… Архив рубрики ~Коротко из Telegram~ 🔥 Вышел «народный Opus 4.6» — энтузиасты с Hugging Face… Архив рубрики ~Коротко из Telegram~ Проверяем, готов ли ваш сайт к эпохе ИИ-агентов — Cloudflare… Архив рубрики ~Коротко из Telegram~ Аэропорт «Внуково» завершил импортозамещение программного комплекса для управления багажом, отказавшись… Архив рубрики ~Коротко из Telegram~ Удаленка разрушает отношения: у работающих из дома пар чаще возникают… Архив рубрики ~Коротко из Telegram~ Без особой помпы нам выкатили Sonnet 5. Классно, что пользоваться… Архив рубрики ~Обо всем~ Наверняка вы видели такие зеленовато-голубые огоньки на авто в крупных городах. Что же это такое? Архив рубрики ~Обо всем~ Расширяем наши данные об устойчивости к жаре на более чем 50 городов мира. Архив рубрики ~Обо всем~ Карим ЛАСКРИ: «Наша конечная цель состоит в том, чтобы как можно больше профессиональных энтузиастов поближе познакомились с FSP» Новости робототехники X Square Robot довел свою оценку до $2,8 млрд за четыре последовательных раунда финансирования Новости робототехники Умеют ли трансформеры водить машину Новости робототехники Мягкие роботизированные клетки по морфе встраивают физическую ИИ в оборудование Архив рубрики ~Обо всем~ 3 агента. 3 магистра права. 1 устаревающий графический процессор: разработка параллельного вывода на аппаратном уровне.

Оставить комментарий