Image

Вышла новая модель кодирования Composer 2 от Cursor: она превосходит Claude Opus 4.6, но всё ещё уступает GPT-5.4.

Карл Франзен

Мужчина печатает музыкальные ноты в темном офисе, а на стенах проецируется компьютерный код.

Источник: VentureBeat, создано с помощью OpenAI GPT-Image-1.5

Cursor, платформа для разработки программного обеспечения для искусственного интеллекта от стартапа Anysphere из Сан-Франциско, оцениваемая в 29,3 миллиарда долларов, выпустила Composer 2, новую, усовершенствованную версию китайской модели с открытым исходным кодом Kimi K2.5, которая теперь доступна в среде разработки программного обеспечения для агентного ИИ от Cursor. Она предлагает значительно улучшенные результаты по сравнению с предыдущей собственной моделью.

Кроме того, компания запускает и делает Composer 2 Fast , более дорогую, но более быструю версию, стандартной для пользователей.

Вот подробная разбивка затрат:

  • Composer 2 Standard: 0,50/2,50 доллара США за 1 миллион токенов ввода/вывода

  • Composer 2 Fast: по цене 1,50/7,50 долларов за 1 миллион токенов ввода/вывода

Это значительное снижение по сравнению с предыдущей внутренней моделью Cursor, Composer 1.5, выпущенной в феврале, которая стоила 3,50 доллара за миллион входных токенов и 17,50 доллара за миллион выходных токенов; Composer 2 примерно на 86% дешевле по обоим показателям.

Composer 2 Fast также примерно на 57% дешевле, чем Composer 1.5.

Также предусмотрены скидки на «кэшированное чтение», то есть на повторную отправку модели части тех же токенов в запросе: 0,20 доллара за миллион токенов для Composer 2 и 0,35 доллара за миллион для Composer 2 Fast, по сравнению с 0,35 доллара за миллион для Composer 1.5.

Важно также отметить, что это, по всей видимости, релиз, изначально разработанный для Cursor, а не широко распространенная автономная модель. В анонсе компании и документации по модели Composer 2 описывается как доступный в Cursor, оптимизированный для рабочего процесса агента Cursor и интегрированный с набором инструментов продукта.

Представленные материалы не означают, что они доступны для использования на внешних платформах моделей или в качестве универсального API вне среды Cursor.

Cursor продвигает программирование с долгосрочной перспективой, а не просто улучшенные функции автодополнения.

В основе технического нововведения в этом релизе лежит не просто утверждение, что Composer 2 превосходит Composer 1.5. Дело в том, что, по словам Cursor, эта модель лучше подходит для агентного программирования с долгосрочным горизонтом планирования.

В своем блоге компания Cursor заявляет, что улучшение качества стало возможным благодаря первому этапу предварительного обучения, который обеспечил более прочную основу для масштабируемого обучения с подкреплением. Затем, по словам компании, модель Composer 2 была обучена на задачах программирования с длительным горизонтом планирования, и теперь она способна решать задачи, требующие сотен действий.

Такая формулировка важна, потому что она затрагивает одну из самых больших нерешенных проблем в программировании ИИ. Многие модели хорошо справляются с изолированной генерацией кода. Гораздо меньше моделей остаются надежными на протяжении более длительного рабочего процесса, который включает в себя чтение репозитория, принятие решения о том, что нужно изменить, редактирование нескольких файлов, выполнение команд, интерпретацию ошибок и продолжение движения к цели.

Документация Cursor подтверждает, что именно этот вариант использования является для него приоритетным. В ней Composer 2 описывается как агентная модель с контекстным окном в 200 000 токенов, оптимизированная для использования инструментов, редактирования файлов и операций в терминале внутри Cursor.

В нем также отмечаются методы обучения, такие как самообобщение для длительных задач. Для разработчиков, уже использующих Cursor в качестве основной среды, такая более точная настройка может иметь большее значение, чем простое попадание в таблицу лидеров.

Прирост показателей эталонного индекса значителен, даже несмотря на то, что GPT-5.4 по-прежнему лидирует на одном ключевом графике.

Тесты производительности Cursor Composer 2.

Сравнение Cursor Composer 2 с другими ведущими моделями в сторонних тестах. Источник: Cursor

Опубликованные компанией Cursor результаты показывают явное улучшение по сравнению с предыдущими моделями Composer. Компания указывает, что Composer 2 получил 61,3 балла в CursorBench, 61,7 балла в Terminal-Bench 2.0 и 73,7 балла в SWE-bench Multilingual.

Для сравнения, показатели Composer 1.5 составляют 44,2, 47,9 и 65,9, а Composer 1 — 38,0, 40,0 и 56,9.

Выпуск этой модели более сдержанный, чем у некоторых других, поскольку Cursor не претендует на всеобщее лидерство.

В тесте Terminal-Bench 2.0, который измеряет, насколько хорошо агент ИИ справляется с задачами в интерфейсах командной строки терминала, GPT-5.4 по-прежнему лидирует с результатом 75,1, в то время как Composer 2 набирает 61,7, опережая Opus 4.6 с 58,0, Opus 4.5 с 52,1 и Composer 1.5 с 47,9.

Результаты теста Cursor Composer 2 в Terminal-Bench 2.0 сравниваются с результатами других ведущих моделей.

Оценка Cursor Composer 2 в тесте Terminal-Bench 2.0 по сравнению с другими ведущими моделями. Источник: Cursor

Это делает предложение Cursor более прагматичным и, возможно, более полезным для покупателей. Компания не утверждает, что Composer 2 — это единственная лучшая модель во всем. Она говорит о том, что модель перешла в более конкурентоспособный ценовой сегмент, предлагая при этом более привлекательную экономику и более тесную интеграцию с продуктами, которые разработчики уже используют.

Компания Cursor также включила в свой набор инструментов для тестирования производительности CursorBench диаграмму, показывающую соотношение производительности и стоимости, которая, по всей видимости, призвана обосновать преимущества Composer 2 с точки зрения теории Парето.

Сравнительная таблица производительности и стоимости модели Cursor Composer 2

Сравнительная таблица производительности и стоимости модели Cursor Composer 2. Источник: Cursor.

На этом графике Composer 2 демонстрирует более выгодное соотношение затрат и производительности, чем Composer 1.5, и выгодно отличается от более дорогих настроек GPT-5.4 и Opus 4.6, показанных Cursor. Компания утверждает, что Composer 2 не просто превосходит своего предшественника по показателям производительности, а может предложить более эффективное соотношение затрат и интеллектуальных возможностей для повседневной работы с кодом в Cursor.

Почему для покупателей важен момент «привязка к курсору»

Для читателей, решающих, использовать ли Composer 2, наиболее важным вопросом может быть не только производительность в бенчмарках. Возможно, им нужна модель, оптимизированная для работы с собственным продуктом Cursor.

Это может быть преимуществом. Согласно документации, Composer 2 может получить доступ к набору инструментов агента Cursor, включая семантический поиск кода, поиск файлов и папок, чтение файлов, редактирование файлов, команды оболочки, управление браузером и доступ к веб-интерфейсу.

Подобная интеграция может быть более ценной, чем простое качество модели, если цель состоит в выполнении реальных задач разработки программного обеспечения, а не в получении впечатляющих разовых результатов.

Но это также сужает целевую аудиторию. Командам, ищущим модель, которую можно широко использовать на различных внешних инструментах и платформах, следует понимать, что Cursor представляет Composer 2 как модель для пользователей Cursor, а не как общедоступную автономную базовую модель.

В более широком смысле: Cursor обосновывает необходимость улучшения функционирования системы.

Значение Composer 2 заключается не в том, что Cursor внезапно занял первое место во всех тестах производительности программирования. Это не так. Более важный момент заключается в том, что Cursor демонстрирует практическую ценность: его модель улучшается, его цена достаточно низка, чтобы стимулировать более широкое использование, а его более быстрый уровень достаточно отзывчив, чтобы компания могла спокойно сделать его вариантом по умолчанию, несмотря на более высокую стоимость.

Такое сочетание может найти отклик у инженерных команд, которые все меньше заботятся о престиже абстрактной модели и все больше — о том, сможет ли ассистент оставаться полезным на протяжении длительных сеансов кодирования, не становясь при этом чрезмерно дорогим.

Более широкая ценовая структура Cursor помогает оценить конкурентное давление, связанное с этим запуском. На текущей странице с ценами Cursor предлагает бесплатный тариф Hobby, план Pro за 20 долларов в месяц , Pro+ за 60 долларов в месяц и Ultra за 200 долларов в месяц для индивидуальных пользователей, при этом более высокие тарифы предлагают больше возможностей использования в рамках моделей OpenAI, Anthropic и Google.

В сегменте бизнеса Teams стоит 40 долларов за пользователя в месяц , а Enterprise имеет индивидуальную ценовую политику и включает в себя объединение использования, централизованное выставление счетов, аналитику использования, контроль конфиденциальности, единый вход (SSO), журналы аудита и детальный административный контроль. Другими словами, Cursor взимает плату не просто за доступ к модели кодирования. Он взимает плату за управляемый уровень приложений, который работает поверх нескольких поставщиков моделей, добавляя при этом функции для командной работы, управления и инструментов для организации рабочих процессов.

Эта модель все больше подвергается давлению, поскольку компании, разрабатывающие собственные решения в области ИИ, все глубже проникают в процесс кодирования. OpenAI и Anthropic больше не просто продают модели через сторонние продукты; они также выпускают собственные интерфейсы кодирования, агентов и фреймворки оценки — такие как Codex и Claude Code — что поднимает вопрос о том, сколько места остается для посреднической платформы.

Хотя комментарии на X не проверены и не обязательно отражают ситуацию на более широком рынке, все чаще отмечают переход от Cursor к Claude Code от Anthropic, особенно среди опытных пользователей, которых привлекают рабочие процессы, ориентированные на терминал, более длительное поведение агентов и меньшие воспринимаемые накладные расходы.

В некоторых из этих сообщений выражается недовольство ценообразованием Cursor, потерей контекста или ориентацией на редактор, в то же время восхваляется Claude Code как более прямой и полностью автономный способ работы. Даже при осторожном подходе подобные обсуждения указывают на стратегическую проблему, с которой сталкивается Cursor: компания должна доказать, что ее интегрированная платформа, командный контроль и теперь уже собственные внутренние модели приносят достаточно пользы, чтобы оправдать роль посредника между разработчиками и все более совершенными продуктами для программирования, созданными разработчиками моделей.

Это делает Composer 2 стратегически важным для Cursor.

Предлагая гораздо более дешевую собственную модель, чем Composer 1.5, оптимизируя ее под собственный набор инструментов Cursor и делая более быструю версию версией по умолчанию, компания пытается показать, что она предоставляет нечто большее, чем просто оболочку для сторонних систем.

Проблема заключается в том, что по мере совершенствования собственных программных продуктов разработчики и корпоративные покупатели все чаще могут задаваться вопросом, нужна ли им вообще отдельная платформа для ИИ-программирования, или же собственные инструменты разработчиков моделей становятся достаточными сами по себе.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Claude Opus 4.6, Composer 2, Cursor, GPT-5.4, Вышла, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Код JavaScript под увеличительным стеклом, концентрирует внимание на функциях и API.
Диаграмма путей развития диабета 2 типа: образ жизни, генетика, инсулинорезистентность.
Сатурн с кольцами в космосе, планета солнечной системы.
Две механические клавиатуры с художественным фоном и подсветкой.
Военные готовят беспилотник к запуску в полевых условиях.
Абстрактные геометрические формы на синем фоне, разноцветные круги и линии.
Иллюстрации анатомии сердца и почки в винтажном стиле.
Таблица процессоров Intel для настольных ПК 2026 года с характеристиками.
Презентация MWC26: оратор на сцене обсуждает будущее интернета.
Image Not Found
Код JavaScript под увеличительным стеклом, концентрирует внимание на функциях и API.

Помогаем агентам искусственного интеллекта получать наилучшие результаты при работе с большими языковыми моделями.

EnCompass запускает программы ИИ-агентов, используя метод обратного отслеживания и совершая множество попыток, чтобы найти наилучший набор результатов, сгенерированных LLM. Это может помочь программистам более эффективно работать с ИИ-агентами. При запуске программы EnCompass автоматически выполняет возврат к исходному…

Мар 24, 2026
Диаграмма путей развития диабета 2 типа: образ жизни, генетика, инсулинорезистентность.

Прогнозирование инсулинорезистентности с помощью носимых устройств и стандартных биомаркеров крови.

воспроизведение видео без звука зацикливание пауза видео без звука зацикливание включение звука видео выключение звука Используя данные с носимых устройств и результаты рутинных анализов крови, мы предлагаем новый метод эффективного прогнозирования инсулинорезистентности, обеспечивающий масштабируемый и доступный подход…

Мар 24, 2026
Сатурн с кольцами в космосе, планета солнечной системы.

Астрономы нашли одиннадцать новых спутников Сатурна. И четыре новых спутника Юпитера

И четыре новых спутника Юпитера Центр малых планет Международного астрономического союза опубликовал официальные сообщения об открытии одиннадцати новых спутников Сатурна и четырех (раз, два, три, четыре) — Юпитера. Таким образом, Сатурн продолжает оставаться рекордсменом по числу спутников в…

Мар 24, 2026
Две механические клавиатуры с художественным фоном и подсветкой.

Игровые клавиатуры ARITA и YOTEI — обзор, цены и советы

Новые игровые клавиатуры с японской эстетикой/ Источник: Red Square Компания Red Square приготовила настоящий подарок для геймеров: она сообщила о выходе двух новых игровых клавиатур ARITA и YOTEI. Причем эти модели будут идти как по отдельности, так…

Мар 24, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых