Image

Вышла новая модель кодирования Composer 2 от Cursor: она превосходит Claude Opus 4.6, но всё ещё уступает GPT-5.4.

Карл Франзен

Мужчина печатает музыкальные ноты в темном офисе, а на стенах проецируется компьютерный код.

Источник: VentureBeat, создано с помощью OpenAI GPT-Image-1.5

Cursor, платформа для разработки программного обеспечения для искусственного интеллекта от стартапа Anysphere из Сан-Франциско, оцениваемая в 29,3 миллиарда долларов, выпустила Composer 2, новую, усовершенствованную версию китайской модели с открытым исходным кодом Kimi K2.5, которая теперь доступна в среде разработки программного обеспечения для агентного ИИ от Cursor. Она предлагает значительно улучшенные результаты по сравнению с предыдущей собственной моделью.

Кроме того, компания запускает и делает Composer 2 Fast , более дорогую, но более быструю версию, стандартной для пользователей.

Вот подробная разбивка затрат:

  • Composer 2 Standard: 0,50/2,50 доллара США за 1 миллион токенов ввода/вывода

  • Composer 2 Fast: по цене 1,50/7,50 долларов за 1 миллион токенов ввода/вывода

Это значительное снижение по сравнению с предыдущей внутренней моделью Cursor, Composer 1.5, выпущенной в феврале, которая стоила 3,50 доллара за миллион входных токенов и 17,50 доллара за миллион выходных токенов; Composer 2 примерно на 86% дешевле по обоим показателям.

Composer 2 Fast также примерно на 57% дешевле, чем Composer 1.5.

Также предусмотрены скидки на «кэшированное чтение», то есть на повторную отправку модели части тех же токенов в запросе: 0,20 доллара за миллион токенов для Composer 2 и 0,35 доллара за миллион для Composer 2 Fast, по сравнению с 0,35 доллара за миллион для Composer 1.5.

Важно также отметить, что это, по всей видимости, релиз, изначально разработанный для Cursor, а не широко распространенная автономная модель. В анонсе компании и документации по модели Composer 2 описывается как доступный в Cursor, оптимизированный для рабочего процесса агента Cursor и интегрированный с набором инструментов продукта.

Представленные материалы не означают, что они доступны для использования на внешних платформах моделей или в качестве универсального API вне среды Cursor.

Cursor продвигает программирование с долгосрочной перспективой, а не просто улучшенные функции автодополнения.

В основе технического нововведения в этом релизе лежит не просто утверждение, что Composer 2 превосходит Composer 1.5. Дело в том, что, по словам Cursor, эта модель лучше подходит для агентного программирования с долгосрочным горизонтом планирования.

В своем блоге компания Cursor заявляет, что улучшение качества стало возможным благодаря первому этапу предварительного обучения, который обеспечил более прочную основу для масштабируемого обучения с подкреплением. Затем, по словам компании, модель Composer 2 была обучена на задачах программирования с длительным горизонтом планирования, и теперь она способна решать задачи, требующие сотен действий.

Такая формулировка важна, потому что она затрагивает одну из самых больших нерешенных проблем в программировании ИИ. Многие модели хорошо справляются с изолированной генерацией кода. Гораздо меньше моделей остаются надежными на протяжении более длительного рабочего процесса, который включает в себя чтение репозитория, принятие решения о том, что нужно изменить, редактирование нескольких файлов, выполнение команд, интерпретацию ошибок и продолжение движения к цели.

Документация Cursor подтверждает, что именно этот вариант использования является для него приоритетным. В ней Composer 2 описывается как агентная модель с контекстным окном в 200 000 токенов, оптимизированная для использования инструментов, редактирования файлов и операций в терминале внутри Cursor.

В нем также отмечаются методы обучения, такие как самообобщение для длительных задач. Для разработчиков, уже использующих Cursor в качестве основной среды, такая более точная настройка может иметь большее значение, чем простое попадание в таблицу лидеров.

Прирост показателей эталонного индекса значителен, даже несмотря на то, что GPT-5.4 по-прежнему лидирует на одном ключевом графике.

Тесты производительности Cursor Composer 2.

Сравнение Cursor Composer 2 с другими ведущими моделями в сторонних тестах. Источник: Cursor

Опубликованные компанией Cursor результаты показывают явное улучшение по сравнению с предыдущими моделями Composer. Компания указывает, что Composer 2 получил 61,3 балла в CursorBench, 61,7 балла в Terminal-Bench 2.0 и 73,7 балла в SWE-bench Multilingual.

Для сравнения, показатели Composer 1.5 составляют 44,2, 47,9 и 65,9, а Composer 1 — 38,0, 40,0 и 56,9.

Выпуск этой модели более сдержанный, чем у некоторых других, поскольку Cursor не претендует на всеобщее лидерство.

В тесте Terminal-Bench 2.0, который измеряет, насколько хорошо агент ИИ справляется с задачами в интерфейсах командной строки терминала, GPT-5.4 по-прежнему лидирует с результатом 75,1, в то время как Composer 2 набирает 61,7, опережая Opus 4.6 с 58,0, Opus 4.5 с 52,1 и Composer 1.5 с 47,9.

Результаты теста Cursor Composer 2 в Terminal-Bench 2.0 сравниваются с результатами других ведущих моделей.

Оценка Cursor Composer 2 в тесте Terminal-Bench 2.0 по сравнению с другими ведущими моделями. Источник: Cursor

Это делает предложение Cursor более прагматичным и, возможно, более полезным для покупателей. Компания не утверждает, что Composer 2 — это единственная лучшая модель во всем. Она говорит о том, что модель перешла в более конкурентоспособный ценовой сегмент, предлагая при этом более привлекательную экономику и более тесную интеграцию с продуктами, которые разработчики уже используют.

Компания Cursor также включила в свой набор инструментов для тестирования производительности CursorBench диаграмму, показывающую соотношение производительности и стоимости, которая, по всей видимости, призвана обосновать преимущества Composer 2 с точки зрения теории Парето.

Сравнительная таблица производительности и стоимости модели Cursor Composer 2

Сравнительная таблица производительности и стоимости модели Cursor Composer 2. Источник: Cursor.

На этом графике Composer 2 демонстрирует более выгодное соотношение затрат и производительности, чем Composer 1.5, и выгодно отличается от более дорогих настроек GPT-5.4 и Opus 4.6, показанных Cursor. Компания утверждает, что Composer 2 не просто превосходит своего предшественника по показателям производительности, а может предложить более эффективное соотношение затрат и интеллектуальных возможностей для повседневной работы с кодом в Cursor.

Почему для покупателей важен момент «привязка к курсору»

Для читателей, решающих, использовать ли Composer 2, наиболее важным вопросом может быть не только производительность в бенчмарках. Возможно, им нужна модель, оптимизированная для работы с собственным продуктом Cursor.

Это может быть преимуществом. Согласно документации, Composer 2 может получить доступ к набору инструментов агента Cursor, включая семантический поиск кода, поиск файлов и папок, чтение файлов, редактирование файлов, команды оболочки, управление браузером и доступ к веб-интерфейсу.

Подобная интеграция может быть более ценной, чем простое качество модели, если цель состоит в выполнении реальных задач разработки программного обеспечения, а не в получении впечатляющих разовых результатов.

Но это также сужает целевую аудиторию. Командам, ищущим модель, которую можно широко использовать на различных внешних инструментах и платформах, следует понимать, что Cursor представляет Composer 2 как модель для пользователей Cursor, а не как общедоступную автономную базовую модель.

В более широком смысле: Cursor обосновывает необходимость улучшения функционирования системы.

Значение Composer 2 заключается не в том, что Cursor внезапно занял первое место во всех тестах производительности программирования. Это не так. Более важный момент заключается в том, что Cursor демонстрирует практическую ценность: его модель улучшается, его цена достаточно низка, чтобы стимулировать более широкое использование, а его более быстрый уровень достаточно отзывчив, чтобы компания могла спокойно сделать его вариантом по умолчанию, несмотря на более высокую стоимость.

Такое сочетание может найти отклик у инженерных команд, которые все меньше заботятся о престиже абстрактной модели и все больше — о том, сможет ли ассистент оставаться полезным на протяжении длительных сеансов кодирования, не становясь при этом чрезмерно дорогим.

Более широкая ценовая структура Cursor помогает оценить конкурентное давление, связанное с этим запуском. На текущей странице с ценами Cursor предлагает бесплатный тариф Hobby, план Pro за 20 долларов в месяц , Pro+ за 60 долларов в месяц и Ultra за 200 долларов в месяц для индивидуальных пользователей, при этом более высокие тарифы предлагают больше возможностей использования в рамках моделей OpenAI, Anthropic и Google.

В сегменте бизнеса Teams стоит 40 долларов за пользователя в месяц , а Enterprise имеет индивидуальную ценовую политику и включает в себя объединение использования, централизованное выставление счетов, аналитику использования, контроль конфиденциальности, единый вход (SSO), журналы аудита и детальный административный контроль. Другими словами, Cursor взимает плату не просто за доступ к модели кодирования. Он взимает плату за управляемый уровень приложений, который работает поверх нескольких поставщиков моделей, добавляя при этом функции для командной работы, управления и инструментов для организации рабочих процессов.

Эта модель все больше подвергается давлению, поскольку компании, разрабатывающие собственные решения в области ИИ, все глубже проникают в процесс кодирования. OpenAI и Anthropic больше не просто продают модели через сторонние продукты; они также выпускают собственные интерфейсы кодирования, агентов и фреймворки оценки — такие как Codex и Claude Code — что поднимает вопрос о том, сколько места остается для посреднической платформы.

Хотя комментарии на X не проверены и не обязательно отражают ситуацию на более широком рынке, все чаще отмечают переход от Cursor к Claude Code от Anthropic, особенно среди опытных пользователей, которых привлекают рабочие процессы, ориентированные на терминал, более длительное поведение агентов и меньшие воспринимаемые накладные расходы.

В некоторых из этих сообщений выражается недовольство ценообразованием Cursor, потерей контекста или ориентацией на редактор, в то же время восхваляется Claude Code как более прямой и полностью автономный способ работы. Даже при осторожном подходе подобные обсуждения указывают на стратегическую проблему, с которой сталкивается Cursor: компания должна доказать, что ее интегрированная платформа, командный контроль и теперь уже собственные внутренние модели приносят достаточно пользы, чтобы оправдать роль посредника между разработчиками и все более совершенными продуктами для программирования, созданными разработчиками моделей.

Это делает Composer 2 стратегически важным для Cursor.

Предлагая гораздо более дешевую собственную модель, чем Composer 1.5, оптимизируя ее под собственный набор инструментов Cursor и делая более быструю версию версией по умолчанию, компания пытается показать, что она предоставляет нечто большее, чем просто оболочку для сторонних систем.

Проблема заключается в том, что по мере совершенствования собственных программных продуктов разработчики и корпоративные покупатели все чаще могут задаваться вопросом, нужна ли им вообще отдельная платформа для ИИ-программирования, или же собственные инструменты разработчиков моделей становятся достаточными сами по себе.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Claude Opus 4.6, Composer 2, Cursor, GPT-5.4, Вышла, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Сатурн с кольцами в космосе, планета солнечной системы.
Две механические клавиатуры с художественным фоном и подсветкой.
Военные готовят беспилотник к запуску в полевых условиях.
Абстрактные геометрические формы на синем фоне, разноцветные круги и линии.
Иллюстрации анатомии сердца и почки в винтажном стиле.
Таблица процессоров Intel для настольных ПК 2026 года с характеристиками.
Презентация MWC26: оратор на сцене обсуждает будущее интернета.
ClawRouter: автономный LLM-маршрутизатор для агентов, без учётных записей и API ключей.
Пошаговая инструкция: как поменять розетку для начинающих.
Image Not Found
Сатурн с кольцами в космосе, планета солнечной системы.

Астрономы нашли одиннадцать новых спутников Сатурна. И четыре новых спутника Юпитера

И четыре новых спутника Юпитера Центр малых планет Международного астрономического союза опубликовал официальные сообщения об открытии одиннадцати новых спутников Сатурна и четырех (раз, два, три, четыре) — Юпитера. Таким образом, Сатурн продолжает оставаться рекордсменом по числу спутников в…

Мар 24, 2026
Две механические клавиатуры с художественным фоном и подсветкой.

Игровые клавиатуры ARITA и YOTEI — обзор, цены и советы

Новые игровые клавиатуры с японской эстетикой/ Источник: Red Square Компания Red Square приготовила настоящий подарок для геймеров: она сообщила о выходе двух новых игровых клавиатур ARITA и YOTEI. Причем эти модели будут идти как по отдельности, так…

Мар 24, 2026
Военные готовят беспилотник к запуску в полевых условиях.

ИИ превращает беспилотники в боевых роботов

@ Алексей Коновалов/ТАСС На наших глазах происходит очередной этап технологической революции в военной сфере: беспилотники становятся полностью автономными боевыми системами. Они больше не требуют управления оператором, эту функцию берет на себя искусственный интеллект (ИИ). Первые образцы таких…

Мар 24, 2026
Таблица процессоров Intel для настольных ПК 2026 года с характеристиками.

Чуда не произошло: вышли обзоры Intel Core Ultra 5 250K Plus и Core Ultra 7 270K Plus

Вот и появились первые полноценные обзоры центральных процессоров Intel Core Ultra 200S Plus, а точнее моделей Core Ultra 5 250K Plus и Core Ultra 7 270K Plus. По сравнению с уже вышедшими ранее Core Ultra 5 245K…

Мар 23, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых