Архив рубрики ~Лента новостей~

Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки

Я проверил хайп вокруг Claude Code на реальной задаче. Cursor справился с третьей попытки

Последние полгода я практически весь код пишу с помощью Cursor.

Сначала я работал с нейросетями самым очевидным способом: открывал обычный чат, описывал задачу, получал кусок кода, копировал его в проект, запускал, ловил ошибки и снова тащил их в чат.

Это работало, но довольно быстро превращалось в бесконечное перекладывание текста между окнами.

Поэтому я пересел на Cursor.

Там нейросеть сразу видит структуру проекта, файлы, терминал и внесённые изменения. Она может пройтись по нескольким частям системы, изменить код, запустить команды и исправить найденные ошибки.

В больших проектах Cursor у меня уже давно не выглядит как «автодополнение кода». Я могу создать папку, описать продукт или отдельную функцию, ответить на несколько вопросов — и дальше агент начинает собирать решение практически целиком.

Именно поэтому меня всегда немного раздражало популярное сравнение:

Cursor просто помогает программисту писать код, а Claude Code — это уже настоящий автономный агент, который выполняет задачу под ключ.

Как будто Cursor сидит рядом и предлагает названия переменных, а Claude Code самостоятельно строит целые системы.

Я решил проверить, насколько эта разница существует в реальной работе.

Понятно, что по сути Cursor агрегирует в себе разные LLM, и по сути мы всё же говорим про сравнение разных моделей.
Но тем не менее речь тут пойдёт про те LLM, которые являются базовыми внутри обоих инсутрментов, и про сам функционал ПО и, что самое интересное, про стоимость этих базовых LLM.

Что я дал обоим инструментам

Задача была вполне прикладная: собрать браузерное расширение для записи экрана.

Не очередной список задач или калькулятор, а небольшой законченный продукт:

  • запуск записи экрана;
  • выбор источника;
  • работа с системным звуком;
  • остановка записи;
  • сохранение результата;
  • нормальное поведение расширения в браузере.

Расширение я собирал с расчётом на дальнейший запуск на зарубежном рынке, поэтому мне нужна была не красивая демонстрация кода, а рабочая основа продукта.

Оба инструмента получили примерно одинаковую постановку.

При этом важно честно оговориться: я не готовил полноценный производственный pipeline.

Не было:

  • детально расписанных требований;
  • контрактов между компонентами;
  • заранее подготовленной архитектуры;
  • подробной декомпозиции;
  • отдельных документов с критериями готовности.

Cursor тоже умеет работать внутри более формализованного процесса, но в этом эксперименте я его не использовал.

Мне было интересно другое: что произойдёт, если дать инструменту обычную реальную задачу так, как большинство людей и начинает работать с AI-разработкой.

Что произошло с Claude Code

Claude Code (Sonnet 4.6) начал собирать расширение, но довольно быстро работа превратилась в цепочку исправлений.

Возникала ошибка.

Claude её исправлял.

После исправления ломалось что-то ещё.

Мы снова проходили по проекту, меняли код, запускали расширение и получали следующую проблему.

В общей сложности я прошёл примерно восемь итераций.

Причём это не были восемь последовательных улучшений, после которых продукт становился всё ближе к готовности. Часть изменений действительно что-то исправляла, но одновременно появлялись новые ошибки.

Возникло неприятное ощущение движения по кругу: инструмент активно работает, переписывает файлы и подробно объясняет свои действия, но до стабильного результата проект не доезжает.

В какой-то момент я просто остановил эксперимент.

Что произошло с Cursor

После Claude Code я дал ту же задачу Cursor.

Cursor (Composer 2.5) тоже не сделал всё идеально с первой попытки.

Первая версия потребовала исправлений. Во второй оставались проблемы. Но уже на третьей итерации я получил рабочее расширение, которое можно было запускать и проверять как продукт.

То есть разница в моём эксперименте была не в том, что один инструмент написал код идеально, а другой вообще ничего не смог.

Разница была в количестве лишней возни до рабочего результата.

Claude Code за восемь итераций продолжал создавать новые проблемы.

Cursor довёл задачу до рабочего состояния с третьей попытки.

А что по стоимости

За эксперимент с Claude Code я потратил около 1 500 рублей.

Сам по себе показатель мало о чём говорит, пока не сравнишь его с реальным использованием другого инструмента.

Расширенный тариф Cursor обходится мне примерно в 4 000 рублей в месяц.

При этом за предыдущий расчётный период я прогнал через него больше 500 миллионов токенов и использовал примерно 60% доступного лимита.

Это не прямое сравнение двух идентичных тарифов: с одной стороны — цена отдельного эксперимента, с другой — месяц активной ежедневной работы.

Но именно поэтому результат меня и удивил.

Claude Code за одну небольшую задачу съел заметную часть стоимости месячной подписки Cursor и при этом не дал мне рабочий результат.

Почему тогда все говорят, что Claude Code автономнее

Мне кажется, здесь смешиваются сразу несколько вещей.

Во-первых, у Claude Code действительно другой интерфейс работы. Он выглядит как самостоятельный исполнитель, который сидит в терминале, строит план, запускает команды и последовательно идёт по задаче.

Это создаёт очень сильное ощущение автономности.

Но автономный внешний вид ещё не гарантирует, что инструмент лучше доводит задачу до результата.

Во-вторых, многие сравнивают Claude Code не с текущим Cursor, а с его старым образом.

Cursor до сих пор часто описывают как редактор с хорошим автодополнением. На практике его агент давно умеет:

  • читать весь проект;
  • менять множество файлов;
  • работать через терминал;
  • запускать приложение;
  • искать ошибки;
  • исправлять их;
  • разбирать архитектуру существующей системы;
  • выполнять довольно крупные задачи целиком.

Поэтому сравнение «Cursor помогает писать, а Claude Code сам делает» мне кажется сильно устаревшим.

Оба инструмента пытаются делать работу самостоятельно.

Вопрос не в наличии слова «агент», а в том, какой из них быстрее приводит проект в рабочее состояние.

Это не научный бенчмарк

Один эксперимент не доказывает, что Cursor всегда лучше Claude Code.

Результат мог зависеть от:

  • конкретной задачи;
  • формулировки запроса;
  • особенностей проекта;
  • выбранной модели;
  • настроек;
  • структуры файлов;
  • моего способа взаимодействия с инструментом.

Кроме того, я вполне допускаю, что Claude Code показывает себя намного лучше внутри хорошо подготовленного процесса: с правилами проекта, документацией, тестами, контрактами и чёткой декомпозицией.

Но здесь возникает важный вопрос.

Если для получения преимущества мне сначала нужно отдельно выстроить вокруг инструмента идеальный процесс, то его автономность уже выглядит не такой магической.

В моём эксперименте оба инструмента получили обычную прикладную задачу без специальной подготовки.

И Cursor справился с ней лучше.

Мой вывод

Пока я не понял хайпа вокруг Claude Code.

В моей задаче он оказался:

  • дороже;
  • менее стабильным;
  • более требовательным к постоянным проверкам;
  • склонным исправлять одну ошибку и создавать следующую.

Cursor оказался быстрее, предсказуемее и потребовал значительно меньше действий с моей стороны.

Возможно, на другой задаче результат будет противоположным. Я продолжу тестировать Claude Code, потому что один неудачный эксперимент — слишком мало для окончательного вывода.

Но после этого сравнения тезис о том, что Cursor — всего лишь помощник программиста, а Claude Code — настоящий автономный разработчик, выглядит для меня скорее маркетинговой конструкцией.

В реальной работе мне не особенно важно, насколько автономно инструмент выглядит.

Мне важно, сколько времени, денег и нервов проходит между постановкой задачи и рабочим результатом.

В этом эксперименте Cursor победил без особых вопросов.

Более короткие эксперименты, разборы AI-инструментов и реальные кейсы разработки я публикую в Telegram-канале «Last токен»: @dchivkunov

Источник: vc.ru

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ ⚡️ Ваш личный интернет в кармане — нашли имбу, которая… Архив рубрики ~Коротко из Telegram~ В Claude может появиться проверка возраста и личности — Anthropic… Архив рубрики ~Коротко из Telegram~ Госдума приняла пакет поправок «Антифрод 2.0», который ужесточает правила оборота… Архив рубрики ~Коротко из Telegram~ Запускаем свой ИИ-стартап — Anthropic выпустили бесплатное руководство по созданию… Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании. Архив рубрики ~Коротко из Telegram~ OpenAI опубликовали исследование: для чего люди реально используют ChatGPT. Осень… Архив рубрики ~Коротко из Telegram~ На Artificial Analysis внезапно появилась ноунейм модель HappyHorse 1.0. Архив рубрики ~Коротко из Telegram~ Рейтинг нейросетей в русскоязычных соцсетях Brand Analytics проанализировал не трафик… Архив рубрики ~Коротко из Telegram~ В России создали ИИ-модель для прогноза смертности при остром коронарном… Архив рубрики ~Коротко из Telegram~ Разгружаем комп на МАКСИМАЛКУ — open-source проект Pake позволяет превратить… Архив рубрики ~Коротко из Telegram~ 🍦Нашли подборку из 50 сайтов на все случаи жизни —… Архив рубрики ~Обо всем~ 11 самых ярких стартапов по версии венчурных инвесторов, по итогам Demo Day от YC. Архив рубрики ~Обо всем~ «Базальт СПО» выпустила обновлённую версию ОС «Альт Рабочая станция К» 11.4 Архив рубрики ~Коротко из Telegram~ Самоуправляемые автомобили: плюсы и минусы ИИ на дороге Самоуправляемые автомобили… Архив рубрики ~Коротко из Telegram~ ⚡️ Ваш личный интернет в кармане — нашли имбу, которая… Архив рубрики ~Коротко из Telegram~ В Claude может появиться проверка возраста и личности — Anthropic… Архив рубрики ~Коротко из Telegram~ Госдума приняла пакет поправок «Антифрод 2.0», который ужесточает правила оборота… Архив рубрики ~Коротко из Telegram~ Запускаем свой ИИ-стартап — Anthropic выпустили бесплатное руководство по созданию… Архив рубрики ~Обо всем~ Порог оттока клиентов — это решение о ценообразовании. Архив рубрики ~Коротко из Telegram~ OpenAI опубликовали исследование: для чего люди реально используют ChatGPT. Осень… Архив рубрики ~Коротко из Telegram~ На Artificial Analysis внезапно появилась ноунейм модель HappyHorse 1.0. Архив рубрики ~Коротко из Telegram~ Рейтинг нейросетей в русскоязычных соцсетях Brand Analytics проанализировал не трафик… Архив рубрики ~Коротко из Telegram~ В России создали ИИ-модель для прогноза смертности при остром коронарном… Архив рубрики ~Коротко из Telegram~ Разгружаем комп на МАКСИМАЛКУ — open-source проект Pake позволяет превратить… Архив рубрики ~Коротко из Telegram~ 🍦Нашли подборку из 50 сайтов на все случаи жизни —… Архив рубрики ~Обо всем~ 11 самых ярких стартапов по версии венчурных инвесторов, по итогам Demo Day от YC. Архив рубрики ~Обо всем~ «Базальт СПО» выпустила обновлённую версию ОС «Альт Рабочая станция К» 11.4 Архив рубрики ~Коротко из Telegram~ Самоуправляемые автомобили: плюсы и минусы ИИ на дороге Самоуправляемые автомобили…

Оставить комментарий