Архив рубрики ~Лента новостей~

OpenCode vs Droid: тест на реальных проектах

OpenCode vs Droid: тест на реальных проектах
2d33312760a22749a1772c2e340381c5

Кратко (TL;DR): OpenCode классно задуман, но сейчас страдает от нестабильности и плохой работой с моделями/контекстом. Droid от Factory заметно стабильнее в типичных задачах и аккуратнее работает с контекстом. Но и у него есть «детские болезни» на отдельных конфигурациях CPU/Windows.

Что именно я сравнивал

  • OpenCode (sst/opencode) — терминальный агент с провайдер-агностичным подходом (Copilot, OpenRouter, Ollama и т. д.).

  • Factory Droid — терминальный агент Factory (CLI + веб), BYOK для моделей через OpenAI/Anthropic/Gemini/OpenRouter и др.

По сути оба решения очень близки, по функционалу.

Мои главные боли в OpenCode — и что нашлось в публичных источниках

  1. Работа с «неизвестными/нестандартными» моделями и провайдерами. Я регулярно ловил «модель не поддерживается»/«модель не найдена» и прочие конфликты синтаксиса/провайдера. На GitHub таких issue — целый пласт: ProviderModelNotFoundError с OpenRouter, «requested model is not supported», проблемы с id моделей у OpenRouter, рассинхрон выбора модели и фактического запуска и т. п.

  2. Подвисания, «молчит» и перестаёт стримить ответ. Просто замирал и переставал что-либо печатать. В issue это звучит буквально «just hangs randomly… приходится убивать процесс», иногда помогает /compact. Есть и «socket connection was closed unexpectedly».

  3. Сессии: восстановление и странности истории. У меня после рестарта бывали «задним числом» появившиеся ответы. Прямо такой же кейс я в issue я не нашёл, но похожие есть — паники при восстановлении сессии, повторные, одинаковые ответы для нескольких запросов одной сессии, вылеты после чистки сессий. Это косвенно подтверждает нестабильность управления сессиями.

  4. Контекстное окно и «автокомпакт». Моё ощущение: непредсказуемо и без понятного автокомпакта. В реальности у OpenCode есть /compact, но сообщество жалуется на «слишком агрессивное сжатие», теряется «личность» агента и актуальный рабочий контекст — уже просят «soft compaction» (мягкое сжатие), а ещё встречается «Session automatically compacted — Q is too eager». То есть фича есть, но она спорно работает.

Вывод по OpenCode: идея сильная, скорость развития высокая, но сейчас оно часто ломается на моделях/провайдерах и ведёт себя нестабильно в длинных сессиях. Мои ощущения подтверждаются большим количеством свежих issue за сентябрь–октябрь 2025.

Почему Droid у меня пошёл лучше

  1. Контекст и «архитектура агента». Droid увеляет много внимания слою управления контекстом (план/исполнение, «context stack», извлечение нужного куска, меньше «замусоревания» истории лишними tool-вызовами). Это заявлено в их материалах и отражено в гайдлайнах. В реальности у меня это проявилось как более предсказуемое поведение в длинной сессии и в «прыжках» между задачами.

  2. BYOK и модели из разных источников. Droid официально поддерживает BYOK к OpenAI/Anthropic/Gemini, OpenRouter, Fireworks, Baseten, Ollama и пр. — то есть можно подключать массу моделей «не из коробки» и пробовать их в одном и том же UX. У меня это реально работало бодрее, чем в OpenCode. Однако в отличии от OpenCode пришлось использовать CLIProxy, но это мелочи.

  3. Публичные бенчмарки. В Terminal-Bench Droid держится в топе (в т. ч. на разных моделях), что косвенно подтверждает зрелость «обвязки» агента — не только «модель хорошая», но и исполнительная логика. Проверяем не по пресс-релизам, а по лидерборду.

Terminal-Bench
Terminal-Bench

Честно о минусах Droid: баги тоже есть — особенно свежие: «Illegal instruction (core dumped)» на некоторых CPU без AVX2, деградации на Windows (дубли CLI при открытии новой вкладки, замедление со временем), иногда проблемы с отображением ввода. Это быстро чинят релизами, но упомянуть важно.

Что это значит на практике

Если важна предсказуемость, сегодня я бы ставил Droid как основной инструмент и держал OpenCode как «лабораторию» для экспериментов с новыми провайдерами/фичами.

Причина — зрелость контекст-менеджмента и стабильность пайплайна, плюс реальная поддержка BYOK на широкий спектр поставщиков.

Если остаёшься на OpenCode:

1. Подбирай модели из OpenCode Zen (вроде «проверенных») или самых «ровных» провайдеров. 
2. Следи за состоянием сессии; при подвисании пробуй /compact, но будь готов, что он может «потерять» рабочий контекст. 
3. Для OpenRouter проверь синтаксис моделей и ограничения — часть багов связана с нотацией/доступами.

Для Droid:

1. Используй Mixed Models: тяжёлую модель (Sonnet 4.5/Opus/ GPT-5) на фазе спецификации и более быструю на имплементации — это прямо встроенный паттерн.
2. Проверь железо (AVX2), особенно на старых CPU/VM. Если вылетает — смотри последние CLI-updates/чейнджлоги.

Итоги

Оба проекта развиваются очень быстро. У Factory виден регулярный ритм «CLI Updates»/релиз-ноутсы, фиксится стабильность, добавляются фичи (OAuth MCP, улучшения Windows/PowerShell, droid exec, и т. д.). У OpenCode централизованного changelog’а я не нашёл, но по частоте свежих issue/PR видно активное движение.

OpenCode — амбициозный и удобный по идее инструмент, но на практике сейчас «плюсы убиваются» нестабильностью: подвисанием, спорное сжатие (compact) контекста и «кривые» интеграции с моделями. Требуются заметные доработки.

Droid — стабильнее в повседневной работе, аккуратнее управляет контекстом, достаточно гибкий по BYOK и подтверждён бенчмарком Terminal-Bench, хотя и у него встречаются свежие баги на некоторых системах и моделях.

Подписывайтесь на канал для получения информации от ИТ архитектора с более чем 20 летним стажем.

Источник: habr.com

✅ Найденные теги: OpenCode, новости
Читайте также
Архив рубрики ~Обо всем~ В июньском обновлении Microsoft исправила 198 ошибок Windows, 3 из которых являются уязвимостями нулевого дня. Архив рубрики ~Обо всем~ NuCS против Choco: решатель ограничений на чистом Python встречается с ветераном JVM. Архив рубрики ~Обо всем~ Почему создание орбитальных центров обработки данных сложнее, чем считают в Кремниевой долине Архив рубрики ~Обо всем~ Подкаст Engadget: Мысли о WWDC 2026 из Apple Park Архив рубрики ~Обо всем~ Я протестировал множество настольных программ для работы с ИИ, но Hermes с Ollama — мой новый фаворит, и вот почему. Архив рубрики ~Обо всем~ Теперь пользователи Pinterest смогут совершать покупки напрямую в магазинах Amazon. Архив рубрики ~Обо всем~ Как рефакторить код с помощью Claude Code Архив рубрики ~Обо всем~ В следующем месяце Microsoft Office 2019 для Mac станет доступен только для чтения. Архив рубрики ~Коротко из Telegram~ Госдума приняла нормы, предусматривающие штрафы за нарушение новых требований к… Архив рубрики ~Обо всем~ Лучшие предложения на роботы-пылесосы в рамках Prime Day, которые я бы купил сейчас, после тестирования десятков вариантов. Архив рубрики ~Обо всем~ Мы профессионально отслеживаем выгодные предложения: вот лучшие предложения, которые нашли наши эксперты CNET на этой неделе. Архив рубрики ~Обо всем~ Как обучить модель оценки в эпоху искусственного интеллекта Архив рубрики ~Коротко из Telegram~ 🤖 Промышленным компаниям помогут внедрить ИИ На Архитектурном совете кластера… Архив рубрики ~Коротко из Telegram~ Шопоголикам выписали плацебо Любопытный тренд пришел из Южной Кореи. Там… Архив рубрики ~Обо всем~ В июньском обновлении Microsoft исправила 198 ошибок Windows, 3 из которых являются уязвимостями нулевого дня. Архив рубрики ~Обо всем~ NuCS против Choco: решатель ограничений на чистом Python встречается с ветераном JVM. Архив рубрики ~Обо всем~ Почему создание орбитальных центров обработки данных сложнее, чем считают в Кремниевой долине Архив рубрики ~Обо всем~ Подкаст Engadget: Мысли о WWDC 2026 из Apple Park Архив рубрики ~Обо всем~ Я протестировал множество настольных программ для работы с ИИ, но Hermes с Ollama — мой новый фаворит, и вот почему. Архив рубрики ~Обо всем~ Теперь пользователи Pinterest смогут совершать покупки напрямую в магазинах Amazon. Архив рубрики ~Обо всем~ Как рефакторить код с помощью Claude Code Архив рубрики ~Обо всем~ В следующем месяце Microsoft Office 2019 для Mac станет доступен только для чтения. Архив рубрики ~Коротко из Telegram~ Госдума приняла нормы, предусматривающие штрафы за нарушение новых требований к… Архив рубрики ~Обо всем~ Лучшие предложения на роботы-пылесосы в рамках Prime Day, которые я бы купил сейчас, после тестирования десятков вариантов. Архив рубрики ~Обо всем~ Мы профессионально отслеживаем выгодные предложения: вот лучшие предложения, которые нашли наши эксперты CNET на этой неделе. Архив рубрики ~Обо всем~ Как обучить модель оценки в эпоху искусственного интеллекта Архив рубрики ~Коротко из Telegram~ 🤖 Промышленным компаниям помогут внедрить ИИ На Архитектурном совете кластера… Архив рубрики ~Коротко из Telegram~ Шопоголикам выписали плацебо Любопытный тренд пришел из Южной Кореи. Там…

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.