OpenCode vs Droid: тест на реальных проектах

Кратко (TL;DR): OpenCode классно задуман, но сейчас страдает от нестабильности и плохой работой с моделями/контекстом. Droid от Factory заметно стабильнее в типичных задачах и аккуратнее работает с контекстом. Но и у него есть «детские болезни» на отдельных конфигурациях CPU/Windows.
Что именно я сравнивал
-
OpenCode (sst/opencode) — терминальный агент с провайдер-агностичным подходом (Copilot, OpenRouter, Ollama и т. д.).
-
Factory Droid — терминальный агент Factory (CLI + веб), BYOK для моделей через OpenAI/Anthropic/Gemini/OpenRouter и др.
По сути оба решения очень близки, по функционалу.
Мои главные боли в OpenCode — и что нашлось в публичных источниках
-
Работа с «неизвестными/нестандартными» моделями и провайдерами. Я регулярно ловил «модель не поддерживается»/«модель не найдена» и прочие конфликты синтаксиса/провайдера. На GitHub таких issue — целый пласт: ProviderModelNotFoundError с OpenRouter, «requested model is not supported», проблемы с id моделей у OpenRouter, рассинхрон выбора модели и фактического запуска и т. п.
-
Подвисания, «молчит» и перестаёт стримить ответ. Просто замирал и переставал что-либо печатать. В issue это звучит буквально «just hangs randomly… приходится убивать процесс», иногда помогает /compact. Есть и «socket connection was closed unexpectedly».
-
Сессии: восстановление и странности истории. У меня после рестарта бывали «задним числом» появившиеся ответы. Прямо такой же кейс я в issue я не нашёл, но похожие есть — паники при восстановлении сессии, повторные, одинаковые ответы для нескольких запросов одной сессии, вылеты после чистки сессий. Это косвенно подтверждает нестабильность управления сессиями.
-
Контекстное окно и «автокомпакт». Моё ощущение: непредсказуемо и без понятного автокомпакта. В реальности у OpenCode есть /compact, но сообщество жалуется на «слишком агрессивное сжатие», теряется «личность» агента и актуальный рабочий контекст — уже просят «soft compaction» (мягкое сжатие), а ещё встречается «Session automatically compacted — Q is too eager». То есть фича есть, но она спорно работает.
Вывод по OpenCode: идея сильная, скорость развития высокая, но сейчас оно часто ломается на моделях/провайдерах и ведёт себя нестабильно в длинных сессиях. Мои ощущения подтверждаются большим количеством свежих issue за сентябрь–октябрь 2025.
Почему Droid у меня пошёл лучше
-
Контекст и «архитектура агента». Droid увеляет много внимания слою управления контекстом (план/исполнение, «context stack», извлечение нужного куска, меньше «замусоревания» истории лишними tool-вызовами). Это заявлено в их материалах и отражено в гайдлайнах. В реальности у меня это проявилось как более предсказуемое поведение в длинной сессии и в «прыжках» между задачами.
-
BYOK и модели из разных источников. Droid официально поддерживает BYOK к OpenAI/Anthropic/Gemini, OpenRouter, Fireworks, Baseten, Ollama и пр. — то есть можно подключать массу моделей «не из коробки» и пробовать их в одном и том же UX. У меня это реально работало бодрее, чем в OpenCode. Однако в отличии от OpenCode пришлось использовать CLIProxy, но это мелочи.
-
Публичные бенчмарки. В Terminal-Bench Droid держится в топе (в т. ч. на разных моделях), что косвенно подтверждает зрелость «обвязки» агента — не только «модель хорошая», но и исполнительная логика. Проверяем не по пресс-релизам, а по лидерборду.

Честно о минусах Droid: баги тоже есть — особенно свежие: «Illegal instruction (core dumped)» на некоторых CPU без AVX2, деградации на Windows (дубли CLI при открытии новой вкладки, замедление со временем), иногда проблемы с отображением ввода. Это быстро чинят релизами, но упомянуть важно.
Что это значит на практике
Если важна предсказуемость, сегодня я бы ставил Droid как основной инструмент и держал OpenCode как «лабораторию» для экспериментов с новыми провайдерами/фичами.
Причина — зрелость контекст-менеджмента и стабильность пайплайна, плюс реальная поддержка BYOK на широкий спектр поставщиков.
Если остаёшься на OpenCode:
1. Подбирай модели из OpenCode Zen (вроде «проверенных») или самых «ровных» провайдеров.
2. Следи за состоянием сессии; при подвисании пробуй /compact, но будь готов, что он может «потерять» рабочий контекст.
3. Для OpenRouter проверь синтаксис моделей и ограничения — часть багов связана с нотацией/доступами.
Для Droid:
1. Используй Mixed Models: тяжёлую модель (Sonnet 4.5/Opus/ GPT-5) на фазе спецификации и более быструю на имплементации — это прямо встроенный паттерн.
2. Проверь железо (AVX2), особенно на старых CPU/VM. Если вылетает — смотри последние CLI-updates/чейнджлоги.
Итоги
Оба проекта развиваются очень быстро. У Factory виден регулярный ритм «CLI Updates»/релиз-ноутсы, фиксится стабильность, добавляются фичи (OAuth MCP, улучшения Windows/PowerShell, droid exec, и т. д.). У OpenCode централизованного changelog’а я не нашёл, но по частоте свежих issue/PR видно активное движение.
OpenCode — амбициозный и удобный по идее инструмент, но на практике сейчас «плюсы убиваются» нестабильностью: подвисанием, спорное сжатие (compact) контекста и «кривые» интеграции с моделями. Требуются заметные доработки.
Droid — стабильнее в повседневной работе, аккуратнее управляет контекстом, достаточно гибкий по BYOK и подтверждён бенчмарком Terminal-Bench, хотя и у него встречаются свежие баги на некоторых системах и моделях.
Подписывайтесь на канал для получения информации от ИТ архитектора с более чем 20 летним стажем.
Источник: habr.com
Похожие записи
- Интеграция Visa ChatGPT позволяет агентам по ИИ осуществлять розничные покупки.
- План внедрения ИИ-помощников в юридической сфере в Англии и Уэльсе «не может заменить финансирование и персонал», заявляют юристы.
- Почему искусственный интеллект, работающий в лаборатории, часто терпит неудачу в производстве — и что на самом деле помогает это исправить
Похожие записи
Компания Gilead отказалась от возможности развивать разработанный компанией Assembly на первой фазе клинических испытаний противовирусный препарат против вируса гепатита В.
22.03.2026
eGPU eGryphon включает в себя RTX 5060 Ti / RTX 5070, встроенный БП и OCuLink с Thunderbolt 5
01.04.2026
Спрос на инженеров в России достиг рекорда — но молодые уже не соглашаются на 70 тысяч
31.10.2025Подписка на рассылку
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
