Генерация фото и видео прямо в Claude Code, Codex и Cursor: один MCP-ключ — и агент рисует сам
Картина, к которой вы привыкли: пишете код в Claude Code, нужна картинка для лендинга — переключаетесь в браузер, идёте на сервис генерации, ловите VPN, платите зарубежной картой, копируете промпт, ждёте, качаете файл, тащите обратно в проект. Контекст потерян, флоу сломан, полчаса ушло.
А теперь так: вы пишете агенту «сгенерируй hero-картинку для этой страницы в нашем стиле» — и он генерирует. В том же диалоге. Сам подбирает модель, сам показывает результат, сам отдаёт ссылку на файл. Вы не выходили из терминала.
Это не будущее. Это работает сегодня, через протокол MCP. И — что важно для нас, кто сидит в России — в рублях, без VPN, с данными на серверах в РФ. Дальше — как подключить за минуту, что под капотом, и где тут подвох (спойлер: есть пара граблей, расскажу).
Статья для разработчиков. Будут реальные команды, реальный код на TypeScript и Python, и прямое сравнение с рынком: MCP-генерация есть не только у нас, скажу где. Без «революционных решений».
Что такое MCP и почему это ломает старый workflow
MCP (Model Context Protocol) — открытый стандарт от Anthropic, по которому AI-агент получает доступ к внешним инструментам. Не «модель что-то знает», а «модель умеет вызвать функцию». Агент видит список инструментов, читает их схемы и сам решает, когда дёрнуть нужный.
До MCP интеграция генерации в агентский флоу выглядела как костыль: либо учить агента дёргать ваш REST руками через shell, либо вообще выносить генерацию за пределы диалога. С MCP генерация становится нативным умением агента — таким же, как чтение файла или запуск теста.
Разница на практике:
Было. «Вот промпт, сходи на сайт, сгенерируй, скачай, положи в /public». Три приложения, пять переключений, ручной труд.
Стало. «Сделай обложку для статьи, 16:9, тёмный фон, наш фирменный градиент». Агент вызывает generate_image, получает результат, показывает картинку прямо в чате, кладёт файл куда надо. Одно предложение.
Для генеративного медиа выигрыш заметнее: картинки и видео — визуальный результат, и агент с vision сразу видит, что получилось, и может итерировать. «Не, слишком тёмно, добавь света» — и он перегенерирует, глядя на предыдущий кадр.
Подключаем за 60 секунд
Нужен один API-ключ. Берёте его в Консоли разработчика (clipia.ai/developer) или в Настройках → API-ключи. Ключ показывается один раз, формат — clipia_live_…. Дальше — по вашему клиенту.
Один API-ключ подключает множество AI-клиентов — Claude Code, Cursor, Codex, чат-агентыClaude Code
Одна команда в терминале:
Всё. Перезапускаете сессию — и Claude видит инструменты Clipia. Проверить: claude mcp list. Удалить: claude mcp remove clipia.
Codex CLI
Ключ — в переменной окружения: export CLIPIA_API_KEY=»clipia_live_YOUR_KEY». Codex подключается к remote-MCP напрямую, нативным HTTP-транспортом — мост mcp-remote не нужен. Читает ключ из env и сам подставляет Authorization: Bearer. После этого агент Codex умеет генерировать так же, как читать файлы.
Cursor
В ~/.cursor/mcp.json (глобально) или .cursor/mcp.json (в проекте):
Claude Desktop
Через mcp-remote (Desktop пока не умеет remote-HTTP напрямую):
claude.ai и ChatGPT — вообще без ключа
В вебе и десктопе claude.ai, а также в ChatGPT Developer Mode, подключение идёт по OAuth 2.1: Settings → Connectors → Add custom connector → URL https://mcp.clipia.ai/mcp → Connect → вход в аккаунт Clipia. Ключ копировать не надо, авторизуетесь как в любом OAuth-приложении. Под капотом — полноценный Authorization Server (PKCE, Dynamic Client Registration по RFC 7591), не самоделка.
Поддерживаются также VS Code, Cline, Windsurf, Gemini CLI — конфиги в документации. Принцип везде один: URL https://mcp.clipia.ai/mcp + Bearer-ключ или OAuth.
Что агент теперь умеет
После подключения у агента появляется восемь инструментов (плюс девятый, служебный — для интерактивной карточки, агенту он не виден). Не тридцать — каждый «съедает» контекст агента, поэтому ровно столько, сколько нужно:
- generate_image — картинка из текста или редактирование по референсу. Ждёт до 25 секунд инлайн и обычно возвращает готовый результат одним вызовом.
- generate_video — видео из текста или из картинки (передаёте image_url → image-to-video). Рендер 1–10 минут, сразу отдаёт request_id.
- wait_generation — дождаться готовности (long-poll). Агент сам зовёт его, пока статус не станет COMPLETED.
- get_generation — статус без ожидания.
- list_models — каталог: какие модели есть, их возможности и цена в кредитах.
- get_model — схема параметров конкретной модели.
- get_balance — остаток кредитов и расход за 30 дней.
- search_templates — поиск по 3500+ готовым промптам (гибридный, понимает русский).
Девятый — служебный, рендерит интерактивную карточку (про неё — сразу после примера).
Как это выглядит в диалоге (реальный сценарий):
Вы: Сгенерируй обложку для поста: абстракция, тёмный фон, cyan-зелёный градиент, 16:9, без текста.
Агент: Вызываю generate_image (модель Nano Banana 2, 16:9)… Готово, стоило 3 кредита. Вот результат: [картинка отображается прямо в чате]. Оригинал PNG — по ссылке.
Никакого «сходите на сайт». Агент сгенерировал, показал, отдал файл.
Фишка для тех, кто на claude.ai или в Claude Desktop: каждая генерация рендерит интерактивную карточку прямо в чате — с живым прогрессом, готовым медиа и кнопкой «Оригинал» (полнокачественный PNG/JPG). В Claude Code и Cursor превью приходит инлайн-блоком (сжатый webp до 640px) — этого хватает, чтобы агент с vision оценил кадр и предложил правку.
Для тех, кто строит продукт: REST API и SDK
MCP — это для агентского флоу. Если вы встраиваете генерацию в свой сервис, бота или пайплайн — есть REST и SDK. Очередь устроена как у fal.ai (submit → status → result + вебхуки), так что мигрировать привычно. Одно отличие в заголовке: REST принимает Authorization: Key или X-Api-Key, MCP выше использовал Bearer — ключ тот же, схемы взаимозаменяемы.
REST: голый curl
Дальше либо ждёте вебхук (с HMAC-SHA256 подписью), либо опрашиваете GET /v1/requests/{id}/status. Есть и POST /v1/models/{model}/estimate — детерминированно посчитать цену до постановки в очередь.
TypeScript — npm clipia-ai
Zero-dependency, ESM + CJS, есть CLI:
subscribe() сам поллит до результата. Нужен контроль — есть low-level очередь: clipia.queue.submit / status / result.
Python — PyPI clipia
Sync и async, единственная зависимость — httpx:
Оба SDK добавляют Idempotency-Key автоматически, умеют проверять подпись вебхука и поддерживают sandbox-ключи.
Чем Clipia MCP отличается от Kandinsky MCP и западных серверов
Аудитория техническая — проверит за минуту, поэтому без приукрас.
MCP для генерации медиа — не уникальность. На Западе официальные remote MCP-серверы уже есть у Replicate, fal.ai, Runway, Higgsfield, Black Forest Labs. Это стало гигиеной, а не дифференциатором. Кто скажет вам «MCP-генерация существует только у нас» — врёт.
Уникальность Clipia в другом — в контуре. Все западные MCP требуют валютную оплату, зарубежный аккаунт, а часто и VPN. Для российской команды или ИП это либо боль, либо прямой риск: загрузка клиентских данных и брифов в иностранный сервис — это трансграничная передача по 152-ФЗ.
Что есть в России? Почти ничего. Я проверял:
- Kandinsky MCP от Сбера (ai-forever/mcp_kandinsky) — есть, но это одна модель, только изображения, и локальный stdio-сервер (запуск через uvx у себя, не hosted endpoint). Видео нет.
- GigaChat, YandexGPT — выступают как MCP-клиенты (агенты, которые подключают чужие инструменты), а не как медиа-генерирующие серверы. У Yandex Cloud есть MCP Hub, но все 11 серверов там — инфраструктурные (Compute, S3, IAM), генерации картинок/видео среди них нет.
- BotHub, GPTunnel, SYNTX, GenAPI — это REST или OpenAI-совместимые хабы. Своего MCP-сервера генерации нет.
Прямой поиск «российский remote MCP для генерации видео» даёт ноль результатов. Поэтому корректная, защищаемая формулировка такая:
Clipia — первый российский MCP-агрегатор, который отдаёт по одному ключу и фото, и видео (50+ моделей), с remote-доступом из любого MCP-клиента, оплатой в рублях и данными в РФ. Не «первый в мире» — первый, кто закрыл российский контур для агентской генерации медиа.
И ещё пара вещей, которые в РФ нет ни у кого из перечисленных:
- SDK сразу на двух языках (npm clipia-ai + PyPI clipia) плюс REST плюс MCP — полная связка. На Западе её держат единицы (Replicate, Runway).
- OAuth 2.1 для веб-коннекторов claude.ai и ChatGPT — уровень Runway и BFL.
- Sandbox-ключи clipia_test_* — генерация-заглушка без списания кредитов, для тестов и CI.
Реальные примеры: что генерить и какими моделями
Под капотом — 50+ моделей под одним ключом, агент подбирает сам или вы указываете слаг. Что брать под задачу:
Картинки: — Nano Banana 2 — гиперреализм и скорость, 4K. Дефолт для image. — GPT Image 2 — лучшее понимание сложного промпта и читаемый текст на картинке (для баннеров и UI-моков). — FLUX 2 Pro — точность и редактирование по тексту.
Видео: — Seedance 2 — лидер по видео со звуком, кинематографичная физика. Дефолт для T2V/I2V. — Kling 3 — мультисцены и контроль движения. — Gemini Omni — видео из текста + фото + звука, до 4K. — Wan 2.7 — длинные сцены до 15 секунд, image-to-video и редактирование готового видео по тексту.
Текстовый промпт превращается в готовый фотореалистичный кадрПромпты, которые можно украсть (на английском — для генерации работает лучше):
Widescreen cinematic panorama of a traditional Japanese sakura garden at dawn, thousands of pink petals swirling in spiral currents, soft golden-peach morning mist, photorealistic, shot on Phase One IQ4 150MP, 16:9
Видео со звуком (Gemini Omni — звук под каждое действие):
Macro camera follows a glass marble rolling down a wooden toy contraption with collisions, gears and springs. Each impact has its own sound: a hard wooden click, a metallic gear ping, a soft elastic thump. Cinematic macro, warm studio lighting
Динамичное видео (Wan 2.7):
POV from inside a lunar lander cockpit cresting the far side of the Moon, revealing four green aliens in Hawaiian shirts having a campfire and toasting with beer bottles, Earth on the horizon, Spielberg style, photorealistic
Главное правило для видео: описывайте движение и камеру, а не статичную картинку. И не пишите текст в видео-промпт — буквы рендерятся с артефактами, накладывайте в монтаже.
Сколько стоит

Платите кредитами, цена возвращается в каждом ответе — никаких скрытых наценок за MCP. Картинка — единицы кредитов, видео — десятки. Подписки:
- Базовый — 799 ₽/мес, 240 кредитов
- Стандарт — 1 499 ₽/мес, 480 кредитов
- Про — 2 990 ₽/мес, 960 кредитов
- Ультима — 8 990 ₽/мес, 2 900 кредитов
Доступ к API для коммерческого использования открывается на старших тарифах. Полная сетка — на странице тарифов.
Совет: прежде чем тратить кредиты, отладьте интеграцию на sandbox-ключе clipia_test_* — он отдаёт мгновенный mock-результат без списаний, но шлёт настоящие вебхуки (тем же подписанным механизмом). Идеально для CI и проверки обработчика.
Грабли, на которые я наступил
Чтобы вы не наступили:
- Sandbox-ключ не генерит реально. clipia_test_* всегда отдаёт один и тот же sample-ассет. Удобно для тестов, но не перепутайте с боевым clipia_live_* — иначе будете долго гадать, почему «генерация» выдаёт одну и ту же картинку.
- Видео не блокирует — поллите. generate_video возвращает request_id сразу, рендер идёт 1–10 минут. В MCP агент сам зовёт wait_generation. В коде — subscribe() ждёт за вас, либо опрашивайте status сами. Не ждите готовый файл из первого ответа.
- Идемпотентность — ваш друг при ретраях. Один Idempotency-Key (UUID v4) + те же параметры → тот же request_id без двойного списания (окно 24 часа). Ретраите смело. SDK добавляют ключ автоматически.
- RPM-лимит 120, параллельных генераций 10. Упёрлись — придёт 429 с Retry-After. Для потоковой генерации закладывайте бэкофф.
- Cancel нет. Кредиты резервируются при старте, compute не прерывается. Это не баг — генерация уже считается на GPU. Планируйте параметры заранее (тут и пригодится estimate).
FAQ
Какие клиенты поддерживаются?
Claude Code, Codex CLI, Cursor, Claude Desktop, VS Code, Cline, Windsurf, Gemini CLI — по Bearer-ключу. claude.ai (web/desktop/mobile) и ChatGPT Developer Mode — по OAuth.
Чем MCP отличается от REST?
MCP — для агентского флоу: агент сам вызывает генерацию в диалоге. REST/SDK — для встраивания в ваш продукт. Один аккаунт и ключ работают для обоих.
Можно ли в CI без расхода кредитов?
Да — sandbox-ключ clipia_test_*. Мгновенный mock-COMPLETED, ноль списаний, настоящие подписанные вебхуки.
Где хранятся данные?
В России (БД и медиа на инфраструктуре в РФ, S3-регион ru-7). Для работы с клиентскими брифами и ПДн это снимает вопрос трансграничной передачи по 152-ФЗ.
Как платить компании?
Картой РФ или по счёту, с закрывающими документами (счёт, акт, договор) для юрлица и ИП. Без зарубежных карт и VPN.
Итог
Генерация перестала быть отдельным сервисом, в который надо «ходить». Через MCP она становится умением вашего агента — Claude Code, Codex, Cursor рисуют картинки и видео прямо в диалоге, по одной команде. На Западе это уже норма; в России до сих пор не было ни одного remote MCP, который отдаёт и фото, и видео из коробки.
Теперь есть. Один ключ, рубли, данные в РФ, SDK на двух языках, sandbox для тестов. Подключение — одна строка в терминале.
Запуск генерации из терминала — play-кнопка из командной строкиНачать: возьмите ключ в Консоли разработчика, отладьте на sandbox, потом переключите на боевой. Каталог моделей — для видео и для изображений.
Автор: Максим Захаров — основатель Clipia.ai, платформы для генерации фото и видео нейросетями. Каждый день гоняю эти модели через реальные задачи — отсюда и этот разбор.
Источник: vc.ru
Похожие записи
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
