Архив рубрики ~Лента новостей~

Генерация фото и видео прямо в Claude Code, Codex и Cursor: один MCP-ключ — и агент рисует сам

Генерация фото и видео прямо в Claude Code, Codex и Cursor: один MCP-ключ — и агент рисует сам
Генерация фото и видео прямо в Claude Code, Codex и Cursor: один MCP-ключ — и агент рисует сам
Генерация фото и видео прямо в AI-агенте: терминал с кодом превращается в потоки света и готовые кадры

Картина, к которой вы привыкли: пишете код в Claude Code, нужна картинка для лендинга — переключаетесь в браузер, идёте на сервис генерации, ловите VPN, платите зарубежной картой, копируете промпт, ждёте, качаете файл, тащите обратно в проект. Контекст потерян, флоу сломан, полчаса ушло.

А теперь так: вы пишете агенту «сгенерируй hero-картинку для этой страницы в нашем стиле» — и он генерирует. В том же диалоге. Сам подбирает модель, сам показывает результат, сам отдаёт ссылку на файл. Вы не выходили из терминала.

Это не будущее. Это работает сегодня, через протокол MCP. И — что важно для нас, кто сидит в России — в рублях, без VPN, с данными на серверах в РФ. Дальше — как подключить за минуту, что под капотом, и где тут подвох (спойлер: есть пара граблей, расскажу).

Статья для разработчиков. Будут реальные команды, реальный код на TypeScript и Python, и прямое сравнение с рынком: MCP-генерация есть не только у нас, скажу где. Без «революционных решений».

Что такое MCP и почему это ломает старый workflow

MCP (Model Context Protocol) — открытый стандарт от Anthropic, по которому AI-агент получает доступ к внешним инструментам. Не «модель что-то знает», а «модель умеет вызвать функцию». Агент видит список инструментов, читает их схемы и сам решает, когда дёрнуть нужный.

До MCP интеграция генерации в агентский флоу выглядела как костыль: либо учить агента дёргать ваш REST руками через shell, либо вообще выносить генерацию за пределы диалога. С MCP генерация становится нативным умением агента — таким же, как чтение файла или запуск теста.

Разница на практике:

Было. «Вот промпт, сходи на сайт, сгенерируй, скачай, положи в /public». Три приложения, пять переключений, ручной труд.

Стало. «Сделай обложку для статьи, 16:9, тёмный фон, наш фирменный градиент». Агент вызывает generate_image, получает результат, показывает картинку прямо в чате, кладёт файл куда надо. Одно предложение.

Для генеративного медиа выигрыш заметнее: картинки и видео — визуальный результат, и агент с vision сразу видит, что получилось, и может итерировать. «Не, слишком тёмно, добавь света» — и он перегенерирует, глядя на предыдущий кадр.

Подключаем за 60 секунд

Нужен один API-ключ. Берёте его в Консоли разработчика (clipia.ai/developer) или в Настройках → API-ключи. Ключ показывается один раз, формат — clipia_live_…. Дальше — по вашему клиенту.

Один API-ключ подключает множество AI-клиентов — Claude Code, Cursor, Codex, чат-агентыОдин API-ключ подключает множество AI-клиентов — Claude Code, Cursor, Codex, чат-агенты

Claude Code

Одна команда в терминале:

claude mcp add —transport http clipia https://mcp.clipia.ai/mcp —header "Authorization: Bearer clipia_live_YOUR_KEY"

Всё. Перезапускаете сессию — и Claude видит инструменты Clipia. Проверить: claude mcp list. Удалить: claude mcp remove clipia.

Codex CLI

В ~/.codex/config.toml: [mcp_servers.clipia] url = "https://mcp.clipia.ai/mcp" bearer_token_env_var = "CLIPIA_API_KEY"

Ключ — в переменной окружения: export CLIPIA_API_KEY=»clipia_live_YOUR_KEY». Codex подключается к remote-MCP напрямую, нативным HTTP-транспортом — мост mcp-remote не нужен. Читает ключ из env и сам подставляет Authorization: Bearer. После этого агент Codex умеет генерировать так же, как читать файлы.

Cursor

В ~/.cursor/mcp.json (глобально) или .cursor/mcp.json (в проекте):

{ "mcpServers": { "clipia": { "url": "https://mcp.clipia.ai/mcp", "headers": { "Authorization": "Bearer clipia_live_YOUR_KEY" } } } }

Claude Desktop

Через mcp-remote (Desktop пока не умеет remote-HTTP напрямую):

{ "mcpServers": { "clipia": { "command": "npx", "args": [ "-y", "mcp-remote", "https://mcp.clipia.ai/mcp", "—header", "Authorization: Bearer clipia_live_YOUR_KEY" ] } } }

claude.ai и ChatGPT — вообще без ключа

В вебе и десктопе claude.ai, а также в ChatGPT Developer Mode, подключение идёт по OAuth 2.1: Settings → Connectors → Add custom connector → URL https://mcp.clipia.ai/mcp → Connect → вход в аккаунт Clipia. Ключ копировать не надо, авторизуетесь как в любом OAuth-приложении. Под капотом — полноценный Authorization Server (PKCE, Dynamic Client Registration по RFC 7591), не самоделка.

Поддерживаются также VS Code, Cline, Windsurf, Gemini CLI — конфиги в документации. Принцип везде один: URL https://mcp.clipia.ai/mcp + Bearer-ключ или OAuth.

Что агент теперь умеет

После подключения у агента появляется восемь инструментов (плюс девятый, служебный — для интерактивной карточки, агенту он не виден). Не тридцать — каждый «съедает» контекст агента, поэтому ровно столько, сколько нужно:

  • generate_image — картинка из текста или редактирование по референсу. Ждёт до 25 секунд инлайн и обычно возвращает готовый результат одним вызовом.
  • generate_video — видео из текста или из картинки (передаёте image_url → image-to-video). Рендер 1–10 минут, сразу отдаёт request_id.
  • wait_generation — дождаться готовности (long-poll). Агент сам зовёт его, пока статус не станет COMPLETED.
  • get_generation — статус без ожидания.
  • list_models — каталог: какие модели есть, их возможности и цена в кредитах.
  • get_model — схема параметров конкретной модели.
  • get_balance — остаток кредитов и расход за 30 дней.
  • search_templates — поиск по 3500+ готовым промптам (гибридный, понимает русский).

Девятый — служебный, рендерит интерактивную карточку (про неё — сразу после примера).

Как это выглядит в диалоге (реальный сценарий):

Вы: Сгенерируй обложку для поста: абстракция, тёмный фон, cyan-зелёный градиент, 16:9, без текста.

Агент: Вызываю generate_image (модель Nano Banana 2, 16:9)… Готово, стоило 3 кредита. Вот результат: [картинка отображается прямо в чате]. Оригинал PNG — по ссылке.

Никакого «сходите на сайт». Агент сгенерировал, показал, отдал файл.

Фишка для тех, кто на claude.ai или в Claude Desktop: каждая генерация рендерит интерактивную карточку прямо в чате — с живым прогрессом, готовым медиа и кнопкой «Оригинал» (полнокачественный PNG/JPG). В Claude Code и Cursor превью приходит инлайн-блоком (сжатый webp до 640px) — этого хватает, чтобы агент с vision оценил кадр и предложил правку.

Для тех, кто строит продукт: REST API и SDK

MCP — это для агентского флоу. Если вы встраиваете генерацию в свой сервис, бота или пайплайн — есть REST и SDK. Очередь устроена как у fal.ai (submit → status → result + вебхуки), так что мигрировать привычно. Одно отличие в заголовке: REST принимает Authorization: Key или X-Api-Key, MCP выше использовал Bearer — ключ тот же, схемы взаимозаменяемы.

REST: голый curl

curl -X POST https://api.clipia.ai/v1/models/nano-banana-2 -H "Authorization: Key $CLIPIA_KEY" -H "Content-Type: application/json" -H "Idempotency-Key: 8f3a1c7e-…" -d '{ "input": { "prompt": "a sunset over mountains, cinematic" }, "webhook_url": "https://your-server.com/clipia/webhook" }' Ответ: { "request_id": "…", "status": "IN_QUEUE", "queue_position": 0, "status_url": "…", "response_url": "…", "cost": 3 }

Дальше либо ждёте вебхук (с HMAC-SHA256 подписью), либо опрашиваете GET /v1/requests/{id}/status. Есть и POST /v1/models/{model}/estimate — детерминированно посчитать цену до постановки в очередь.

TypeScript — npm clipia-ai

Zero-dependency, ESM + CJS, есть CLI:

import { createClient } from 'clipia-ai'; // npm install clipia-ai const clipia = createClient({ apiKey: process.env.CLIPIA_KEY! }); // Картинка const img = await clipia.subscribe('nano-banana-2', { input: { prompt: 'a sunset over mountains, cinematic' }, onQueueUpdate: (s) => console.log(s.status, s.progress ?? ''), }); console.log(img.output?.images?.[0]?.url); // Видео из картинки (image-to-video) const vid = await clipia.subscribe('seedance-2-fast-i2v', { input: { image_url: 'https://example.com/start-frame.jpg', prompt: 'slow dolly-in, golden hour', duration: 8, resolution: '720p', aspect_ratio: '16:9', }, }); console.log(vid.output?.video?.url);

subscribe() сам поллит до результата. Нужен контроль — есть low-level очередь: clipia.queue.submit / status / result.

Python — PyPI clipia

Sync и async, единственная зависимость — httpx:

import os from clipia import Clipia # pip install clipia client = Clipia(api_key=os.environ["CLIPIA_KEY"]) result = client.subscribe( "nano-banana-2", input={"prompt": "a sunset over mountains, cinematic"}, on_queue_update=lambda s: print("status:", s.status, s.progress), ) print(result.output["images"][0]["url"])

Оба SDK добавляют Idempotency-Key автоматически, умеют проверять подпись вебхука и поддерживают sandbox-ключи.

Чем Clipia MCP отличается от Kandinsky MCP и западных серверов

Аудитория техническая — проверит за минуту, поэтому без приукрас.

MCP для генерации медиа — не уникальность. На Западе официальные remote MCP-серверы уже есть у Replicate, fal.ai, Runway, Higgsfield, Black Forest Labs. Это стало гигиеной, а не дифференциатором. Кто скажет вам «MCP-генерация существует только у нас» — врёт.

Уникальность Clipia в другом — в контуре. Все западные MCP требуют валютную оплату, зарубежный аккаунт, а часто и VPN. Для российской команды или ИП это либо боль, либо прямой риск: загрузка клиентских данных и брифов в иностранный сервис — это трансграничная передача по 152-ФЗ.

Что есть в России? Почти ничего. Я проверял:

  • Kandinsky MCP от Сбера (ai-forever/mcp_kandinsky) — есть, но это одна модель, только изображения, и локальный stdio-сервер (запуск через uvx у себя, не hosted endpoint). Видео нет.
  • GigaChat, YandexGPT — выступают как MCP-клиенты (агенты, которые подключают чужие инструменты), а не как медиа-генерирующие серверы. У Yandex Cloud есть MCP Hub, но все 11 серверов там — инфраструктурные (Compute, S3, IAM), генерации картинок/видео среди них нет.
  • BotHub, GPTunnel, SYNTX, GenAPI — это REST или OpenAI-совместимые хабы. Своего MCP-сервера генерации нет.

Прямой поиск «российский remote MCP для генерации видео» даёт ноль результатов. Поэтому корректная, защищаемая формулировка такая:

Clipia — первый российский MCP-агрегатор, который отдаёт по одному ключу и фото, и видео (50+ моделей), с remote-доступом из любого MCP-клиента, оплатой в рублях и данными в РФ. Не «первый в мире» — первый, кто закрыл российский контур для агентской генерации медиа.

И ещё пара вещей, которые в РФ нет ни у кого из перечисленных:

  • SDK сразу на двух языках (npm clipia-ai + PyPI clipia) плюс REST плюс MCP — полная связка. На Западе её держат единицы (Replicate, Runway).
  • OAuth 2.1 для веб-коннекторов claude.ai и ChatGPT — уровень Runway и BFL.
  • Sandbox-ключи clipia_test_* — генерация-заглушка без списания кредитов, для тестов и CI.

Реальные примеры: что генерить и какими моделями

Под капотом — 50+ моделей под одним ключом, агент подбирает сам или вы указываете слаг. Что брать под задачу:

Картинки: — Nano Banana 2 — гиперреализм и скорость, 4K. Дефолт для image. — GPT Image 2 — лучшее понимание сложного промпта и читаемый текст на картинке (для баннеров и UI-моков). — FLUX 2 Pro — точность и редактирование по тексту.

Видео: — Seedance 2 — лидер по видео со звуком, кинематографичная физика. Дефолт для T2V/I2V. — Kling 3 — мультисцены и контроль движения. — Gemini Omni — видео из текста + фото + звука, до 4K. — Wan 2.7 — длинные сцены до 15 секунд, image-to-video и редактирование готового видео по тексту.

Текстовый промпт превращается в готовый фотореалистичный кадрТекстовый промпт превращается в готовый фотореалистичный кадр

Промпты, которые можно украсть (на английском — для генерации работает лучше):

Widescreen cinematic panorama of a traditional Japanese sakura garden at dawn, thousands of pink petals swirling in spiral currents, soft golden-peach morning mist, photorealistic, shot on Phase One IQ4 150MP, 16:9

Видео со звуком (Gemini Omni — звук под каждое действие):

Macro camera follows a glass marble rolling down a wooden toy contraption with collisions, gears and springs. Each impact has its own sound: a hard wooden click, a metallic gear ping, a soft elastic thump. Cinematic macro, warm studio lighting

Динамичное видео (Wan 2.7):

POV from inside a lunar lander cockpit cresting the far side of the Moon, revealing four green aliens in Hawaiian shirts having a campfire and toasting with beer bottles, Earth on the horizon, Spielberg style, photorealistic

Главное правило для видео: описывайте движение и камеру, а не статичную картинку. И не пишите текст в видео-промпт — буквы рендерятся с артефактами, накладывайте в монтаже.

Сколько стоит

Генерация фото и видео прямо в Claude Code, Codex и Cursor: один MCP-ключ — и агент рисует сам

Платите кредитами, цена возвращается в каждом ответе — никаких скрытых наценок за MCP. Картинка — единицы кредитов, видео — десятки. Подписки:

  • Базовый — 799 ₽/мес, 240 кредитов
  • Стандарт — 1 499 ₽/мес, 480 кредитов
  • Про — 2 990 ₽/мес, 960 кредитов
  • Ультима — 8 990 ₽/мес, 2 900 кредитов

Доступ к API для коммерческого использования открывается на старших тарифах. Полная сетка — на странице тарифов.

Совет: прежде чем тратить кредиты, отладьте интеграцию на sandbox-ключе clipia_test_* — он отдаёт мгновенный mock-результат без списаний, но шлёт настоящие вебхуки (тем же подписанным механизмом). Идеально для CI и проверки обработчика.

Грабли, на которые я наступил

Чтобы вы не наступили:

  1. Sandbox-ключ не генерит реально. clipia_test_* всегда отдаёт один и тот же sample-ассет. Удобно для тестов, но не перепутайте с боевым clipia_live_* — иначе будете долго гадать, почему «генерация» выдаёт одну и ту же картинку.
  2. Видео не блокирует — поллите. generate_video возвращает request_id сразу, рендер идёт 1–10 минут. В MCP агент сам зовёт wait_generation. В коде — subscribe() ждёт за вас, либо опрашивайте status сами. Не ждите готовый файл из первого ответа.
  3. Идемпотентность — ваш друг при ретраях. Один Idempotency-Key (UUID v4) + те же параметры → тот же request_id без двойного списания (окно 24 часа). Ретраите смело. SDK добавляют ключ автоматически.
  4. RPM-лимит 120, параллельных генераций 10. Упёрлись — придёт 429 с Retry-After. Для потоковой генерации закладывайте бэкофф.
  5. Cancel нет. Кредиты резервируются при старте, compute не прерывается. Это не баг — генерация уже считается на GPU. Планируйте параметры заранее (тут и пригодится estimate).

FAQ

Какие клиенты поддерживаются?

Claude Code, Codex CLI, Cursor, Claude Desktop, VS Code, Cline, Windsurf, Gemini CLI — по Bearer-ключу. claude.ai (web/desktop/mobile) и ChatGPT Developer Mode — по OAuth.

Чем MCP отличается от REST?

MCP — для агентского флоу: агент сам вызывает генерацию в диалоге. REST/SDK — для встраивания в ваш продукт. Один аккаунт и ключ работают для обоих.

Можно ли в CI без расхода кредитов?

Да — sandbox-ключ clipia_test_*. Мгновенный mock-COMPLETED, ноль списаний, настоящие подписанные вебхуки.

Где хранятся данные?

В России (БД и медиа на инфраструктуре в РФ, S3-регион ru-7). Для работы с клиентскими брифами и ПДн это снимает вопрос трансграничной передачи по 152-ФЗ.

Как платить компании?

Картой РФ или по счёту, с закрывающими документами (счёт, акт, договор) для юрлица и ИП. Без зарубежных карт и VPN.

Итог

Генерация перестала быть отдельным сервисом, в который надо «ходить». Через MCP она становится умением вашего агента — Claude Code, Codex, Cursor рисуют картинки и видео прямо в диалоге, по одной команде. На Западе это уже норма; в России до сих пор не было ни одного remote MCP, который отдаёт и фото, и видео из коробки.

Теперь есть. Один ключ, рубли, данные в РФ, SDK на двух языках, sandbox для тестов. Подключение — одна строка в терминале.

Запуск генерации из терминала — play-кнопка из командной строкиЗапуск генерации из терминала — play-кнопка из командной строки

Начать: возьмите ключ в Консоли разработчика, отладьте на sandbox, потом переключите на боевой. Каталог моделей — для видео и для изображений.

Автор: Максим Захаров — основатель Clipia.ai, платформы для генерации фото и видео нейросетями. Каждый день гоняю эти модели через реальные задачи — отсюда и этот разбор.

Источник: vc.ru

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature… Архив рубрики ~Коротко из Telegram~ GLM-5.2 залетела в дизайн и документы Новости робототехники В Китае кассиров меняют на гуманоидных роботов — сеть Galbot… Архив рубрики ~Коротко из Telegram~ VK Tech и Yadro подписали меморандум о технологическом партнерстве для… Архив рубрики ~Коротко из Telegram~ Яндекс выложил в открытый доступ формат хранения и передачи данных… Архив рубрики ~Коротко из Telegram~ 📷 Вышел новый open-source видеоредактор Palmier, который позволяет AI-модели Claude… Архив рубрики ~Обо всем~ Microsoft добавляет конфигурации с 8 ГБ оперативной памяти, чтобы снизить стартовую цену Surface Pro и Surface Laptop. Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature… Архив рубрики ~Коротко из Telegram~ GLM-5.2 залетела в дизайн и документы Новости робототехники В Китае кассиров меняют на гуманоидных роботов — сеть Galbot… Архив рубрики ~Коротко из Telegram~ VK Tech и Yadro подписали меморандум о технологическом партнерстве для… Архив рубрики ~Коротко из Telegram~ Яндекс выложил в открытый доступ формат хранения и передачи данных… Архив рубрики ~Коротко из Telegram~ 📷 Вышел новый open-source видеоредактор Palmier, который позволяет AI-модели Claude… Архив рубрики ~Обо всем~ Microsoft добавляет конфигурации с 8 ГБ оперативной памяти, чтобы снизить стартовую цену Surface Pro и Surface Laptop.

Оставить комментарий