Вы только посмотрите, что она умеет. Это прыжок вперед, который оставил позади конкурентов.
Kling O1 — это не просто «ещё одна версия» Kling, а новая флагманская модель, которую описывают как единый мультимодальный видео-движок: одна модель, которая умеет и генерировать, и монтировать, и расширять шоты в одном потоке.
Что нового по сравнению с обычным Kling 1.x / 2.x.
1. Kling O1 позиционируется как единая мультимодальная модель (unified multimodal video foundation model): одна модель закрывает text-to-video, image/subject-to-video, first/last-frame-to-video, video-to-video, добавление/удаление объектов, стиль-repaint и продление шота.
2. Видео понимается как «мультимодальный язык»: текст, картинки, видео и сабжекты (персонажи/объекты из нескольких ракурсов) живут в одном семантическом пространстве, поэтому модель лучше держит стиль и смысл сцены.
3. Единый рабочий цикл: в одном диалоге можно создать шот, отредактировать его, поменять стиль, добавить/убрать объекты и продлить видео, не меняя инструментов.
4. Точный контроль кадра: поддержка стартового и финального кадра, «предыдущий/следующий шот», перенос движения камеры и движения персонажа с референс-видео на изображение.
5. Сабжекты и библиотека персонажей: можно собрать персонажа или объект из нескольких ракурсов, фиксировать его внешний вид и использовать в разных шотах с сохранением лица, одежды и пропорций.
6. Глубокий постпродакшн через текст: сложные правки уровня композитинга, колоринга и стилизации делаются одной-двумя фразами на естественном языке (удалить объекты, поменять погоду, город, стиль и т.д.).
7. Комбинация операций за один запрос: модель умеет одновременно, например, менять стиль, добавлять персонажа, править окружение и продлевать шот, что уменьшает количество итераций.
8. Формат «фабрики шотов»: оптимальная длительность роликов 3–10 секунд с упором на плотное действие — удобно для Reels, Shorts, TikTok и для сборки более длинных историй в монтажке.
9. Фокус на консистентности: устойчивые персонажи, логотипы, одежда и объекты при смене ракурсов и стилей — модель заточена под реальный продакшн и брендовые задачи.
10. Технически: вход до 2K, до 3–10 секунд видео (в текущей реализации), поддержка нескольких изображений и сабжектов в одном запросе, лучший результат при промптах на английском.
Доступно по ссылке: https://app.klingai.com/global/omni/new
Источник: app.klingai.com
Источник: ai-news.ru























