0d7252c977bd0cb6a718ad3efe77bdb0.jpg

Apple создает альтернативу диффузионным нейросетям

0d7252c977bd0cb6a718ad3efe77bdb0

Исследователи представили STARFlow V, новую модель для генерации видео, построенную не на диффузии, а на нормализующих потоках. Команда заявляет, что это первая система такого масштаба, которая демонстрирует стабильную и конкурентоспособную генерацию без многошагового шумоподавления. Модель использует полностью сквозное обучение и причинную структуру, что дает ей возможность создавать кадры в правильном временном порядке и без накопления ошибок.

В основе STARFlow V лежит архитектура с глобальными и локальными латентными пространствами. Глобальная часть управляет динамикой и согласованностью между кадрами, локальная часть отвечает за детально прорисованную картинку. Такой подход позволяет модели поддерживать высокое качество и плавность видео, даже если ролик получается длинным. На демонстрациях видно, что STARFlow V создает видео с устойчивой структурой, реалистичными объектами и точными переходами между сценами.

Разработчики применили алгоритм Flow Score Matching и эффективные итерации обновления, чтобы ускорить обучение и саму генерацию. В итоге модель работает быстрее, чем диффузионные аналоги с сопоставимым качеством. STARFlow V справляется с задачами text to video, image to video и video to video, а также может реконструировать видео из латентного пространства. Демонстрации показывают уверенную обработку сложных движений, света, теней и перспективы.

Команда открыла код, примеры и описание подхода. Исследователи считают, что STARFlow V становится шагом к тому, чтобы нормализующие потоки перестали быть экспериментальной техникой и стали полноценной альтернативой доминирующим диффузионным моделям. Проект показывает, что направление с потоками может дать более простую и прямую генерацию, без долгих итераций и без потерь согласованности.

Источник: habr.com

Источник: ai-news.ru

✅ Найденные теги: Apple, альтернативу, диффузионным, нейросетям

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Огромный омар на морском дне, окружённый крабами и рыбой.
Графики сравнения производительности: агенты, кодирование, изображение, видео.
Диаграммы сравнений производительности ИИ для задач агентов, кодирования, изображений и видео.
Графики сравнения производительности ИИ-агентов в задачах по категориям: агенты, код, изображение, видео.
ideipro logotyp
Скриншот сайта Anna's Archive с базой данных книг и научных статей.
ideipro logotyp
ideipro logotyp
ideipro logotyp
Image Not Found
Компьютер с изображением робота и иконками приложений на экране, символизирует технологии.

Как комбинировать несколько ИИ‑сервисов в один конвейер: от идеи до публикации за один вечер

ИИ сейчас умеет многое, но магии «одной кнопки, которая сделает идеальную статью и сама её опубликует» всё ещё нет. Зато можно собрать…

Фев 23, 2026
Женщина работает за ноутбуком, цифровая коммуникация, графики и письма, концепция удаленной работы.

AI‑агенты для рядового пользователя: 5 сценариев, которые реально экономят время

Слово «AI‑агент» в 2026 году звучит уже не как фантастика, а как нормальный рабочий инструмент, который тихо делает за нас рутину. Компании…

Фев 22, 2026
ideipro logotyp

Claude in PowerPoint — редактирование презентаций в реальном времени Anthropic…

Claude in PowerPoint — редактирование презентаций в реальном времени Anthropic запустили бета-версию Claude in PowerPoint — ассистент…

Фев 21, 2026
Экран выбора области для общего доступа в приложении, выделена вся область экрана.

💻 Разбираемся с любым непонятным интерфейсом. Screen Vision — это…

💻 Разбираемся с любым непонятным интерфейсом. Screen Vision — это ИИ-ассистент, который смотрит, что происходит на вашем экране и…

Фев 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых