Alibaba выкатили мультимодальную модель Wan2.5-Preview.
Она умеет генерировать ролики до 10 секунд в 1080p с синхронизированным аудио. На вход можно закинуть запись голоса, музыку, звуковые эффекты и диалоги.
Кроме видео модель генерирует картинки, схемы и инфографику. Изображения можно тут же редактировать промптом.
Потестить дают бесплатно, но придется подождать в очереди (или отвалить кредитов).
#нейросети #полезное























