Смартфон с логотипом Disney на фоне текста OpenAI, в руке человека.

Скоро начнется трансляция Видео с Использованием Искусственного Интеллекта. Будет Ли Это Доступно Для Просмотра?

Соглашение Disney и OpenAI намекает на будущее, в котором зрители не будут просто выбирать, что смотреть, а будут создавать это по запросу.

На этой фотоиллюстрации на смартфоне изображен логотип The Walt Disney Company, а на заднем плане виден логотип OpenAI.

Недавно я просмотрел самый ранний из сохранившихся кинофильмов, «Сцена в саду Раундхей», датируется 1888 годом. Четыре фигуры, двое мужчин и две женщины, ходят по двору быстрыми, отрывистыми шагами. Это длится около двух секунд.

Недавно я также просмотрел несколько видеороликов, снятых в 2016 году исследователями Массачусетского технологического института и Мэрилендского университета, которые являются одними из первых видеороликов, полностью созданных искусственным интеллектом. Каждый из них длится около секунды. На одном из снимков размытая фигура стоит на поле для гольфа, согнувшись в поясе, чтобы нанести удар. Никто не спутает эти видео или сцену в саду Раундхей с безупречным реализмом современного кинематографа. И точно так же, как скептики часто высмеивают видео с использованием искусственного интеллекта как расточительство, критики 19-го века отвергали раннее кино как «глупое любопытство».

Тем не менее, недавнее соглашение между Disney и OpenAI позволяет взглянуть на о другом будущем. Начиная с начала 2026 года, видеогенератор технологической компании Sora сможет создавать видеоролики с участием более 200 персонажей из франшизы Disney, Marvel, Pixar и «Звездных войн». А Disney+ покажет подборку клипов, созданных пользователями.

О поддержке научной журналистики

Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

Disney также инвестирует 1 миллиард долларов в OpenAI и использует его инструменты для создания «новых возможностей для подписчиков Disney+», говорится в совместном пресс-релизе Disney и OpenAI. Объявляя о партнерстве, генеральный директор Disney Роберт Айгер заявил, что компания будет «вдумчиво и ответственно подходить к расширению возможностей нашего повествования с помощью искусственного интеллекта». На недавней телефонной конференции по доходам он также заявил, что намерен предложить подписчикам создавать контент в рамках самого Disney+. Если вы хотите посмотреть, как Эльза и Золушка расправляются с Малефисентой, вы можете попросить эту сцену, хотя она может длиться всего 20 секунд.

Если это запуск AI TV on demand, то интересно, сколько времени пройдет, прежде чем эти ролики станут 20-минутными или часовыми, учитывая нагрузку на окружающую среду и вычислительные затраты. Многие люди верят, что это невозможно, но я думаю, что немногие из тех, кто смотрел «Сцену в саду Раундхей», предвидели «Великое ограбление поезда», 12-минутную веху в немом кинематографе 1903 года, а тем более «Унесенные ветром» — или потоковое вещание.

Задача создания изображений заключается в том, как работают современные системы. Они основаны на диффузии, технике, которая начинается с «шума», который постепенно превращается в изображение. Представьте себе человека, стоящего в тумане. Искусственный интеллект, по сути, удаляет туман и добавляет новые пиксели при повторных проходах, пока не появится четкая фигура. Каждый проход для уточнения сгенерированного изображения увеличивает стоимость.

Видео является еще более сложной задачей. Серия изображений должна быть согласована таким образом, чтобы черты лица не менялись, а кофейные кружки не исчезали. За одну секунду видео высокой четкости меняются миллионы пикселей. Во время основного выступления на хакатоне, организованном центром ИИ-сообщества AGI House, Билл Пиблз, исследователь OpenAI, который помогал разрабатывать Sora, сказал: «Мы обнаружили, насколько болезненно работать с видеоданными. В этих видео много пикселей.”

Для управления пикселями система OpenAI сжимает видео до упрощенной версии, которая сохраняет важную информацию. Затем он обрабатывает его как буханку хлеба — нарезает на кусочки, которые затем делит на кубики. Это позволяет модели согласовывать все кубики друг с другом, подобно тому, как модели, использующие ChatGPT, связывают все слова в ответе.

Скачок от секунд к минутам настолько мучителен, что чем больше чем больше рамок вы добавляете, тем больше информации должна быть в поле зрения модели. По мере того, как видео становятся длиннее, несоответствия накапливаются. Для полноценного телевидения с искусственным интеллектом «по запросу» также потребовались бы сокращения между сценами. Если бы каждый пользователь Disney+ запрашивал это с помощью современных технологий, затраты были бы ошеломляющими.

Исследователи искали более эффективные подходы. Один из них заключается в том, что модель разбивает работу на этапы. «Вместо того, чтобы устранять шумы или генерировать все видео сразу, вы создаете кадр за кадром», — говорит Тяньвэй Инь, научный сотрудник стартапа Reve по редактированию изображений с использованием искусственного интеллекта, который является одним из разработчиков программного обеспечения для генерации видео CausVid. “На каждом шаге ваши вычисления ограничены гораздо меньшей частью, а не полным объемом, и это позволяет вам работать намного дольше.”

Инь считает, что системы будут более эффективными. к следующему году время генерации данных эффективно достигнет пяти минут, а вскоре, благодаря интеграции различных существующих технологий искусственного интеллекта, может составить час. Другие разделяют этот оптимизм. В недавнем интервью Би-би-си генеральный директор Google Сундар Пичаи рассказал о возможности создания учащимися старших классов полнометражных фильмов с использованием искусственного интеллекта в ближайшие годы. Ранее в этом месяце Кристиан Бал Валенсуэла, генеральный директор компании Runway, создающей видео с искусственным интеллектом, рассказал El Pais, что «60 или 90 минут с неизменными персонажами и сюжетом по-прежнему невозможны». Но это будет скоро». Далее он сказал, что просмотр видеороликов с использованием искусственного интеллекта, создаваемых в режиме реального времени, также не за горами.

Путь от подготовленных фанатами клипов к полнометражным фильмам -полнометражные фильмы претерпят некоторые неприглядные нововведения, не говоря уже о переговорах о том, как платить креативщикам, чья работа их подпитывает. И хотя финансовое бремя, связанное с видео с использованием искусственного интеллекта, кажется непомерно высоким, миллионы людей по всему миру участвуют в создании и обучении моделей с использованием искусственного интеллекта, и затраты на технологии обычно снижаются. Например, в 1998 году пропускная способность была непомерно высокой — для крупных сетей она стоила около 1200 долларов за мегабит в секунду (Мбит/с) в месяц, — но к 2025 году самая низкая заявленная стоимость составила 0,05 доллара за Мбит/с в месяц, что на 99,996 процента меньше. Это изменение сделало возможным потоковое вещание на Disney+ или Netflix.

Культурный путь новых средств массовой информации гораздо сложнее представить, и часто возникает сильное сопротивление. Поэт Шарль Бодлер в 1859 году выступил против фотографии за ее ленивый реализм, который уводит искусство от воображения. В прошлые века «и скептики, и сторонники сравнивали фотографию с живописью, а движущиеся изображения — с театром», — пишет современный ученый Рубен де Лотур. Похоже, мы переживаем еще более сложный момент. Что кажется несомненным, так это то, что, как и в прошлом, технологии будут быстро развиваться, позволяя миллионам создателей тестировать возможности, которые мы пока не можем предсказать.

✅ Найденные теги: видео, искусственный интеллект, новости, Просмотр, Скоро, Трансляция

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Футуристический 3D-анализ почвы с деревьями в цифровом пространстве.
Смартфон Google Pixel синего цвета, вид сбоку.
Мем со сценой из "Властелина колец" и упоминанием "Звезды смерти" из "Звездных войн".
Сравнение понятия равенства и эквивалентности на примере цветных кругов.
Мужчина с бородой в инвалидной коляске улыбается на улице возле дома.
Человек держит мощную микросхему графического ускорителя серверного уровня.
Человек с телефоном в шоке от полученных сообщений, включающих символы молнии и какашки.
Hisense: глобальный лидер в продажах 100-дюймовых и лазерных телевизоров.
Российские ученые разгадали тайну образования магнитной аномалии в Антарктиде
Image Not Found
Футуристический 3D-анализ почвы с деревьями в цифровом пространстве.

Нефть — новая цифра. Почему современная нефтяная вышка больше похожа на дата-центр

Почему современная нефтяная вышка больше похожа на дата-центр Вместо суровых пейзажей — суперкомпьютеры. Вместо контурных карт и геологической «миллиметровки» — спутниковые снимки и огромные массивы данных. Более половины месторождений в мире уже управляются с использованием ИИ и продвинутых…

Мар 5, 2026
Смартфон Google Pixel синего цвета, вид сбоку.

Google официально анонсировал Pixel 10a — смартфон стартует от 500 долларов

Источник: Google Google полноценно анонсировала свой новый бюджетный смартфон Pixel 10a. Его цена начнётся от 500 долларов — как и в предыдущих бюджетниках компании. Внешне смартфон тоже фактически не изменился. Pixel 10a будет иметь стекло Corning Gorilla…

Мар 5, 2026
Мем со сценой из "Властелина колец" и упоминанием "Звезды смерти" из "Звездных войн".

Мир, которого нет. «Палантир» показал нам всем ужасное будущее

На первый взгляд, ажиотаж вокруг заявления Кима Доткома странен. Взламывают всех, а уж частные компании — тем более. Но речь — не просто о частной компании. Ее владельцу — Питеру Тилю — во многом обязан своим вторым…

Мар 4, 2026
Человек держит мощную микросхему графического ускорителя серверного уровня.

NVIDIA снижает спецификацию памяти HBM4 на платформе Vera Rubin до 20 Тбайт/с

В скором времени NVIDIA проведёт очередную конференцию GTC, в рамках которой планирует рассказать о новых ускорителях искусственного интеллекта с наивысшей производительностью Feynman. Вот только сейчас компания до сих пор не может определиться с характеристиками подсистемы памяти Vera…

Мар 4, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых