Image

Генератор изображений на основе искусственного интеллекта на основе света практически не потребляет энергию

Система, генерирующая изображения путем случайных колебаний лазерного луча, может значительно сократить потребление энергии по сравнению со стандартными инструментами ИИ.

10e53d3a87120e7b01664a7a51283f48

Красочные произведения искусства в стиле Винсента Ван Гога, созданные с помощью традиционной модели диффузии (слева в каждом наборе из трех) и оптического генератора изображений (справа)

Шици Чен и др. 2025 год

Генератор изображений на базе ИИ, использующий для создания изображений свет, а не традиционное вычислительное оборудование, может потреблять в сотни раз меньше энергии.

Когда модель искусственного интеллекта создаёт изображение из текста, она обычно использует процесс, называемый диффузией. Сначала ИИ показывается большая коллекция изображений и объясняется, как их нейтрализовать с помощью статистического шума, а затем он кодирует эти закономерности в набор правил. Получив новое зашумлённое изображение, он может использовать эти правила для обратного процесса: за множество шагов он стремится к созданию связного изображения, соответствующего заданному текстовому запросу.

Для получения реалистичных изображений высокого разрешения диффузия включает множество последовательных этапов, требующих значительных вычислительных мощностей. В апреле OpenAI сообщила, что её новый генератор изображений создал более 700 миллионов изображений за первую неделю работы. Для удовлетворения такого объёма потребностей требуются огромные объёмы энергии и воды для питания и охлаждения машин, на которых работают модели.

Айдоган Озкан из Калифорнийского университета в Лос-Анджелесе и его коллеги разработали генератор изображений на основе диффузии, работающий с использованием светового луча. В то время как процесс кодирования является цифровым и требует небольшого количества энергии, процесс декодирования полностью основан на свете и не требует вычислительной мощности.

«В отличие от цифровых диффузионных моделей, требующих сотен или тысяч итеративных шагов, этот процесс обеспечивает генерацию изображения в моментальном снимке, не требуя дополнительных вычислений, помимо начального кодирования», — говорит Озкан.

New Scientist. Новости науки и длинные статьи от опытных журналистов, освещающие события в области науки, технологий, здравоохранения и окружающей среды на веб-сайте и в журнале.

Система сначала использует цифровой кодер, обученный на общедоступных наборах изображений, который может генерировать статические сигналы, преобразуемые в изображения. Затем этот кодер был использован с жидкокристаллическим экраном, называемым пространственным модулятором света (SLM), который физически «впечатывает» эти статические сигналы в лазерный луч. Когда лазерный луч проходит через второй декодирующий SLM, он мгновенно формирует на экране желаемое изображение, записанное камерой.

Озкан и его команда использовали свою систему для создания чёрно-белых изображений простых объектов, таких как цифры от 1 до 9 или предметы одежды, которые используются для тестирования моделей диффузии, а также полноцветных изображений в стиле Винсента Ван Гога. Результаты в целом были похожи на результаты, получаемые с помощью обычных генераторов изображений.

«Это, пожалуй, первый пример, когда оптическая нейронная сеть — не просто лабораторная игрушка, а вычислительный инструмент, способный выдавать результаты, имеющие практическую ценность», — говорит Александр Львовский из Оксфордского университета.

При создании картин в стиле Ван Гога система потребляла всего несколько миллиджоулей энергии на изображение, в основном для жидкокристаллического экрана, в то время как традиционные модели диффузии потребляют сотни или тысячи джоулей. «Для сравнения: последнее эквивалентно количеству электроэнергии, потребляемому электрическим чайником за секунду, тогда как потребление оптической машины составило бы несколько миллионных долей секунды», — говорит Львовский.

Хотя систему необходимо будет адаптировать для работы в центрах обработки данных вместо широко распространенных инструментов генерации изображений, Озкан утверждает, что она может найти применение в носимой электронике, например, в очках с искусственным интеллектом, из-за низкого энергопотребления.

Природа DOI: 10.1038/s41586-025-09446-5

Источник: www.newscientist.com

✅ Найденные теги: Генератор, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Человек спит в кровати под красным пледом, солнечный свет падает на подушку.
Человек в смокинге держит планеты Земля и Марс, символизируя космические достижения.
Твердотельный аккумулятор Donut на выставке, показывает замещающий литий-ион стоимость.
Человек рядом с изображением двойной спирали ДНК на фоне природы.
Залитый солнцем лес с деревьями и болотистой водой, покрытой зелёной растительностью.
Пленка NeoFilm 100 на деревянном столе в окружении упаковок.
Деревянный минималистичный сундук с подсветкой в интерьере.
Обложка отчета о преодолении разрыва в операционном ИИ от MIT Technology Review.
Твит о разработке в 2026: выполнение сложных задач до пробуждения США, чтобы избежать проблем с ИИ.
Image Not Found
Человек в смокинге держит планеты Земля и Марс, символизируя космические достижения.

Почему SpaceX может выйти на биржу и с чем это может быть связано

Мы ведь явно не воспринимаем всерьез центры обработки данных в космосе? Элизабет Лопатто, старший репортер. Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего сайта. Все…

Мар 5, 2026
Твердотельный аккумулятор Donut на выставке, показывает замещающий литий-ион стоимость.

Согласно результатам испытаний, твердотельная батарея Donut Lab способна выдерживать (экстремальные) температуры.

Разработанная финским стартапом батарея не только выдержала экстремальные условия высокой температуры, но и фактически увеличила свою емкость. Эндрю Дж. Хокинс, редактор раздела «Транспорт». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в…

Мар 5, 2026
Пленка NeoFilm 100 на деревянном столе в окружении упаковок.

Цифровая камера OPT NeoFilm 100 в формате плёнки

Компактная камера OPT NeoFilm 100 выполнена в виде классической 35-мм плёнки, но внутри скрывается не аналоговый механизм, а цифровая «начинка», способная снимать фото и видео.  Камера оснащена 1-мегапиксельным сенсором, который позволяет получать изображения с разрешением до 3…

Мар 5, 2026
Деревянный минималистичный сундук с подсветкой в интерьере.

«Умная» кровать-трансформер Roll

Хорватский дизайнер Лука Булян разработал проект складной кровати Roll, которая по нажатию кнопки сворачивается в аккуратный деревянный шкаф. Главная идея строится на принципе ежедневного скручивания матраса без потери его свойств. Конструкция оснащена тихим электродвигателем и плавным механизмом…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых