Скейтбордист выполняет трюк в городе, зрители, пожарная машина, белоголовый орлан, дирижабль.

OpenAI продолжает свою «войну по критической ситуации» с новой моделью генерации изображений.

молодой человек катается на скейтборде
Источник изображений: OpenAI

Компания OpenAI выпускает новую версию ChatGPT Images, которая обещает улучшенное следование инструкциям, более точное редактирование и до 4 раз более высокую скорость генерации изображений.

Новая модель, получившая название GPT Image 1.5, станет доступна всем пользователям ChatGPT начиная со вторника, а также через API. Это очередное усиление конкуренции с Gemini от Google после того, как генеральный директор OpenAI Сэм Альтман в прошлом месяце объявил «красную тревогу» в просочившемся внутреннем меморандуме. В меморандуме подробно описывались планы OpenAI по возвращению себе позиции лидера в области ИИ после того, как Google начала захватывать долю рынка после выпуска Gemini 3, своей последней флагманской модели, и Nano Banana Pro, новейшей версии генератора вирусных изображений от Google — обе эти модели возглавили рейтинг LMArena по нескольким показателям.

Google сохраняет лидерство, несмотря на то, что OpenAI отреагировала на ее успех на прошлой неделе запуском GPT-5.2, позиционируя ее как свою самую продвинутую модель для разработчиков и повседневного профессионального использования. Сообщается, что OpenAI планировала выпустить новый генератор изображений в начале января, и на этой неделе компания ускорила эти планы. Последняя выпущенная модель генератора изображений — GPT Image 1 — появилась в апреле.

GPT Image 1.5 выходит по мере того, как генераторы изображений и видео выходят за рамки прототипов и получают больше возможностей для производственной обработки. Как и Nano Banana Pro, ChatGPT Image предлагает функции постобработки, обеспечивая более детальный контроль редактирования для поддержания визуальной согласованности, например, сходства лиц, освещения, композиции и цветового тона во всех вариантах редактирования.

f796013d055cbcb11ffb57f3730314c8
Изображение, показанное выше, с некоторыми изменениями, демонстрирующими улучшенную функцию следования инструкциям в GPT Image 1.5. Источник изображения: OpenAI.

Большинство инструментов для генерации изображений на основе искусственного интеллекта плохо справляются с итерациями, поэтому это был бы огромный шаг вперед. При запросе конкретных изменений, таких как «скорректировать выражение лица» или «сделать освещение более холодным», модели часто переосмысливают все изображение заново, что приводит к отсутствию согласованности.

Обновление касается не только новых функций. Теперь изображения ChatGPT также будут доступны через специальную точку входа в боковой панели ChatGPT, которая работает «больше как творческая студия», — написала во вторник в своем блоге Фиджи Симо, генеральный директор OpenAI по приложениям.

«Новые экраны для просмотра и редактирования изображений упрощают создание изображений, соответствующих вашему видению, или позволяют черпать вдохновение из актуальных трендов и предустановленных фильтров», — написал Симо.

Помимо нового генератора изображений, OpenAI внедряет новые способы улучшения работы ChatGPT с помощью большего количества визуальных элементов. По словам Симо, планируется, что поисковые запросы будут отображать больше визуальных элементов с четкими источниками, что может быть полезно для таких задач, как преобразование измерений или проверка спортивных результатов.

«Когда вы творите, вы должны иметь возможность видеть и формировать то, что создаете. Если визуальные образы рассказывают историю лучше, чем одни слова, ChatGPT должен их включать», — написал Симо. «Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо там. Таким образом, мы можем продолжать сокращать расстояние между тем, что находится в вашей голове, и вашей способностью воплотить это в жизнь».

Источник: techcrunch.com

✅ Найденные теги: OpenAI, Война, Генерация, Изображения, Модель, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Прозрачный раствор в бутылочке с черной крышкой, химическая формула на этикетке.
Диаграмма ложной идентичности: реальность и самозванец, высокие и низкие частоты.
Изображение крупным планом дрона с логотипом Anduril.
ideipro logotyp
Предоставление врачам необходимой информации непосредственно в момент общения с пациентом.
Руководство по Kedro: ваш готовый к внедрению инструментарий для анализа данных.
Цифровая сеть и технологическая сфера, соединенные световым потоком.
Модель атома с ядром и вращающимися электронами на темном фоне.
Флуоресцентное изображение эмбриона синих и фиолетовых оттенков на черном фоне.
Image Not Found
Прозрачный раствор в бутылочке с черной крышкой, химическая формула на этикетке.

Ученые усовершенствовали метод получения промышленного спирта

Полученный α-кумиловый спирт © Елена Редина. Ученые разработали новый метод получения α-кумилового спирта — ключевого продукта для производства полимеров, косметики и моющих средств. Этот спирт также служит основой для получения вещества, придающего пластикам прочность и устойчивость к…

Мар 5, 2026
Диаграмма ложной идентичности: реальность и самозванец, высокие и низкие частоты.

Эффект наложения спектров в аудио, объяснение простое: от «колес телеги» до волновых форм.

Понимание основополагающих искажений цифрового звука с самых базовых принципов, с примерами и наглядными объяснениями. Делиться Вы когда-нибудь задумывались, почему в фильмах вращающиеся колеса иногда кажутся движущимися вспять? Или почему дешевая цифровая запись звучит резко и металлически по…

Мар 5, 2026
Изображение крупным планом дрона с логотипом Anduril.

Компания Anduril планирует достичь оценки в 60 миллиардов долларов в новом раунде финансирования.

Вкратце Источник изображения: Кайл Гриллот/Bloomberg / Getty Images Согласно новому сообщению The Wall Street Journal, оборонно-технологическая компания Палмера Лаки находится в разгаре многомиллиардного раунда финансирования, возглавляемого Thrive Capital и Andreessen Horowitz. Этот раунд финансирования состоится менее чем…

Мар 5, 2026
ideipro logotyp

Компания Illumina на конференции JPM 2026: Успешный 4-й квартал, рост клинических исследований и запуск BioInsight.

Автор: Эллисон Проффитт 13 января 2026 г. | Джейкоб Тейсен во вторник вернулся на сцену конференции JP Morgan Healthcare Conference с посланием о восходящем тренде: компания Illumina снова демонстрирует рост, и клиническое секвенирование является движущей силой этого…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых