Скейтбордист выполняет трюк в городе, зрители, пожарная машина, белоголовый орлан, дирижабль.

OpenAI продолжает свою «войну по критической ситуации» с новой моделью генерации изображений.

молодой человек катается на скейтборде
Источник изображений: OpenAI

Компания OpenAI выпускает новую версию ChatGPT Images, которая обещает улучшенное следование инструкциям, более точное редактирование и до 4 раз более высокую скорость генерации изображений.

Новая модель, получившая название GPT Image 1.5, станет доступна всем пользователям ChatGPT начиная со вторника, а также через API. Это очередное усиление конкуренции с Gemini от Google после того, как генеральный директор OpenAI Сэм Альтман в прошлом месяце объявил «красную тревогу» в просочившемся внутреннем меморандуме. В меморандуме подробно описывались планы OpenAI по возвращению себе позиции лидера в области ИИ после того, как Google начала захватывать долю рынка после выпуска Gemini 3, своей последней флагманской модели, и Nano Banana Pro, новейшей версии генератора вирусных изображений от Google — обе эти модели возглавили рейтинг LMArena по нескольким показателям.

Google сохраняет лидерство, несмотря на то, что OpenAI отреагировала на ее успех на прошлой неделе запуском GPT-5.2, позиционируя ее как свою самую продвинутую модель для разработчиков и повседневного профессионального использования. Сообщается, что OpenAI планировала выпустить новый генератор изображений в начале января, и на этой неделе компания ускорила эти планы. Последняя выпущенная модель генератора изображений — GPT Image 1 — появилась в апреле.

GPT Image 1.5 выходит по мере того, как генераторы изображений и видео выходят за рамки прототипов и получают больше возможностей для производственной обработки. Как и Nano Banana Pro, ChatGPT Image предлагает функции постобработки, обеспечивая более детальный контроль редактирования для поддержания визуальной согласованности, например, сходства лиц, освещения, композиции и цветового тона во всех вариантах редактирования.

f796013d055cbcb11ffb57f3730314c8
Изображение, показанное выше, с некоторыми изменениями, демонстрирующими улучшенную функцию следования инструкциям в GPT Image 1.5. Источник изображения: OpenAI.

Большинство инструментов для генерации изображений на основе искусственного интеллекта плохо справляются с итерациями, поэтому это был бы огромный шаг вперед. При запросе конкретных изменений, таких как «скорректировать выражение лица» или «сделать освещение более холодным», модели часто переосмысливают все изображение заново, что приводит к отсутствию согласованности.

Обновление касается не только новых функций. Теперь изображения ChatGPT также будут доступны через специальную точку входа в боковой панели ChatGPT, которая работает «больше как творческая студия», — написала во вторник в своем блоге Фиджи Симо, генеральный директор OpenAI по приложениям.

«Новые экраны для просмотра и редактирования изображений упрощают создание изображений, соответствующих вашему видению, или позволяют черпать вдохновение из актуальных трендов и предустановленных фильтров», — написал Симо.

Помимо нового генератора изображений, OpenAI внедряет новые способы улучшения работы ChatGPT с помощью большего количества визуальных элементов. По словам Симо, планируется, что поисковые запросы будут отображать больше визуальных элементов с четкими источниками, что может быть полезно для таких задач, как преобразование измерений или проверка спортивных результатов.

«Когда вы творите, вы должны иметь возможность видеть и формировать то, что создаете. Если визуальные образы рассказывают историю лучше, чем одни слова, ChatGPT должен их включать», — написал Симо. «Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо там. Таким образом, мы можем продолжать сокращать расстояние между тем, что находится в вашей голове, и вашей способностью воплотить это в жизнь».

Источник: techcrunch.com

✅ Найденные теги: OpenAI, Война, Генерация, Изображения, Модель, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Улучшение моделей работы мозга с помощью ZAPBench
ideipro logotyp
Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.
Футуристический 3D-анализ почвы с деревьями в цифровом пространстве.
Смартфон Google Pixel синего цвета, вид сбоку.
Мем со сценой из "Властелина колец" и упоминанием "Звезды смерти" из "Звездных войн".
Сравнение понятия равенства и эквивалентности на примере цветных кругов.
Мужчина с бородой в инвалидной коляске улыбается на улице возле дома.
Человек держит мощную микросхему графического ускорителя серверного уровня.
Image Not Found
Улучшение моделей работы мозга с помощью ZAPBench

Улучшение моделей работы мозга с помощью ZAPBench

воспроизведение видео без звука зацикливание пауза видео без звука зацикливание включение звука видео выключение звука В сотрудничестве с HHMI Janelia и Гарвардом мы представляем ZAPBench — набор данных и эталонный набор для анализа активности всего мозга с…

Мар 5, 2026
ideipro logotyp

Системная карта Sora | OpenAI

Прочитайте объявление Введение Обзор Соры Sora — это модель генерации видео от OpenAI, предназначенная для обработки текстовых, графических и видеовходных данных и генерации нового видео на выходе. Пользователи могут создавать видео с разрешением до 1080p (максимум 20…

Мар 5, 2026
Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.

Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.

Дуг Снайдер Создано автором с помощью Microsoft Copilot. В большинстве дискуссий о программировании, основанном на атмосфере, генеративный ИИ обычно рассматривается скорее как бэк-вокалист, а не как фронтмен: он полезен как исполнитель, помогающий быстро генерировать идеи, набрасывать начальные…

Мар 5, 2026
Футуристический 3D-анализ почвы с деревьями в цифровом пространстве.

Нефть — новая цифра. Почему современная нефтяная вышка больше похожа на дата-центр

Почему современная нефтяная вышка больше похожа на дата-центр Вместо суровых пейзажей — суперкомпьютеры. Вместо контурных карт и геологической «миллиметровки» — спутниковые снимки и огромные массивы данных. Более половины месторождений в мире уже управляются с использованием ИИ и продвинутых…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых