
Компания OpenAI выпускает новую версию ChatGPT Images, которая обещает улучшенное следование инструкциям, более точное редактирование и до 4 раз более высокую скорость генерации изображений.
Новая модель, получившая название GPT Image 1.5, станет доступна всем пользователям ChatGPT начиная со вторника, а также через API. Это очередное усиление конкуренции с Gemini от Google после того, как генеральный директор OpenAI Сэм Альтман в прошлом месяце объявил «красную тревогу» в просочившемся внутреннем меморандуме. В меморандуме подробно описывались планы OpenAI по возвращению себе позиции лидера в области ИИ после того, как Google начала захватывать долю рынка после выпуска Gemini 3, своей последней флагманской модели, и Nano Banana Pro, новейшей версии генератора вирусных изображений от Google — обе эти модели возглавили рейтинг LMArena по нескольким показателям.
Google сохраняет лидерство, несмотря на то, что OpenAI отреагировала на ее успех на прошлой неделе запуском GPT-5.2, позиционируя ее как свою самую продвинутую модель для разработчиков и повседневного профессионального использования. Сообщается, что OpenAI планировала выпустить новый генератор изображений в начале января, и на этой неделе компания ускорила эти планы. Последняя выпущенная модель генератора изображений — GPT Image 1 — появилась в апреле.
GPT Image 1.5 выходит по мере того, как генераторы изображений и видео выходят за рамки прототипов и получают больше возможностей для производственной обработки. Как и Nano Banana Pro, ChatGPT Image предлагает функции постобработки, обеспечивая более детальный контроль редактирования для поддержания визуальной согласованности, например, сходства лиц, освещения, композиции и цветового тона во всех вариантах редактирования.

Большинство инструментов для генерации изображений на основе искусственного интеллекта плохо справляются с итерациями, поэтому это был бы огромный шаг вперед. При запросе конкретных изменений, таких как «скорректировать выражение лица» или «сделать освещение более холодным», модели часто переосмысливают все изображение заново, что приводит к отсутствию согласованности.
Обновление касается не только новых функций. Теперь изображения ChatGPT также будут доступны через специальную точку входа в боковой панели ChatGPT, которая работает «больше как творческая студия», — написала во вторник в своем блоге Фиджи Симо, генеральный директор OpenAI по приложениям.
«Новые экраны для просмотра и редактирования изображений упрощают создание изображений, соответствующих вашему видению, или позволяют черпать вдохновение из актуальных трендов и предустановленных фильтров», — написал Симо.
Помимо нового генератора изображений, OpenAI внедряет новые способы улучшения работы ChatGPT с помощью большего количества визуальных элементов. По словам Симо, планируется, что поисковые запросы будут отображать больше визуальных элементов с четкими источниками, что может быть полезно для таких задач, как преобразование измерений или проверка спортивных результатов.
«Когда вы творите, вы должны иметь возможность видеть и формировать то, что создаете. Если визуальные образы рассказывают историю лучше, чем одни слова, ChatGPT должен их включать», — написал Симо. «Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо там. Таким образом, мы можем продолжать сокращать расстояние между тем, что находится в вашей голове, и вашей способностью воплотить это в жизнь».
pic.twitter.com/PwG1F4TT6Q
— OpenAI (@OpenAI) 16 декабря 2025 г.
Источник: techcrunch.com

























