Представляем GPT-5.3-Codex | OpenAI

05.03.2026 ideipro.ru

Расширение сферы применения Кодекса на весь спектр профессиональной работы за компьютером.

Попробуйте в приложении Codex.

Мы представляем новую модель, которая раскрывает еще больший потенциал Codex: GPT-5.3-Codex, самая мощная на сегодняшний день модель агентного кодирования. Модель объединяет в себе передовые возможности кодирования GPT-5.2-Codex и возможности GPT-5.2 в области рассуждений и профессиональных знаний, и все это на 25% быстрее. Это позволяет ей справляться с длительными задачами, требующими исследований, использования инструментов и сложного выполнения. Подобно коллеге, вы можете управлять GPT-5.3-Codex и взаимодействовать с ней во время работы, не теряя контекста.

GPT-5.3-Codex — это наша первая модель, которая сама сыграла решающую роль в своем создании. Команда Codex использовала ранние версии для отладки собственного обучения, управления развертыванием, а также диагностики результатов тестирования и оценок — наша команда была поражена тем, насколько Codex смогла ускорить собственную разработку.

С GPT‑5.3‑Codex Codex превращается из агента, способного писать и проверять код, в агента, который может делать практически все, что разработчики и специалисты могут делать на компьютере.

Пограничные агентские возможности

GPT-5.3-Codex устанавливает новый отраслевой рекорд в SWE-Bench Pro и Terminal-Bench, а также демонстрирует высокие показатели в OSWorld и GDPval — четырех бенчмарках, которые мы используем для оценки возможностей программирования, работы агентов и реальных задач.

Программирование

GPT-5.3-Codex демонстрирует лучшие результаты в SWE-Bench Pro, строгой оценке реальных задач разработки программного обеспечения. В то время как SWE-bench Verified тестирует только Python, SWE-Bench Pro охватывает четыре языка и является более устойчивым к загрязнению, сложным, разнообразным и актуальным для отрасли. Он также значительно превосходит предыдущие лучшие результаты в Terminal-Bench 2.0, который измеряет навыки работы с терминалом, необходимые для работы с программным обеспечением, таким как Codex. Примечательно, что GPT-5.3-Codex делает это с меньшим количеством токенов, чем любая предыдущая модель, позволяя пользователям создавать больше кода.

Веб-разработка

Сочетание передовых возможностей программирования, улучшений в эстетике и компактизации приводит к созданию модели, способной на впечатляющие результаты, позволяя создавать высокофункциональные сложные игры и приложения с нуля в течение нескольких дней. Чтобы протестировать возможности модели в веб-разработке и долгосрочном агентском управлении, мы попросили GPT-5.3-Codex создать для нас две игры: вторую версию гоночной игры из запуска приложения Codex и игру о прыжках в воду. Используя навык разработки веб-игр и предварительно выбранные общие подсказки, такие как «исправить ошибку» или «улучшить игру», GPT-5.3-Codex автономно дорабатывал игры, обработав миллионы токенов. Посмотрите трейлеры и поиграйте в игры сами, чтобы увидеть, на что способен Codex.

Гоночная игра с разными гонщиками, восемью картами и даже предметами, которые можно использовать с помощью пробела. Попробуйте сами здесь (откроется в новом окне) !

Игра про дайвинг, в которой вы исследуете различные рифы, собираете их все, чтобы заполнить свой рыбный кодекс, при этом контролируя уровень кислорода, давление и справляясь с опасностями. Попробуйте сами здесь (откроется в новом окне) !

GPT-5.3-Codex также лучше понимает ваши намерения при создании сайтов для повседневной работы, по сравнению с GPT-5.2-Codex. Простые или недостаточно детализированные запросы теперь по умолчанию приводят к сайтам с большей функциональностью и разумными настройками, предоставляя вам более прочную основу для воплощения ваших идей в жизнь.

Например, мы попросили GPT-5.3-Codex и GPT-5.2-Codex создать две целевые страницы, показанные ниже. GPT-5.3-Codex автоматически отобразил годовой план как сниженную ежемесячную цену, благодаря чему скидка выглядела очевидной и преднамеренной, вместо того чтобы умножать годовую сумму. Он также автоматически создал карусель отзывов с тремя различными цитатами пользователей вместо одной, в результате чего страница по умолчанию выглядит более завершенной и готовой к использованию.

За пределами программирования

Программисты, дизайнеры, менеджеры по продуктам и специалисты по анализу данных делают гораздо больше, чем просто пишут код. GPT-5.3-Codex создан для поддержки всех этапов жизненного цикла программного обеспечения — отладки, развертывания, мониторинга, написания PRD (Product Document), редактирования текста, пользовательских исследований, тестирования, сбора метрик и многого другого. Его агентные возможности выходят за рамки разработки программного обеспечения, помогая вам создавать все, что вы захотите — будь то презентации или анализ данных в таблицах.

Благодаря использованию специализированных навыков, аналогичных тем, что применялись в наших предыдущих результатах GDPval, модель GPT-5.3-Codex также демонстрирует высокие показатели в профессиональной работе с интеллектуальным трудом, согласно оценке GDPval , сравнявшись с GPT-5.2. GDPval — это оценочный тест OpenAI, выпущенный в 2025 году, который измеряет производительность модели в четко определенных задачах, связанных с работой с интеллектуальным трудом, в 44 профессиях. Эти задачи включают в себя создание презентаций, электронных таблиц и других рабочих продуктов.

Ниже приведены несколько примеров работ, выполненных этим агентом.

Подсказка + контекст задачи

Вы — финансовый консультант в фирме по управлению активами. Вам стало известно, что многие клиенты вашей фирмы обращались к консультантам на местах с предложением перевести депозитные сертификаты в переменные аннуитеты через своих местных банкиров. Привлекательность рыночной доходности и гарантия получения ежемесячных выплат до конца жизни — очень заманчивое предложение, но это неразумное инвестиционное решение. Вам поручено создать презентацию PowerPoint из 10 слайдов, в которой будут изложены тезисы, почему финансовые консультанты, как доверенные лица, должны настоятельно рекомендовать воздержаться от принятия такого инвестиционного решения. Презентация, которая в конечном итоге будет представлена внутри компании консультантам на местах, должна освещать следующую информацию: • Сравнение различных характеристик депозитных сертификатов и переменных аннуитетов, предоставляемых FINRA, с целью повышения осторожности инвесторов; • Сравнение анализа риска и доходности, а также влияния на рост; • Различие в штрафных санкциях между двумя инструментами; • Сравнение допустимого уровня риска с акцентом на целесообразность, определяемую в соответствии с правилами NAIC по обеспечению наилучших интересов; • Выделение проблем/вопросов FINRA; • Выделение проблем/правил NAIC. NAIC и FINRA разработали руководящие принципы наилучших интересов и целесообразности при рекомендации переменных аннуитетов ввиду сложности этого продукта. Информация, представленная в презентации, подготовит консультантов к эффективному предоставлению разумных рекомендаций в наилучших интересах клиента. Пожалуйста, учитывайте следующие веб-источники при подготовке презентации: https://content.naic.org/sites/default/files/government-affairs-brief-annuity-suitability-best-interest-model.pdf https://www.finra.org/investors/insights/high-yield-cds

Выход GPT-5.3-Codex

NOVOSTI Каждое задание в GDPval разработано опытным специалистом и отражает реальный опыт работы по специальности.

OSWorld — это тест производительности компьютера, в котором агент должен выполнять задачи повышения производительности в визуальной среде рабочего стола. GPT-5.3-Codex демонстрирует гораздо более высокие возможности использования компьютера, чем предыдущие модели GPT.

В совокупности эти результаты, полученные в ходе тестирования в области программирования, фронтенда, использования компьютеров и решения реальных задач, показывают, что GPT-5.3-Codex не просто лучше справляется с отдельными задачами, но и представляет собой качественный скачок в направлении создания единого универсального агента, способного рассуждать, создавать и выполнять задачи во всем спектре реальной технической работы.

Интерактивный сотрудник

По мере расширения возможностей модели разрыв смещается от того, на что способны агенты, к тому, насколько легко люди могут взаимодействовать с ними, направлять и контролировать их работу в параллельном режиме. Приложение Codex значительно упрощает управление агентами, а теперь, с GPT-5.3-Codex, делает этот процесс еще более интерактивным. Новая модель Codex предоставляет частые обновления, позволяя вам быть в курсе ключевых решений и прогресса в процессе работы. Вместо ожидания конечного результата вы можете взаимодействовать в режиме реального времени — задавать вопросы, обсуждать подходы и двигаться к решению. GPT-5.3-Codex комментирует свою работу, реагирует на обратную связь и держит вас в курсе от начала до конца.

Включить управление движением модели во время её работы в приложении можно в разделе «Настройки» > «Общие» > «Поведение при отслеживании».

Как мы использовали Codex для обучения и развертывания GPT-5.3-Codex

Недавние быстрые улучшения Codex основаны на результатах исследовательских проектов, длившихся месяцы или годы и охватывающих всю OpenAI. Codex ускоряет эти исследовательские проекты, и многие исследователи и инженеры OpenAI описывают свою работу сегодня как принципиально отличающуюся от той, что была всего два месяца назад. Даже ранние версии GPT-5.3-Codex продемонстрировали исключительные возможности, позволив нашей команде работать с этими более ранними версиями для улучшения обучения и поддержки развертывания более поздних версий.

Codex полезен для решения очень широкого спектра задач, поэтому перечислить все способы его использования нашими командами довольно сложно. В качестве примеров можно привести использование Codex исследовательской группой для мониторинга и отладки процесса обучения для этого релиза. Это ускорило исследования, выйдя за рамки отладки проблем инфраструктуры: помогло отслеживать закономерности на протяжении всего процесса обучения, обеспечило глубокий анализ качества взаимодействия, предложило решения и создало многофункциональные приложения для исследователей, позволяющие точно понять, чем поведение модели отличается от поведения предыдущих моделей.

Команда разработчиков использовала Codex для оптимизации и адаптации программного обеспечения для GPT-5.3-Codex. Когда мы начали сталкиваться со странными крайними случаями, влияющими на пользователей, члены команды использовали Codex для выявления ошибок рендеринга контекста и определения первопричины низкого уровня попаданий в кэш. GPT-5.3-Codex продолжает помогать команде на протяжении всего запуска, динамически масштабируя кластеры GPU для адаптации к всплескам трафика и поддержания стабильной задержки.

В ходе альфа-тестирования один из исследователей хотел понять, какой дополнительный объем работы выполняет GPT-5.3-Codex за ход и какова соответствующая разница в производительности. GPT-5.3-Codex разработал несколько простых классификаторов на основе регулярных выражений для оценки частоты уточнений, положительных и отрицательных ответов пользователей, прогресса в выполнении задачи, а затем масштабированно применил их ко всем журналам сессий и выдал отчет с выводами. Пользователи, работавшие с Codex, были более довольны, поскольку агент лучше понимал их намерения и добивался большего прогресса за ход, задавая меньше уточняющих вопросов.

Из-за существенных отличий GPT-5.3-Codex от своих предшественников, данные альфа-тестирования показали множество необычных и противоречащих интуиции результатов. Специалист по анализу данных из нашей команды работал с GPT-5.3-Codex над созданием новых конвейеров обработки данных и визуализацией результатов, которая оказалась гораздо более наглядной, чем это позволяли наши стандартные инструменты для создания дашбордов. Результаты были проанализированы совместно с Codex, который кратко и за три минуты обобщил ключевые выводы по тысячам точек данных.

В отдельности все эти задачи являются интересными примерами того, как Codex может помочь исследователям и разработчикам продуктов. В совокупности же мы обнаружили, что эти новые возможности привели к значительному ускорению работы наших исследовательских, инженерных и продуктовых команд.

Обеспечение безопасности киберпространства

В последние месяцы мы наблюдаем значительное улучшение производительности моделей в задачах кибербезопасности, что приносит пользу как разработчикам, так и специалистам по безопасности. Параллельно мы готовим усиленные меры киберзащиты для поддержки оборонительного использования и повышения устойчивости всей экосистемы.

GPT-5.3-Codex — это первая модель, которую мы классифицируем как высокоэффективную для задач, связанных с кибербезопасностью, в рамках нашей системы обеспечения готовности , и первая, которую мы непосредственно обучили выявлять уязвимости программного обеспечения. Хотя у нас нет убедительных доказательств того, что она может автоматизировать кибератаки от начала до конца, мы придерживаемся превентивного подхода и развертываем наш самый полный на сегодняшний день комплекс мер кибербезопасности. Наши меры включают обучение технике безопасности, автоматизированный мониторинг, доверенный доступ к расширенным возможностям и механизмы обеспечения соблюдения требований, включая анализ угроз.

Поскольку кибербезопасность по своей сути является сферой двойного назначения, мы применяем основанный на фактических данных итеративный подход, который ускоряет способность защитников находить и устранять уязвимости, одновременно замедляя злоупотребления. В рамках этого мы запускаем пилотную программу Trusted Access for Cyber , направленную на ускорение исследований в области киберзащиты.

Чтобы предотвратить злоупотребления, некоторые запросы, которые наши системы определяют как имеющие повышенный киберриск, могут автоматически перенаправляться из GPT-5.3-Codex в GPT-5.2. Мы продолжаем совершенствовать эти меры защиты. Разработчики, проводящие исследования в области безопасности или считающие, что их запросы были неправильно классифицированы, могут подать заявку на полный доступ через нашу программу «Доверенный доступ для кибербезопасности» или сообщить о проблеме с помощью команды /feedback.

Мы инвестируем в защиту экосистемы, например, расширяем закрытое бета-тестирование Aardvark , нашего агента для исследований в области безопасности, который станет первым продуктом в нашем наборе продуктов и инструментов Codex Security, а также сотрудничаем с разработчиками открытого исходного кода, чтобы обеспечить бесплатное сканирование кода для широко используемых проектов, таких как Next.js, где исследователь безопасности использовал Codex для обнаружения уязвимостей, о которых стало известно на прошлой неделе (открывается в новом окне) .

В продолжение нашей программы грантов по кибербезопасности на сумму 1 млн долларов, запущенной в 2023 году, мы также выделяем 10 млн долларов в виде API-кредитов для ускорения киберзащиты с помощью наших наиболее эффективных моделей, особенно для программного обеспечения с открытым исходным кодом и систем критической инфраструктуры. Организации, занимающиеся добросовестными исследованиями в области безопасности, могут подать заявку на получение API-кредитов и поддержку в рамках нашей программы грантов по кибербезопасности .

Наличие и подробности

GPT-5.3-Codex доступен в рамках платных планов ChatGPT везде, где можно использовать Codex: в приложении, CLI, расширении IDE и веб-версии. Мы работаем над тем, чтобы в ближайшее время обеспечить безопасный доступ к API.

Благодаря этому обновлению, пользователи Codex теперь могут запускать GPT-5.3-Codex на 25% быстрее, что обусловлено улучшениями в нашей инфраструктуре и стеке обработки данных, приводящими к более быстрому взаимодействию и более быстрым результатам.

GPT-5.3-Codex был разработан, обучен и развернут на системах NVIDIA GB200 NVL72. Мы благодарны NVIDIA за партнерство.

Что дальше?

С GPT-5.3-Codex Codex выходит за рамки простого написания кода и начинает использовать его как инструмент для управления компьютером и выполнения работы от начала до конца. Расширяя границы возможностей программиста, мы также открываем более широкий спектр интеллектуальных задач — от создания и развертывания программного обеспечения до исследования, анализа и выполнения сложных задач. То, что начиналось как стремление стать лучшим программистом, стало основой для более универсального помощника на компьютере, расширяя как круг лиц, способных создавать код, так и возможности Codex.

Приложение

	GPT-5.3-Codex (xhigh)	GPT-5.2-Codex (xhigh)	GPT-5.2 (очень высокий)
SWE-Bench Pro (публичная версия)	56,8%	56,4%	55,6%
Терминальный стенд 2.0	77,3%	64,0%	62,2%
Проверено OSWorld	64,7%	38,2%	37,9%
ВВПval (победы или ничьи)	70,9%	—	70,9% (высокий)
Задания по кибербезопасности в игре «Захват флага»	77,6%	67,4%	67,7%
SWE-Lancer IC Diamond	81,4%	76,0%	74,6%

Источник: openai.com

Оцените материал:

Представляем GPT-5.3-Codex | OpenAI

Пограничные агентские возможности

Программирование

Веб-разработка

За пределами программирования

Подсказка + контекст задачи

Выход GPT-5.3-Codex

Интерактивный сотрудник

Как мы использовали Codex для обучения и развертывания GPT-5.3-Codex

Обеспечение безопасности киберпространства

Наличие и подробности

Что дальше?

Приложение

🤖 Нельсон AI

Гайды, руководства и полезные статьи

Пограничные агентские возможности

Программирование

Веб-разработка

За пределами программирования

Подсказка + контекст задачи

Выход GPT-5.3-Codex

Интерактивный сотрудник

Как мы использовали Codex для обучения и развертывания GPT-5.3-Codex

Обеспечение безопасности киберпространства

Наличие и подробности

Что дальше?

Приложение

Похожие записи

Похожие записи

Информационная псевдодебильность и цифровое слабоумие

Энтузиаст собрал систему в ящике под телевизором

Профессиональные медицинские ассоциации как катализаторы продвижения женщин в академической медицине и содействия их лидерству.

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email

🤖 Нельсон AI