Расширение сферы применения Кодекса на весь спектр профессиональной работы за компьютером.
Попробуйте в приложении Codex.
Мы представляем новую модель, которая раскрывает еще больший потенциал Codex: GPT-5.3-Codex, самая мощная на сегодняшний день модель агентного кодирования. Модель объединяет в себе передовые возможности кодирования GPT-5.2-Codex и возможности GPT-5.2 в области рассуждений и профессиональных знаний, и все это на 25% быстрее. Это позволяет ей справляться с длительными задачами, требующими исследований, использования инструментов и сложного выполнения. Подобно коллеге, вы можете управлять GPT-5.3-Codex и взаимодействовать с ней во время работы, не теряя контекста.
GPT-5.3-Codex — это наша первая модель, которая сама сыграла решающую роль в своем создании. Команда Codex использовала ранние версии для отладки собственного обучения, управления развертыванием, а также диагностики результатов тестирования и оценок — наша команда была поражена тем, насколько Codex смогла ускорить собственную разработку.
С GPT‑5.3‑Codex Codex превращается из агента, способного писать и проверять код, в агента, который может делать практически все, что разработчики и специалисты могут делать на компьютере.
Пограничные агентские возможности
GPT-5.3-Codex устанавливает новый отраслевой рекорд в SWE-Bench Pro и Terminal-Bench, а также демонстрирует высокие показатели в OSWorld и GDPval — четырех бенчмарках, которые мы используем для оценки возможностей программирования, работы агентов и реальных задач.
Программирование
GPT-5.3-Codex демонстрирует лучшие результаты в SWE-Bench Pro, строгой оценке реальных задач разработки программного обеспечения. В то время как SWE-bench Verified тестирует только Python, SWE-Bench Pro охватывает четыре языка и является более устойчивым к загрязнению, сложным, разнообразным и актуальным для отрасли. Он также значительно превосходит предыдущие лучшие результаты в Terminal-Bench 2.0, который измеряет навыки работы с терминалом, необходимые для работы с программным обеспечением, таким как Codex. Примечательно, что GPT-5.3-Codex делает это с меньшим количеством токенов, чем любая предыдущая модель, позволяя пользователям создавать больше кода.
Веб-разработка
Сочетание передовых возможностей программирования, улучшений в эстетике и компактизации приводит к созданию модели, способной на впечатляющие результаты, позволяя создавать высокофункциональные сложные игры и приложения с нуля в течение нескольких дней. Чтобы протестировать возможности модели в веб-разработке и долгосрочном агентском управлении, мы попросили GPT-5.3-Codex создать для нас две игры: вторую версию гоночной игры из запуска приложения Codex и игру о прыжках в воду. Используя навык разработки веб-игр и предварительно выбранные общие подсказки, такие как «исправить ошибку» или «улучшить игру», GPT-5.3-Codex автономно дорабатывал игры, обработав миллионы токенов. Посмотрите трейлеры и поиграйте в игры сами, чтобы увидеть, на что способен Codex.
Гоночная игра с разными гонщиками, восемью картами и даже предметами, которые можно использовать с помощью пробела. Попробуйте сами здесь (откроется в новом окне) !
Игра про дайвинг, в которой вы исследуете различные рифы, собираете их все, чтобы заполнить свой рыбный кодекс, при этом контролируя уровень кислорода, давление и справляясь с опасностями. Попробуйте сами здесь (откроется в новом окне) !
GPT-5.3-Codex также лучше понимает ваши намерения при создании сайтов для повседневной работы, по сравнению с GPT-5.2-Codex. Простые или недостаточно детализированные запросы теперь по умолчанию приводят к сайтам с большей функциональностью и разумными настройками, предоставляя вам более прочную основу для воплощения ваших идей в жизнь.
Например, мы попросили GPT-5.3-Codex и GPT-5.2-Codex создать две целевые страницы, показанные ниже. GPT-5.3-Codex автоматически отобразил годовой план как сниженную ежемесячную цену, благодаря чему скидка выглядела очевидной и преднамеренной, вместо того чтобы умножать годовую сумму. Он также автоматически создал карусель отзывов с тремя различными цитатами пользователей вместо одной, в результате чего страница по умолчанию выглядит более завершенной и готовой к использованию.
Задание: Создайте целевую страницу для Quiet KPI — удобного для основателей еженедельного обзора показателей. Эстетика: мягкий стиль SaaS, глянцевые карточки, градиент от лавандового до синего, легкое размытие. Разделы: заголовок с формой для сбора адресов электронной почты, сетка с примерами отчетов, строка интеграций, карусель отзывов, переключатель цен (ежемесячно или ежегодно), часто задаваемые вопросы, нижний колонтитул.
— Шрифт Satoshi или похожий геометрический без засечек.
— Кнопки с закругленными углами, радиус 14 пикселей, выраженные состояния фокуса.
— Добавить изящное всплывающее окно с эффектом прокрутки.
За пределами программирования
Программисты, дизайнеры, менеджеры по продуктам и специалисты по анализу данных делают гораздо больше, чем просто пишут код. GPT-5.3-Codex создан для поддержки всех этапов жизненного цикла программного обеспечения — отладки, развертывания, мониторинга, написания PRD (Product Document), редактирования текста, пользовательских исследований, тестирования, сбора метрик и многого другого. Его агентные возможности выходят за рамки разработки программного обеспечения, помогая вам создавать все, что вы захотите — будь то презентации или анализ данных в таблицах.
Благодаря использованию специализированных навыков, аналогичных тем, что применялись в наших предыдущих результатах GDPval, модель GPT-5.3-Codex также демонстрирует высокие показатели в профессиональной работе с интеллектуальным трудом, согласно оценке GDPval , сравнявшись с GPT-5.2. GDPval — это оценочный тест OpenAI, выпущенный в 2025 году, который измеряет производительность модели в четко определенных задачах, связанных с работой с интеллектуальным трудом, в 44 профессиях. Эти задачи включают в себя создание презентаций, электронных таблиц и других рабочих продуктов.
Ниже приведены несколько примеров работ, выполненных этим агентом.
Подсказка + контекст задачи
Вы — финансовый консультант в фирме по управлению активами. Вам стало известно, что многие клиенты вашей фирмы обращались к консультантам на местах с предложением перевести депозитные сертификаты в переменные аннуитеты через своих местных банкиров. Привлекательность рыночной доходности и гарантия получения ежемесячных выплат до конца жизни — очень заманчивое предложение, но это неразумное инвестиционное решение. Вам поручено создать презентацию PowerPoint из 10 слайдов, в которой будут изложены тезисы, почему финансовые консультанты, как доверенные лица, должны настоятельно рекомендовать воздержаться от принятия такого инвестиционного решения. Презентация, которая в конечном итоге будет представлена внутри компании консультантам на местах, должна освещать следующую информацию: • Сравнение различных характеристик депозитных сертификатов и переменных аннуитетов, предоставляемых FINRA, с целью повышения осторожности инвесторов; • Сравнение анализа риска и доходности, а также влияния на рост; • Различие в штрафных санкциях между двумя инструментами; • Сравнение допустимого уровня риска с акцентом на целесообразность, определяемую в соответствии с правилами NAIC по обеспечению наилучших интересов; • Выделение проблем/вопросов FINRA; • Выделение проблем/правил NAIC. NAIC и FINRA разработали руководящие принципы наилучших интересов и целесообразности при рекомендации переменных аннуитетов ввиду сложности этого продукта. Информация, представленная в презентации, подготовит консультантов к эффективному предоставлению разумных рекомендаций в наилучших интересах клиента. Пожалуйста, учитывайте следующие веб-источники при подготовке презентации: https://content.naic.org/sites/default/files/government-affairs-brief-annuity-suitability-best-interest-model.pdf https://www.finra.org/investors/insights/high-yield-cds
Выход GPT-5.3-Codex
Каждое задание в GDPval разработано опытным специалистом и отражает реальный опыт работы по специальности.
OSWorld — это тест производительности компьютера, в котором агент должен выполнять задачи повышения производительности в визуальной среде рабочего стола. GPT-5.3-Codex демонстрирует гораздо более высокие возможности использования компьютера, чем предыдущие модели GPT.
В OSWorld-Verified модели используют компьютерное зрение для выполнения различных задач. Человек набирает около 72%.
В совокупности эти результаты, полученные в ходе тестирования в области программирования, фронтенда, использования компьютеров и решения реальных задач, показывают, что GPT-5.3-Codex не просто лучше справляется с отдельными задачами, но и представляет собой качественный скачок в направлении создания единого универсального агента, способного рассуждать, создавать и выполнять задачи во всем спектре реальной технической работы.
Интерактивный сотрудник
По мере расширения возможностей модели разрыв смещается от того, на что способны агенты, к тому, насколько легко люди могут взаимодействовать с ними, направлять и контролировать их работу в параллельном режиме. Приложение Codex значительно упрощает управление агентами, а теперь, с GPT-5.3-Codex, делает этот процесс еще более интерактивным. Новая модель Codex предоставляет частые обновления, позволяя вам быть в курсе ключевых решений и прогресса в процессе работы. Вместо ожидания конечного результата вы можете взаимодействовать в режиме реального времени — задавать вопросы, обсуждать подходы и двигаться к решению. GPT-5.3-Codex комментирует свою работу, реагирует на обратную связь и держит вас в курсе от начала до конца.
Включить управление движением модели во время её работы в приложении можно в разделе «Настройки» > «Общие» > «Поведение при отслеживании».
Как мы использовали Codex для обучения и развертывания GPT-5.3-Codex
Недавние быстрые улучшения Codex основаны на результатах исследовательских проектов, длившихся месяцы или годы и охватывающих всю OpenAI. Codex ускоряет эти исследовательские проекты, и многие исследователи и инженеры OpenAI описывают свою работу сегодня как принципиально отличающуюся от той, что была всего два месяца назад. Даже ранние версии GPT-5.3-Codex продемонстрировали исключительные возможности, позволив нашей команде работать с этими более ранними версиями для улучшения обучения и поддержки развертывания более поздних версий.
Codex полезен для решения очень широкого спектра задач, поэтому перечислить все способы его использования нашими командами довольно сложно. В качестве примеров можно привести использование Codex исследовательской группой для мониторинга и отладки процесса обучения для этого релиза. Это ускорило исследования, выйдя за рамки отладки проблем инфраструктуры: помогло отслеживать закономерности на протяжении всего процесса обучения, обеспечило глубокий анализ качества взаимодействия, предложило решения и создало многофункциональные приложения для исследователей, позволяющие точно понять, чем поведение модели отличается от поведения предыдущих моделей.
Команда разработчиков использовала Codex для оптимизации и адаптации программного обеспечения для GPT-5.3-Codex. Когда мы начали сталкиваться со странными крайними случаями, влияющими на пользователей, члены команды использовали Codex для выявления ошибок рендеринга контекста и определения первопричины низкого уровня попаданий в кэш. GPT-5.3-Codex продолжает помогать команде на протяжении всего запуска, динамически масштабируя кластеры GPU для адаптации к всплескам трафика и поддержания стабильной задержки.
В ходе альфа-тестирования один из исследователей хотел понять, какой дополнительный объем работы выполняет GPT-5.3-Codex за ход и какова соответствующая разница в производительности. GPT-5.3-Codex разработал несколько простых классификаторов на основе регулярных выражений для оценки частоты уточнений, положительных и отрицательных ответов пользователей, прогресса в выполнении задачи, а затем масштабированно применил их ко всем журналам сессий и выдал отчет с выводами. Пользователи, работавшие с Codex, были более довольны, поскольку агент лучше понимал их намерения и добивался большего прогресса за ход, задавая меньше уточняющих вопросов.
Из-за существенных отличий GPT-5.3-Codex от своих предшественников, данные альфа-тестирования показали множество необычных и противоречащих интуиции результатов. Специалист по анализу данных из нашей команды работал с GPT-5.3-Codex над созданием новых конвейеров обработки данных и визуализацией результатов, которая оказалась гораздо более наглядной, чем это позволяли наши стандартные инструменты для создания дашбордов. Результаты были проанализированы совместно с Codex, который кратко и за три минуты обобщил ключевые выводы по тысячам точек данных.
В отдельности все эти задачи являются интересными примерами того, как Codex может помочь исследователям и разработчикам продуктов. В совокупности же мы обнаружили, что эти новые возможности привели к значительному ускорению работы наших исследовательских, инженерных и продуктовых команд.
Обеспечение безопасности киберпространства
В последние месяцы мы наблюдаем значительное улучшение производительности моделей в задачах кибербезопасности, что приносит пользу как разработчикам, так и специалистам по безопасности. Параллельно мы готовим усиленные меры киберзащиты для поддержки оборонительного использования и повышения устойчивости всей экосистемы.
GPT-5.3-Codex — это первая модель, которую мы классифицируем как высокоэффективную для задач, связанных с кибербезопасностью, в рамках нашей системы обеспечения готовности , и первая, которую мы непосредственно обучили выявлять уязвимости программного обеспечения. Хотя у нас нет убедительных доказательств того, что она может автоматизировать кибератаки от начала до конца, мы придерживаемся превентивного подхода и развертываем наш самый полный на сегодняшний день комплекс мер кибербезопасности. Наши меры включают обучение технике безопасности, автоматизированный мониторинг, доверенный доступ к расширенным возможностям и механизмы обеспечения соблюдения требований, включая анализ угроз.
Поскольку кибербезопасность по своей сути является сферой двойного назначения, мы применяем основанный на фактических данных итеративный подход, который ускоряет способность защитников находить и устранять уязвимости, одновременно замедляя злоупотребления. В рамках этого мы запускаем пилотную программу Trusted Access for Cyber , направленную на ускорение исследований в области киберзащиты.
Чтобы предотвратить злоупотребления, некоторые запросы, которые наши системы определяют как имеющие повышенный киберриск, могут автоматически перенаправляться из GPT-5.3-Codex в GPT-5.2. Мы продолжаем совершенствовать эти меры защиты. Разработчики, проводящие исследования в области безопасности или считающие, что их запросы были неправильно классифицированы, могут подать заявку на полный доступ через нашу программу «Доверенный доступ для кибербезопасности» или сообщить о проблеме с помощью команды /feedback.
Мы инвестируем в защиту экосистемы, например, расширяем закрытое бета-тестирование Aardvark , нашего агента для исследований в области безопасности, который станет первым продуктом в нашем наборе продуктов и инструментов Codex Security, а также сотрудничаем с разработчиками открытого исходного кода, чтобы обеспечить бесплатное сканирование кода для широко используемых проектов, таких как Next.js, где исследователь безопасности использовал Codex для обнаружения уязвимостей, о которых стало известно на прошлой неделе (открывается в новом окне) .
В продолжение нашей программы грантов по кибербезопасности на сумму 1 млн долларов, запущенной в 2023 году, мы также выделяем 10 млн долларов в виде API-кредитов для ускорения киберзащиты с помощью наших наиболее эффективных моделей, особенно для программного обеспечения с открытым исходным кодом и систем критической инфраструктуры. Организации, занимающиеся добросовестными исследованиями в области безопасности, могут подать заявку на получение API-кредитов и поддержку в рамках нашей программы грантов по кибербезопасности .
Наличие и подробности
GPT-5.3-Codex доступен в рамках платных планов ChatGPT везде, где можно использовать Codex: в приложении, CLI, расширении IDE и веб-версии. Мы работаем над тем, чтобы в ближайшее время обеспечить безопасный доступ к API.
Благодаря этому обновлению, пользователи Codex теперь могут запускать GPT-5.3-Codex на 25% быстрее, что обусловлено улучшениями в нашей инфраструктуре и стеке обработки данных, приводящими к более быстрому взаимодействию и более быстрым результатам.
GPT-5.3-Codex был разработан, обучен и развернут на системах NVIDIA GB200 NVL72. Мы благодарны NVIDIA за партнерство.
Что дальше?
С GPT-5.3-Codex Codex выходит за рамки простого написания кода и начинает использовать его как инструмент для управления компьютером и выполнения работы от начала до конца. Расширяя границы возможностей программиста, мы также открываем более широкий спектр интеллектуальных задач — от создания и развертывания программного обеспечения до исследования, анализа и выполнения сложных задач. То, что начиналось как стремление стать лучшим программистом, стало основой для более универсального помощника на компьютере, расширяя как круг лиц, способных создавать код, так и возможности Codex.
Приложение
GPT-5.3-Codex (xhigh) | GPT-5.2-Codex (xhigh) | GPT-5.2 (очень высокий) | |
SWE-Bench Pro (публичная версия) | 56,8% | 56,4% | 55,6% |
Терминальный стенд 2.0 | 77,3% | 64,0% | 62,2% |
Проверено OSWorld | 64,7% | 38,2% | 37,9% |
ВВПval (победы или ничьи) | 70,9% | — | 70,9% (высокий) |
Задания по кибербезопасности в игре «Захват флага» | 77,6% | 67,4% | 67,7% |
SWE-Lancer IC Diamond | 81,4% | 76,0% | 74,6% |
Источник: openai.com


![⚡️ VPN в России может работать медленнее: популярные сервисы заявляют,... 2 Кадр из фильма с мужчиной в форме, текст: "Вы ведь включали сегодня [ценз], верно?"](https://ideipro.ru/wp-content/uploads/2026/03/file_1882.jpg)



















