Сравнение штрафов за досрочное снятие: график и пояснения.

Представляем GPT-5.3-Codex | OpenAI

Расширение сферы применения Кодекса на весь спектр профессиональной работы за компьютером.

Попробуйте в приложении Codex.

Мы представляем новую модель, которая раскрывает еще больший потенциал Codex: GPT-5.3-Codex, самая мощная на сегодняшний день модель агентного кодирования. Модель объединяет в себе передовые возможности кодирования GPT-5.2-Codex и возможности GPT-5.2 в области рассуждений и профессиональных знаний, и все это на 25% быстрее. Это позволяет ей справляться с длительными задачами, требующими исследований, использования инструментов и сложного выполнения. Подобно коллеге, вы можете управлять GPT-5.3-Codex и взаимодействовать с ней во время работы, не теряя контекста.

GPT-5.3-Codex — это наша первая модель, которая сама сыграла решающую роль в своем создании. Команда Codex использовала ранние версии для отладки собственного обучения, управления развертыванием, а также диагностики результатов тестирования и оценок — наша команда была поражена тем, насколько Codex смогла ускорить собственную разработку.

С GPT‑5.3‑Codex Codex превращается из агента, способного писать и проверять код, в агента, который может делать практически все, что разработчики и специалисты могут делать на компьютере.

Пограничные агентские возможности

GPT-5.3-Codex устанавливает новый отраслевой рекорд в SWE-Bench Pro и Terminal-Bench, а также демонстрирует высокие показатели в OSWorld и GDPval — четырех бенчмарках, которые мы используем для оценки возможностей программирования, работы агентов и реальных задач.

Программирование

GPT-5.3-Codex демонстрирует лучшие результаты в SWE-Bench Pro, строгой оценке реальных задач разработки программного обеспечения. В то время как SWE-bench Verified тестирует только Python, SWE-Bench Pro охватывает четыре языка и является более устойчивым к загрязнению, сложным, разнообразным и актуальным для отрасли. Он также значительно превосходит предыдущие лучшие результаты в Terminal-Bench 2.0, который измеряет навыки работы с терминалом, необходимые для работы с программным обеспечением, таким как Codex. Примечательно, что GPT-5.3-Codex делает это с меньшим количеством токенов, чем любая предыдущая модель, позволяя пользователям создавать больше кода.

Веб-разработка

Сочетание передовых возможностей программирования, улучшений в эстетике и компактизации приводит к созданию модели, способной на впечатляющие результаты, позволяя создавать высокофункциональные сложные игры и приложения с нуля в течение нескольких дней. Чтобы протестировать возможности модели в веб-разработке и долгосрочном агентском управлении, мы попросили GPT-5.3-Codex создать для нас две игры: вторую версию гоночной игры из запуска приложения Codex и игру о прыжках в воду. Используя навык разработки веб-игр и предварительно выбранные общие подсказки, такие как «исправить ошибку» или «улучшить игру», GPT-5.3-Codex автономно дорабатывал игры, обработав миллионы токенов. Посмотрите трейлеры и поиграйте в игры сами, чтобы увидеть, на что способен Codex.

Гоночная игра с разными гонщиками, восемью картами и даже предметами, которые можно использовать с помощью пробела. Попробуйте сами здесь (откроется в новом окне) !

Игра про дайвинг, в которой вы исследуете различные рифы, собираете их все, чтобы заполнить свой рыбный кодекс, при этом контролируя уровень кислорода, давление и справляясь с опасностями. Попробуйте сами здесь (откроется в новом окне) !

GPT-5.3-Codex также лучше понимает ваши намерения при создании сайтов для повседневной работы, по сравнению с GPT-5.2-Codex. Простые или недостаточно детализированные запросы теперь по умолчанию приводят к сайтам с большей функциональностью и разумными настройками, предоставляя вам более прочную основу для воплощения ваших идей в жизнь.

Например, мы попросили GPT-5.3-Codex и GPT-5.2-Codex создать две целевые страницы, показанные ниже. GPT-5.3-Codex автоматически отобразил годовой план как сниженную ежемесячную цену, благодаря чему скидка выглядела очевидной и преднамеренной, вместо того чтобы умножать годовую сумму. Он также автоматически создал карусель отзывов с тремя различными цитатами пользователей вместо одной, в результате чего страница по умолчанию выглядит более завершенной и готовой к использованию.

Задание: Создайте целевую страницу для Quiet KPI — удобного для основателей еженедельного обзора показателей. Эстетика: мягкий стиль SaaS, глянцевые карточки, градиент от лавандового до синего, легкое размытие. Разделы: заголовок с формой для сбора адресов электронной почты, сетка с примерами отчетов, строка интеграций, карусель отзывов, переключатель цен (ежемесячно или ежегодно), часто задаваемые вопросы, нижний колонтитул.
— Шрифт Satoshi или похожий геометрический без засечек.
— Кнопки с закругленными углами, радиус 14 пикселей, выраженные состояния фокуса.
— Добавить изящное всплывающее окно с эффектом прокрутки.

За пределами программирования

Программисты, дизайнеры, менеджеры по продуктам и специалисты по анализу данных делают гораздо больше, чем просто пишут код. GPT-5.3-Codex создан для поддержки всех этапов жизненного цикла программного обеспечения — отладки, развертывания, мониторинга, написания PRD (Product Document), редактирования текста, пользовательских исследований, тестирования, сбора метрик и многого другого. Его агентные возможности выходят за рамки разработки программного обеспечения, помогая вам создавать все, что вы захотите — будь то презентации или анализ данных в таблицах.

Благодаря использованию специализированных навыков, аналогичных тем, что применялись в наших предыдущих результатах GDPval, модель GPT-5.3-Codex также демонстрирует высокие показатели в профессиональной работе с интеллектуальным трудом, согласно оценке GDPval , сравнявшись с GPT-5.2. GDPval — это оценочный тест OpenAI, выпущенный в 2025 году, который измеряет производительность модели в четко определенных задачах, связанных с работой с интеллектуальным трудом, в 44 профессиях. Эти задачи включают в себя создание презентаций, электронных таблиц и других рабочих продуктов.

Ниже приведены несколько примеров работ, выполненных этим агентом.

Подсказка + контекст задачи

Вы — финансовый консультант в фирме по управлению активами. Вам стало известно, что многие клиенты вашей фирмы обращались к консультантам на местах с предложением перевести депозитные сертификаты в переменные аннуитеты через своих местных банкиров. Привлекательность рыночной доходности и гарантия получения ежемесячных выплат до конца жизни — очень заманчивое предложение, но это неразумное инвестиционное решение. Вам поручено создать презентацию PowerPoint из 10 слайдов, в которой будут изложены тезисы, почему финансовые консультанты, как доверенные лица, должны настоятельно рекомендовать воздержаться от принятия такого инвестиционного решения. Презентация, которая в конечном итоге будет представлена внутри компании консультантам на местах, должна освещать следующую информацию: • Сравнение различных характеристик депозитных сертификатов и переменных аннуитетов, предоставляемых FINRA, с целью повышения осторожности инвесторов; • Сравнение анализа риска и доходности, а также влияния на рост; • Различие в штрафных санкциях между двумя инструментами; • Сравнение допустимого уровня риска с акцентом на целесообразность, определяемую в соответствии с правилами NAIC по обеспечению наилучших интересов; • Выделение проблем/вопросов FINRA; • Выделение проблем/правил NAIC. NAIC и FINRA разработали руководящие принципы наилучших интересов и целесообразности при рекомендации переменных аннуитетов ввиду сложности этого продукта. Информация, представленная в презентации, подготовит консультантов к эффективному предоставлению разумных рекомендаций в наилучших интересах клиента. Пожалуйста, учитывайте следующие веб-источники при подготовке презентации: https://content.naic.org/sites/default/files/government-affairs-brief-annuity-suitability-best-interest-model.pdf https://www.finra.org/investors/insights/high-yield-cds

Выход GPT-5.3-Codex

0b4c9237266b34a233ecf2646396cd44 Каждое задание в GDPval разработано опытным специалистом и отражает реальный опыт работы по специальности.

OSWorld — это тест производительности компьютера, в котором агент должен выполнять задачи повышения производительности в визуальной среде рабочего стола. GPT-5.3-Codex демонстрирует гораздо более высокие возможности использования компьютера, чем предыдущие модели GPT.

В OSWorld-Verified модели используют компьютерное зрение для выполнения различных задач. Человек набирает около 72%.

В совокупности эти результаты, полученные в ходе тестирования в области программирования, фронтенда, использования компьютеров и решения реальных задач, показывают, что GPT-5.3-Codex не просто лучше справляется с отдельными задачами, но и представляет собой качественный скачок в направлении создания единого универсального агента, способного рассуждать, создавать и выполнять задачи во всем спектре реальной технической работы.

Интерактивный сотрудник

По мере расширения возможностей модели разрыв смещается от того, на что способны агенты, к тому, насколько легко люди могут взаимодействовать с ними, направлять и контролировать их работу в параллельном режиме. Приложение Codex значительно упрощает управление агентами, а теперь, с GPT-5.3-Codex, делает этот процесс еще более интерактивным. Новая модель Codex предоставляет частые обновления, позволяя вам быть в курсе ключевых решений и прогресса в процессе работы. Вместо ожидания конечного результата вы можете взаимодействовать в режиме реального времени — задавать вопросы, обсуждать подходы и двигаться к решению. GPT-5.3-Codex комментирует свою работу, реагирует на обратную связь и держит вас в курсе от начала до конца.

Включить управление движением модели во время её работы в приложении можно в разделе «Настройки» > «Общие» > «Поведение при отслеживании».

Как мы использовали Codex для обучения и развертывания GPT-5.3-Codex

Недавние быстрые улучшения Codex основаны на результатах исследовательских проектов, длившихся месяцы или годы и охватывающих всю OpenAI. Codex ускоряет эти исследовательские проекты, и многие исследователи и инженеры OpenAI описывают свою работу сегодня как принципиально отличающуюся от той, что была всего два месяца назад. Даже ранние версии GPT-5.3-Codex продемонстрировали исключительные возможности, позволив нашей команде работать с этими более ранними версиями для улучшения обучения и поддержки развертывания более поздних версий.

Codex полезен для решения очень широкого спектра задач, поэтому перечислить все способы его использования нашими командами довольно сложно. В качестве примеров можно привести использование Codex исследовательской группой для мониторинга и отладки процесса обучения для этого релиза. Это ускорило исследования, выйдя за рамки отладки проблем инфраструктуры: помогло отслеживать закономерности на протяжении всего процесса обучения, обеспечило глубокий анализ качества взаимодействия, предложило решения и создало многофункциональные приложения для исследователей, позволяющие точно понять, чем поведение модели отличается от поведения предыдущих моделей.

Команда разработчиков использовала Codex для оптимизации и адаптации программного обеспечения для GPT-5.3-Codex. Когда мы начали сталкиваться со странными крайними случаями, влияющими на пользователей, члены команды использовали Codex для выявления ошибок рендеринга контекста и определения первопричины низкого уровня попаданий в кэш. GPT-5.3-Codex продолжает помогать команде на протяжении всего запуска, динамически масштабируя кластеры GPU для адаптации к всплескам трафика и поддержания стабильной задержки.

В ходе альфа-тестирования один из исследователей хотел понять, какой дополнительный объем работы выполняет GPT-5.3-Codex за ход и какова соответствующая разница в производительности. GPT-5.3-Codex разработал несколько простых классификаторов на основе регулярных выражений для оценки частоты уточнений, положительных и отрицательных ответов пользователей, прогресса в выполнении задачи, а затем масштабированно применил их ко всем журналам сессий и выдал отчет с выводами. Пользователи, работавшие с Codex, были более довольны, поскольку агент лучше понимал их намерения и добивался большего прогресса за ход, задавая меньше уточняющих вопросов.

Из-за существенных отличий GPT-5.3-Codex от своих предшественников, данные альфа-тестирования показали множество необычных и противоречащих интуиции результатов. Специалист по анализу данных из нашей команды работал с GPT-5.3-Codex над созданием новых конвейеров обработки данных и визуализацией результатов, которая оказалась гораздо более наглядной, чем это позволяли наши стандартные инструменты для создания дашбордов. Результаты были проанализированы совместно с Codex, который кратко и за три минуты обобщил ключевые выводы по тысячам точек данных.

В отдельности все эти задачи являются интересными примерами того, как Codex может помочь исследователям и разработчикам продуктов. В совокупности же мы обнаружили, что эти новые возможности привели к значительному ускорению работы наших исследовательских, инженерных и продуктовых команд.

Обеспечение безопасности киберпространства

В последние месяцы мы наблюдаем значительное улучшение производительности моделей в задачах кибербезопасности, что приносит пользу как разработчикам, так и специалистам по безопасности. Параллельно мы готовим усиленные меры киберзащиты для поддержки оборонительного использования и повышения устойчивости всей экосистемы.

GPT-5.3-Codex — это первая модель, которую мы классифицируем как высокоэффективную для задач, связанных с кибербезопасностью, в рамках нашей системы обеспечения готовности , и первая, которую мы непосредственно обучили выявлять уязвимости программного обеспечения. Хотя у нас нет убедительных доказательств того, что она может автоматизировать кибератаки от начала до конца, мы придерживаемся превентивного подхода и развертываем наш самый полный на сегодняшний день комплекс мер кибербезопасности. Наши меры включают обучение технике безопасности, автоматизированный мониторинг, доверенный доступ к расширенным возможностям и механизмы обеспечения соблюдения требований, включая анализ угроз.

Поскольку кибербезопасность по своей сути является сферой двойного назначения, мы применяем основанный на фактических данных итеративный подход, который ускоряет способность защитников находить и устранять уязвимости, одновременно замедляя злоупотребления. В рамках этого мы запускаем пилотную программу Trusted Access for Cyber , направленную на ускорение исследований в области киберзащиты.

Чтобы предотвратить злоупотребления, некоторые запросы, которые наши системы определяют как имеющие повышенный киберриск, могут автоматически перенаправляться из GPT-5.3-Codex в GPT-5.2. Мы продолжаем совершенствовать эти меры защиты. Разработчики, проводящие исследования в области безопасности или считающие, что их запросы были неправильно классифицированы, могут подать заявку на полный доступ через нашу программу «Доверенный доступ для кибербезопасности» или сообщить о проблеме с помощью команды /feedback.

Мы инвестируем в защиту экосистемы, например, расширяем закрытое бета-тестирование Aardvark , нашего агента для исследований в области безопасности, который станет первым продуктом в нашем наборе продуктов и инструментов Codex Security, а также сотрудничаем с разработчиками открытого исходного кода, чтобы обеспечить бесплатное сканирование кода для широко используемых проектов, таких как Next.js, где исследователь безопасности использовал Codex для обнаружения уязвимостей, о которых стало известно на прошлой неделе (открывается в новом окне) .

В продолжение нашей программы грантов по кибербезопасности на сумму 1 млн долларов, запущенной в 2023 году, мы также выделяем 10 млн долларов в виде API-кредитов для ускорения киберзащиты с помощью наших наиболее эффективных моделей, особенно для программного обеспечения с открытым исходным кодом и систем критической инфраструктуры. Организации, занимающиеся добросовестными исследованиями в области безопасности, могут подать заявку на получение API-кредитов и поддержку в рамках нашей программы грантов по кибербезопасности .

Наличие и подробности

GPT-5.3-Codex доступен в рамках платных планов ChatGPT везде, где можно использовать Codex: в приложении, CLI, расширении IDE и веб-версии. Мы работаем над тем, чтобы в ближайшее время обеспечить безопасный доступ к API.

Благодаря этому обновлению, пользователи Codex теперь могут запускать GPT-5.3-Codex на 25% быстрее, что обусловлено улучшениями в нашей инфраструктуре и стеке обработки данных, приводящими к более быстрому взаимодействию и более быстрым результатам.

GPT-5.3-Codex был разработан, обучен и развернут на системах NVIDIA GB200 NVL72. Мы благодарны NVIDIA за партнерство.

Что дальше?

С GPT-5.3-Codex Codex выходит за рамки простого написания кода и начинает использовать его как инструмент для управления компьютером и выполнения работы от начала до конца. Расширяя границы возможностей программиста, мы также открываем более широкий спектр интеллектуальных задач — от создания и развертывания программного обеспечения до исследования, анализа и выполнения сложных задач. То, что начиналось как стремление стать лучшим программистом, стало основой для более универсального помощника на компьютере, расширяя как круг лиц, способных создавать код, так и возможности Codex.

Приложение

GPT-5.3-Codex (xhigh)

GPT-5.2-Codex (xhigh)

GPT-5.2 (очень высокий)

SWE-Bench Pro (публичная версия)

56,8%

56,4%

55,6%

Терминальный стенд 2.0

77,3%

64,0%

62,2%

Проверено OSWorld

64,7%

38,2%

37,9%

ВВПval (победы или ничьи)

70,9%

70,9% (высокий)

Задания по кибербезопасности в игре «Захват флага»

77,6%

67,4%

67,7%

SWE-Lancer IC Diamond

81,4%

76,0%

74,6%

Источник: openai.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»
СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»
Биофизический мир внутри переполненной клетки
Появились новые доказательства того, как одиночество влияет на память в пожилом возрасте.
NVIDIA ReSTIR PR Enhanced повышает производительность трассировки пути в три раза
«Слишком сложно и дорого»: могли ли американцы сымитировать полет к Луне с помощью ИИ
«Слишком сложно и дорого»: могли ли американцы сымитировать полет к Луне с помощью ИИ
L-эрготиоин: антиоксидант, содержащийся в грибах, может воздействовать на клетки матки, облегчая менструальные боли.
L-эрготиоин: антиоксидант, содержащийся в грибах, может воздействовать на клетки матки, облегчая менструальные боли.
Image Not Found
СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»

СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»

19 февраля 2026 года прошло заседание Методического совета, посвященное теме «“Рожденные цифровыми” как субъекты учения: специфика и ее учет в преподавании». В мероприятии участвовали члены Методсовета, проректор по учебной работе, начальник УМУ, а также коллеги с филологического,…

Апр 21, 2026
СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»

СОСТОЯЛОСЬ ЗАСЕДАНИЕ МЕТОДИЧЕСКОГО СОВЕТА, ПОСВЯЩЕННОЕ ПОКОЛЕНИЮ «РОЖДЕННЫХ ЦИФРОВЫМИ»

19 февраля 2026 года прошло заседание Методического совета, посвященное теме «“Рожденные цифровыми” как субъекты учения: специфика и ее учет в преподавании». В мероприятии участвовали члены Методсовета, проректор по учебной работе, начальник УМУ, а также коллеги с филологического,…

Апр 21, 2026
NVIDIA ReSTIR PR Enhanced повышает производительность трассировки пути в три раза

NVIDIA ReSTIR PR Enhanced повышает производительность трассировки пути в три раза

Исследователи NVIDIA пытаются найти способы повысить производительность ресурсозатратной трассировки пути, которая по сей день остаётся очень тяжёлой нагрузкой даже для лучших игровых видеокарт. К счастью, им удалось найти один из вариантов, как можно не только поднять FPS,…

Апр 21, 2026
Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.

Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.

Однако ей не удалось доставить полезную нагрузку с космической вышки сотовой связи. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых