ideipro logotyp

Представляем GPT-5.4 mini и nano | OpenAI

Быстрые и эффективные модели, оптимизированные для программирования и работы с субагентами.

Сегодня мы выпускаем GPT-5.4 mini и nano — наши самые функциональные компактные модели на сегодняшний день. Они сочетают в себе многие преимущества GPT-5.4 и более быстрые и эффективные модели, разработанные для обработки больших объемов данных.

GPT-5.4 mini значительно превосходит GPT-5 mini по таким параметрам, как программирование, логическое мышление, многомодальное понимание и использование инструментов, при этом работая более чем в 2 раза быстрее. Он также приближается к производительности более крупной модели GPT-5.4 в нескольких тестах, включая SWE-Bench Pro и OSWorld-Verified.

GPT-5.4 nano — это самая компактная и дешевая версия GPT-5.4 для задач, где скорость и стоимость имеют первостепенное значение. Это также значительное улучшение по сравнению с GPT-5 nano. Мы рекомендуем её для классификации, извлечения данных, ранжирования и кодирования субагентов, выполняющих более простые вспомогательные задачи.

Эти модели созданы для тех типов рабочих нагрузок, где задержка напрямую влияет на пользовательский опыт: помощники по программированию, которым необходимо быстро реагировать, субагенты, быстро выполняющие вспомогательные задачи, компьютерные системы, которые захватывают и интерпретируют скриншоты, и мультимодальные приложения, способные анализировать изображения в режиме реального времени. В таких условиях наилучшей моделью часто является не самая большая, а та, которая может быстро реагировать, надежно использовать инструменты и при этом хорошо справляться со сложными профессиональными задачами.

GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 мини (высокий¹)
SWE-Bench Pro (публичная версия)57,7% 54,4% 52,4%45,7%
Терминальный стенд 2.075,1% 60,0% 46,3%38,2%
Туатлон54,6% 42,9% 35,5%26,9%
GPQA Diamond93,0% 88,0% 82,8%81,6%
Проверено OSWorld75,0% 72,1% 39,0%42,0%

1. Максимально возможное усилие, затрачиваемое на рассуждения в GPT-5 mini, составляет 'high'.

Вот что думают наши клиенты после тестирования GPT-5.4 mini и nano в своих рабочих процессах:

«GPT-5.4 mini демонстрирует высокую производительность на всех этапах для модели этого класса. В наших оценках она сравнялась или превзошла конкурирующие модели по нескольким задачам вывода и точности определения источников при значительно меньших затратах. Она также достигла более высоких показателей успешного выполнения сквозных задач и более точной идентификации источников, чем более крупная модель GPT-5.4».

— Аабхас Шарма, технический директор Hebbia

Программирование

Модели GPT-5.4 mini и nano особенно эффективны в процессах кодирования, требующих быстрой итерации. Они с низкой задержкой обрабатывают целевые правки, навигацию по кодовой базе, генерацию фронтенда и циклы отладки, что делает их идеальным выбором для задач кодирования, требующих более быстрого и экономичного выполнения.

В тестах производительности GPT-5.4 mini стабильно превосходит GPT-5-mini при аналогичных задержках и приближается к показателям прохождения тестов на уровне GPT-5.4, работая при этом значительно быстрее, обеспечивая один из самых выгодных компромиссов между производительностью и задержкой для рабочих процессов программирования.

Мы оцениваем задержку, анализируя поведение наших моделей в производственной среде и моделируя это в автономном режиме. Оценка задержки учитывает длительность вызова инструмента (время выполнения кода), количество выбранных токенов и количество входных токенов. Реальная задержка может существенно отличаться и зависит от многих факторов, не учтенных в нашем моделировании. Аналогично, стоимость оценивается на основе цен на API этих моделей на момент написания. Стоимость может измениться в будущем. Рассуждения были сдвинуты от низкого к очень высокому уровню.

Субагенты

GPT-5.4 mini также отлично подходит для систем, объединяющих модели разных размеров. Например, в Codex более крупная модель, такая как GPT-5.4, может обрабатывать планирование, координацию и вынесение окончательного решения, делегируя субагентам GPT-5.4 mini выполнение более узких подзадач параллельно — таких как поиск в кодовой базе, анализ большого файла или обработка вспомогательных документов. Подробнее о работе субагентов в Codex можно узнать в документации (откроется в новом окне) .

Этот подход становится всё более полезным по мере того, как меньшие модели становятся быстрее и функциональнее. Вместо использования одной модели для всего, разработчики могут создавать системы, в которых большие модели определяют, что делать, а меньшие модели быстро выполняют задачи в масштабе. GPT-5.4 mini — наша самая мощная мини-модель для такого стиля работы.

Использование компьютера

GPT-5.4 mini также демонстрирует высокие результаты в многомодальных задачах, особенно связанных с использованием компьютера. Модель может быстро интерпретировать скриншоты сложных пользовательских интерфейсов для оперативного выполнения задач, связанных с работой за компьютером. По данным OSWorld-Verified, GPT-5.4 mini приближается к GPT-5.4, при этом значительно превосходя GPT-5 mini.

Наличие и цены

GPT-5.4 mini доступен уже сегодня в API, Codex и ChatGPT.

В API GPT-5.4 mini поддерживаются ввод текста и изображений, использование инструментов, вызов функций, веб-поиск, поиск файлов, использование компьютера и навыки. Он имеет контекстное окно на 400 000 символов и стоит 0,75 доллара за 1 миллион входных токенов и 4,50 доллара за 1 миллион выходных токенов.

В Codex GPT-5.4 mini доступен во всех приложениях Codex, CLI, расширениях IDE и веб-интерфейсе. Он использует всего 30% квоты GPT-5.4, позволяя разработчикам быстро справляться с более простыми задачами кодирования в Codex примерно за треть стоимости. Codex также может делегировать задачи субагентам GPT-5.4 mini, чтобы менее ресурсоемкие задачи выполнялись на более дешевой модели.

В ChatGPT GPT-5.4 mini доступен пользователям Free и Go через функцию «Thinking» в меню «+». Для всех остальных пользователей GPT-5.4 mini доступен в качестве резервного варианта для ограничения скорости запросов к GPT-5.4 Thinking.

GPT-5.4 nano доступен только через API и стоит 0,20 доллара США за 1 миллион входных токенов и 1,25 доллара США за 1 миллион выходных токенов.

Для получения более подробной информации о мерах безопасности моделей, пожалуйста, ознакомьтесь с дополнением к системной карте на нашем портале безопасности развертывания (откроется в новом окне) .

Программирование
GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 mini (high¹)
SWE-bench Pro (публичная версия)57,7% 54,4% 52,4%45,7%
Терминальный стенд 2.075,1% 60,0% 46,3%38,2%
Вызов инструментов
GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 мини (высокий¹)
Атлас MCP67,2% 57,7% 56,1%47,6%
Туатлон54,6% 42,9% 35,5%26,9%
τ2-стенд (телекоммуникации)98,9% 93,4% 92,5%74,1%
Интеллект
GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 mini (high¹)
GPQA Diamond93,0% 88,0% 82,8%81,6%
HLE с инструментом52,1% 41,5% 37,7%31,6%
HLE без инструментов39,8% 28,2% 24,3%18,3%
MM / Vision / CUA
GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 mini (high¹)
Проверено OSWorld75,0% 72,1% 39,0%42,0%
MMMUPro с Python81,5% 78,0% 69,5%74,1%
MMMUPro81,2% 76,6% 66,1%67,5%
OmniDocBench 1.5 (без инструментов)² — чем меньше, тем лучше.0.109 0.1263 0.2419 0.1791
Длинный контекст
GPT-5.4 (очень высокий) GPT-5.4 mini (xhigh) GPT-5.4 nano (xhigh) GPT-5 мини (высокий¹)
OpenAI MRCR v2 8-игольный 64K–128K86,0% 47,7% 44,2%35,1%
OpenAI MRCR v2 8-игольный 128K–256K79,3% 33,6% 33,1%19,4%
Graphwalks BFS 0K–128K93,1% 76,3% 73,4%73,4%
Graphwalks parents 0–128K (точность)89,8% 71,5% 50,8%64,3%

1. Максимально возможное усилие, затрачиваемое на рассуждения в GPT-5 mini, составляет 'high'.

2. Общее расстояние редактирования. OmniDocBench был запущен с параметром reasoning_effort, установленным на 'none', чтобы отразить производительность с низкими затратами и низкой задержкой.

Источник: openai.com

✅ Найденные теги: GPT-5.4, Mini, Nano, OpenAI, новости, Представляем

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Вулканический кратер с бирюзовой водой, вид с высоты в океане.
Столкновение планет в космосе, вспышка огня и метеориты, разрушение и космический катаклизм.
Исследователь в лаборатории перед компьютером, научное оборудование на заднем плане.
Компьютер с круглым устройством и смартфоном на белом фоне, обмен данными.
Всё о функциональности цепочки методов в Pyjanitor и почему она полезна.
Корея проведет пилотный проект по внедрению телемедицины на основе искусственного интеллекта в Индонезии.
Акробат в костюме выступает на сцене цирка между яркими оранжевыми конструкциями.
MHRA выделяет 4,8 млн долларов на расширение программы по разработке медицинских устройств на основе искусственного интеллекта.
ideipro logotyp
Image Not Found
Исследователь в лаборатории перед компьютером, научное оборудование на заднем плане.

Уральские астрохимики создали спектральную библиотеку для анализа данных крупнейшего космического телескопа

Первый автор статьи — лаборант-исследователь научной лаборатории астрохимических исследований УрФУ Варвара Картеева © Антон Васюнин / УрФУ. Ученые в лаборатории воссоздали содержащие метан межзвездные льды, которые широко наблюдаются в космическом пространстве, и впервые получили их инфракрасные «отпечатки»…

Апр 9, 2026
Компьютер с круглым устройством и смартфоном на белом фоне, обмен данными.

Мини-ПК нового формата: что умеет Lenovo Yoga Mini i Gen 11

Компактный настольный компьютер Yoga Mini i Gen 11 от Lenovo, впервые показанный на CES 2026, готовится к глобальному запуску и делает ставку на необычный форм-фактор.  Устройство выполнено в круглом алюминиевом корпусе с аккуратной полировкой оттенка «морская раковина»…

Апр 9, 2026
Всё о функциональности цепочки методов в Pyjanitor и почему она полезна.

Всё о функциональности цепочки методов в Pyjanitor и почему она полезна.

Чистый код, чистые данные: почему подход Pyjanitor к цепочке методов — это путь к достижению этой двойной цели. Изображение предоставлено редактором. # Введение Интенсивная работа с данными в Python преподает нам всем важный урок: очистка данных обычно…

Апр 9, 2026
Корея проведет пилотный проект по внедрению телемедицины на основе искусственного интеллекта в Индонезии.

Корея проведет пилотный проект по внедрению телемедицины на основе искусственного интеллекта в Индонезии.

Правительство Кореи также планирует расширить партнерство в области искусственного интеллекта в здравоохранении на Вьетнам и Таиланд. Телемедицина Фото: Мартин Барро/Getty Images Южная Корея и Индонезия проведут пилотный проект по внедрению услуг телеконсультаций на основе искусственного интеллекта в…

Апр 9, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых