ideipro logotyp

GPT-4o mini: развитие экономически эффективного интеллекта | OpenAI

Представляем нашу самую экономичную модель малого размера

Компания OpenAI стремится сделать интеллект максимально доступным. Сегодня мы представляем GPT‑4o mini, нашу самую экономичную модель малого размера. Мы ожидаем, что GPT‑4o mini значительно расширит спектр приложений, созданных с использованием ИИ, сделав интеллект гораздо более доступным. GPT‑4o mini набрал 82% в MMLU и в настоящее время превосходит GPT‑4 1 по параметрам чата в рейтинге лидеров LMSYS(откроется в новом окне) . Стоимость составляет 15 центов за миллион входящих токенов и 60 центов за миллион исходящих токенов, что на порядок дешевле предыдущих моделей Frontier и более чем на 60% дешевле GPT‑3.5 Turbo.

GPT‑4o mini позволяет выполнять широкий спектр задач благодаря низкой стоимости и задержке, например, приложения, которые объединяют или распараллеливают множественные вызовы моделей (например, вызов нескольких API), передают большой объем контекста в модель (например, полную кодовую базу или историю разговоров) или взаимодействуют с клиентами посредством быстрых текстовых ответов в режиме реального времени (например, чат-боты службы поддержки клиентов).

Сегодня GPT‑4o mini поддерживает текст и визуализацию в API, а в будущем появится поддержка ввода и вывода текста, изображений, видео и аудио. Модель имеет контекстное окно в 128 тыс. токенов, поддерживает до 16 тыс. выходных токенов на запрос и сохраняет знания до октября 2023 года. Благодаря улучшенному токенизатору, общему с GPT‑4o, обработка неанглоязычных текстов стала ещё более экономичной.

Небольшая модель с превосходным текстовым интеллектом и мультимодальным мышлением

GPT‑4o mini превосходит GPT‑3.5 Turbo и другие небольшие модели в академических тестах как в области текстового анализа, так и в области мультимодальных рассуждений, и поддерживает тот же диапазон языков, что и GPT‑4o. Он также демонстрирует высокую производительность при вызове функций, что позволяет разработчикам создавать приложения, извлекающие данные или выполняющие действия с внешними системами, а также улучшенную производительность в длинном контексте по сравнению с GPT‑3.5 Turbo.

GPT‑4o mini был оценен по нескольким ключевым тестам2 .

Задачи на рассуждение: GPT‑4o mini лучше других малых моделей справляется с задачами на рассуждение, включающими как текст, так и зрение, набрав 82,0% на MMLU, тесте текстового интеллекта и рассуждения, по сравнению с 77,9% у Gemini Flash и 73,8% у Claude Haiku.

Знание математики и программирования: GPT‑4o mini превосходно справляется с математическими рассуждениями и задачами кодирования, превосходя предыдущие небольшие модели на рынке. В тесте MGSM, измеряющем математические рассуждения, GPT‑4o mini набрал 87,0% по сравнению с 75,5% для Gemini Flash и 71,7% для Claude Haiku. В тесте HumanEval, измеряющем производительность кодирования, GPT‑4o mini набрал 87,2% по сравнению с 71,5% для Gemini Flash и 75,9% для Claude Haiku.

Мультимодальное рассуждение: GPT‑4o mini также демонстрирует высокую производительность в MMMU, оценке мультимодального рассуждения, набрав 59,4% по сравнению с 56,1% для Gemini Flash и 50,2% для Claude Haiku.

Оценочные баллы модели

GPT-4o мини

Близнецы Флэш

Клод Хайку

ГПТ-3.5 Турбо

ГПТ-4о

В рамках разработки модели мы сотрудничали с несколькими надежными партнерами, чтобы лучше понять варианты использования и ограничения GPT‑4o mini. Мы сотрудничали с такими компаниями, как Ramp(откроется в новом окне) и Superhuman(откроется в новом окне) , которые обнаружили, что GPT‑4o mini значительно превосходит GPT‑3.5 Turbo в таких задачах, как извлечение структурированных данных из файлов квитанций или создание качественных ответов на электронные письма при наличии истории сообщений.

Встроенные меры безопасности

Безопасность заложена в наши модели с самого начала и подкрепляется на каждом этапе разработки. На этапе предварительного обучения мы отфильтровываем(открывается в новом окне) информацию, которую не хотим, чтобы наши модели обучались или выводили, например, разжигающие ненависть высказывания, материалы для взрослых, сайты, агрегирующие преимущественно персональные данные, и спам. На этапе последующего обучения мы согласовываем поведение модели с нашими политиками, используя такие методы, как обучение с подкреплением и обратной связью от человека (RLHF) ⁠, чтобы повысить точность и надёжность ответов моделей.

GPT‑4o mini имеет те же встроенные функции снижения рисков, что и GPT‑4o⁠ , которые мы тщательно оценили с помощью автоматизированных и ручных оценок в соответствии с нашей Системой готовности⁠ и нашими добровольными обязательствами⁠ . Более 70 внешних экспертов в таких областях, как социальная психология и дезинформация, протестировали GPT‑4o для выявления потенциальных рисков. Мы учли эти риски и планируем поделиться ими в готовящейся системной карте GPT‑4o и шкале оценки готовности. Результаты этих экспертных оценок помогли повысить безопасность как GPT‑4o, так и GPT‑4o mini.

Опираясь на эти знания, наши команды также работали над повышением безопасности GPT‑4o mini, используя новые методы, разработанные в ходе наших исследований. GPT‑4o mini в API — первая модель, применяющая наш метод иерархии инструкций(открывается в новом окне) , который помогает повысить устойчивость модели к джейлбрейкам, инъекциям в подсказки и извлечению системных подсказок. Это повышает надёжность ответов модели и помогает сделать её более безопасной для использования в масштабируемых приложениях.

Мы продолжим следить за использованием GPT‑4o mini и повышать безопасность модели по мере выявления новых рисков.

Доступность и цены

GPT‑4o mini теперь доступен в качестве текстовой и визуальной модели в API помощников, API завершения чатов и API пакетной обработки. Разработчики платят 15 центов за 1 млн входящих токенов и 60 центов за 1 млн исходящих токенов (что примерно эквивалентно 2500 страницам стандартной книги). Мы планируем выпустить тонкую настройку для GPT‑4o mini в ближайшие дни.

В ChatGPT пользователи Free, Plus и Team смогут использовать GPT‑4o mini уже сегодня вместо GPT‑3.5. Корпоративные пользователи также получат доступ со следующей недели, в соответствии с нашей миссией — сделать преимущества искусственного интеллекта доступными для всех.

Что дальше?

За последние несколько лет мы стали свидетелями впечатляющего прогресса в области искусственного интеллекта (ИИ) в сочетании со значительным снижением затрат. Например, стоимость токена GPT‑4o mini снизилась на 99% с момента появления text-davinci-003, менее производительной модели, представленной в 2022 году. Мы стремимся продолжать движение по пути снижения затрат и расширения возможностей модели.

Мы представляем себе будущее, в котором модели будут легко интегрироваться в каждое приложение и на каждый веб-сайт. GPT‑4o mini открывает разработчикам путь к более эффективному и экономичному созданию и масштабированию мощных ИИ-приложений. Искусственный интеллект будущего становится всё более доступным, надёжным и интегрированным в наш повседневный цифровой опыт, и мы рады продолжать лидировать в этом направлении.

Источник: openai.com

✅ Найденные теги: GPT-4o, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых