Предварительный обзор GPT-5.6 Sol: модель нового поколения | OpenAI
- Возможности
- Укрепление кибервозможностей с более надежной защитой
- Многоуровневая система защиты
- Повышение надежности с помощью автоматизированной проверки на проникновение (red-teaming).
- Наличие и цены
Оглавление
- Возможности
- Укрепление кибервозможностей с более надежной защитой
- Многоуровневая система защиты
- Повышение надежности с помощью автоматизированной проверки на проникновение (red-teaming).
- Наличие и цены
Мы начинаем ограниченный предварительный показ серии GPT-5.6: Sol, наша флагманская модель; Terra, сбалансированная модель для повседневной работы; и Luna, быстрая и доступная модель. Terra обладает конкурентоспособными характеристиками по сравнению с GPT-5.5, при этом она вдвое дешевле, а Luna предлагает высокую производительность по самой низкой цене.
Выпуск GPT-5.6 Sol сопровождается самым надежным на сегодняшний день комплексом мер безопасности. Мы усилили защиту от действий с повышенным риском, конфиденциальных киберзапросов и повторных случаев неправомерного использования, а также потратили несколько недель на поиск уязвимостей, тестирование системы под давлением и ее защиту от реальных атак.
Мы верим в широкий доступ и планируем сделать GPT-5.6 Sol, Terra и Luna общедоступными в ближайшие недели. В рамках нашего постоянного взаимодействия с правительством США мы предварительно представили наши планы и возможности моделей перед сегодняшним запуском. По их просьбе мы начинаем с ограниченного предварительного просмотра для небольшой группы доверенных партнеров, чье участие было согласовано с правительством, прежде чем выпустить их более широко. В ходе этого предварительного просмотра мы продолжим тестирование и тесную координацию с партнерами, работая над расширением доступности. Мы считаем, что подобный процесс предоставления доступа правительству не должен стать долгосрочным стандартом. Он лишает пользователей, разработчиков, предприятий, специалистов по кибербезопасности и глобальных партнеров, которые в них нуждаются, доступа к лучшим инструментам. Мы предпринимаем этот краткосрочный шаг, потому что считаем, что это наиболее надежный путь к расширению доступности в ближайшие недели, пока мы работаем с администрацией над разработкой структуры исполнительного указа по кибербезопасности и повторяемого процесса для будущих выпусков моделей.
Возможности
GPT-5.6 Sol — наша самая мощная модель на сегодняшний день. Чтобы дать представление о производительности модели, мы представляем набор оценок, демонстрирующих улучшенные возможности агентов в области программирования, биологии и кибербезопасности, а также дополнительные оценки безопасности и готовности, доступные в нашей карточке системы (открывается в новом окне) . Мы поделимся расширенным набором результатов оценок, когда модель станет широко доступна.
В GPT-5.6 мы вводим новый алгоритм максимального логического рассуждения, чтобы дать Солу максимальное время для глубокого анализа. Кроме того, мы вводим новый ультрарежим , который выходит за рамки возможностей одного агента, используя субагентов для ускорения сложной работы.
В области тестирования рабочих процессов программирования GPT-5.6 Sol устанавливает новый стандарт для Terminal-Bench 2.1 , который проверяет рабочие процессы командной строки, требующие планирования, итераций и координации инструментов.
GPT-5.6 Sol также демонстрирует значительные улучшения в биологических рабочих процессах. На GeneBench v1 , который оценивает долгосрочные геномные и количественные биологические анализы, он достигает более высоких результатов, чем GPT-5.5, при использовании меньшего количества токенов.
GPT-5.6 Sol — наша самая мощная модель для кибербезопасности на сегодняшний день. Она расширяет границы производительности и эффективности для долгосрочных задач безопасности, включая исследование и эксплуатацию уязвимостей. На ExploitBench² GPT-5.6 Sol конкурентоспособна с Mythos Preview, используя всего около 1/3 выходных токенов. На ExploitGym³ , бенчмарке , созданном исследователями из Калифорнийского университета в Беркли в сотрудничестве с OpenAI и другими передовыми лабораториями, модели GPT-5.6 Sol, Terra и Luna демонстрируют значительное улучшение возможностей в области кибербезопасности по мере повышения уровня рассуждений.
Укрепление кибервозможностей с более надежной защитой
Мы разработали GPT-5.6 Sol, Terra и Luna с использованием самых надежных на сегодняшний день мер защиты, с конфигурациями, соответствующими возможностям каждой модели. По мере развития модели мы разрабатываем меры защиты, которые будут все лучше противостоять реальному давлению со стороны злоумышленников, сохраняя при этом доступ к легитимной работе, такой как анализ кода, исследование уязвимостей, разработка патчей, отладка, обучение в области безопасности и тестирование средств защиты. Наша цель — сделать запрещенную наступательную деятельность более сложной, неопределенной и обнаруживаемой, не ограничивая при этом без необходимости эти полезные виды использования. На основе нашей оценки модели и мер защиты мы ожидаем существенной пользы для легитимной работы по защите, одновременно существенно ограничивая запрещенное наступательное использование.
GPT-5.6 Sol лучше помогает людям находить и устранять уязвимости, чем надежно осуществлять сквозные атаки. По мере дальнейшего развития этих возможностей нашим приоритетом является обеспечение того, чтобы они были доступны и приносили пользу специалистам по защите, которые могли бы использовать эти инструменты для поиска слабых мест, разработки патчей и более широкого укрепления систем.
GPT-5.6 Sol не превышает порог киберкритичности в рамках нашей системы обеспечения готовности . В ходе оценок с использованием Chromium и Firefox он выявил ошибки и примитивы эксплуатации — строительные блоки эксплойта, — но не смог автономно создать функциональный эксплойт с полной цепочкой уязвимостей в условиях тестирования. Тем не менее, пороговые значения бенчмарка не могут охватить все способы использования модели или ее сочетания с другими инструментами. Эта неопределенность, наряду с более широким изменением возможностей модели, является причиной того, почему мы сочетаем расширенные возможности модели с более надежными мерами защиты и поэтапным выпуском. Более подробная информация о наших мерах защиты представлена в карточке системы GPT-5.6 Preview (открывается в новом окне) .
Многоуровневая система защиты
Ни одна отдельная мера защиты не является достаточной против целенаправленного или адаптивного злоупотребления. В предварительной версии GPT-5.6 мы используем многоуровневые средства защиты, точные конфигурации которых различаются в зависимости от модели, и проводим их тестирование на реальных атаках. К ним относятся средства защиты, заложенные в модель, проверки в реальном времени во время генерации, сигналы на уровне учетных записей, дифференцированный доступ, мониторинг, принудительное исполнение и постоянное тестирование.
GPT-5.6 обучен отказывать в запрещенной кибер-помощи, в том числе, когда пользователи пытаются замаскировать свои намерения или взломать модель. Эти меры защиты на уровне модели устанавливают первую границу того, в чем модель должна и не должна помогать.
Классификаторы злоупотреблений в кибер- и биологической сфере в режиме реального времени обеспечивают дополнительный уровень анализа, оценивая выходные данные по мере их генерации. В случаях повышенного риска, если они обнаруживают потенциальное нарушение, генерация может быть приостановлена, пока более крупная модель анализа рассуждений рассматривает разговор и его контекст. Если выходные данные оцениваются как запрещенные, они задерживаются до того, как достигнут пользователя.
Выявленная активность также может инициировать проверку на уровне учетной записи по соответствующим беседам и сигналам риска, в соответствии с нашими условиями и политиками в отношении хранения и проверки контента. Анализ не только одной беседы помогает нашим системам отличать систематически вредоносное поведение от законной работы по обеспечению безопасности двойного назначения, где схожие технические концепции могут проявляться в совершенно разных контекстах.
Вместе эти уровни делают общий подход более надежным, чем любая отдельная мера защиты. Моделирование поведения снижает вероятность вредоносных ответных действий, системы реального времени могут вмешиваться во время генерации, анализ на уровне учетных записей может выявлять более общие закономерности, а дифференцированный доступ сохраняет важную работу по защите, не делая наиболее конфиденциальные возможности широко доступными по умолчанию.
В частности, на этапе предварительного просмотра пользователи могут столкнуться с механизмами защиты, которые блокируют или отклоняют некоторые запросы. Обработка других запросов может занять больше времени, поскольку их генерация приостанавливается для дополнительной проверки. Механизмы защиты могут иногда вмешиваться в законную работу, особенно в областях двойного назначения, где оборонительная и наступательная деятельность могут изначально выглядеть схожей.
Это одна из целей предварительного тестирования. Мы хотим понять не только то, ограничивают ли меры защиты злоупотребления, но и то, смогут ли добросовестные пользователи по-прежнему надежно и эффективно выполнять свою обычную работу. Обратная связь во время предварительного тестирования поможет нам уменьшить количество ненужных блокировок и задержек, улучшить интерпретацию контекста мерами защиты и создать более удобный интерфейс до более широкого выпуска.
Мы также работаем с корпоративными клиентами над долгосрочными подходами, включая системы обнаружения, обеспечивающие конфиденциальность, управляемые клиентами средства контроля безопасности и доступ, адаптированный к риску клиента, пользователя или рабочей нагрузки, — для повышения уровня безопасности при одновременной поддержке требований к конфиденциальности в масштабах предприятия.
Повышение надежности с помощью автоматизированной проверки на проникновение (red-teaming).
Меры защиты также должны оставаться эффективными, когда злоумышленники адаптируют свою тактику. Защита, которая работает только против фиксированного набора известных атак, недостаточно надежна для модели «пограничной зоны».
Именно поэтому мы применяем к обеспечению безопасности больше интеллекта и вычислительных ресурсов, чем когда-либо прежде, используя собственные модели для более быстрого выявления уязвимостей и улучшения мер защиты. Мы выделили более 700 000 часов работы графических процессоров, эквивалентных A100, на автоматизированное тестирование на уязвимости, направленное на поиск универсальных способов взлома: атак, которые могут работать во многих контекстах и условиях, а не только в одной узкой ситуации. Сосредоточение внимания на этих более сложных и общих атаках позволяет нам тестировать меры защиты за пределами фиксированного набора известных сбоев. Это также позволяет нам исследовать гораздо больше шаблонов атак, чем могло бы охватить тестирование одним человеком, выявлять шаблоны сбоев на ранних стадиях и сокращать путь от обнаружения уязвимости до ее устранения.
В дополнение к автоматизированному тестированию на проникновение (red-teaming), мы сотрудничали со сторонними тестировщиками для проведения масштабного тестирования экспертами на проникновение (red-teaming), которое продолжится и в период предварительного тестирования. Тестирование экспертами дополняет автоматизированную работу, проверяя средства защиты от попыток злоупотребления моделью со стороны специалистов, которые могут быть не предусмотрены нашими системами.
Ни одна оценка не может охватить все конфигурации продукта, многоэтапные атаки или реальные рабочие процессы. Поэтому мы поддерживаем процесс быстрого реагирования для воспроизведения, оценки, определения приоритетов и устранения вновь обнаруженных джейлбрейков, а затем добавляем их в наши текущие оценки, чтобы в будущем тестировать их на аналогичных сбоях.
Наличие и цены
В ходе предварительного тестирования модели GPT-5.6 будут первоначально доступны через API и Codex для избранной группы доверенных партнеров и организаций. Вскоре мы планируем сделать их более доступными для пользователей ChatGPT, Codex и API.
В новой системе именования, представленной в GPT-5.6, число обозначает поколение модели, а Sol, Terra и Luna — уровни устойчивых возможностей, которые могут развиваться самостоятельно. Вместе это семейство предоставляет пользователям и разработчикам более понятный выбор в отношении интеллекта, скорости и стоимости.
В GPT-5.6 цена за 1 миллион токенов рассчитана для трех размеров моделей: Sol — 5 долларов за вход / 30 долларов за выход; Terra — 2,50 доллара за вход / 15 долларов за выход; и Luna — 1 доллар за вход / 6 долларов за выход. GPT-5.6 также вводит более предсказуемое кэширование запросов, включая поддержку явных точек останова кэша и минимальное время жизни кэша в 30 минут. Для моделей GPT-5.6 и более поздних версий запись в кэш оплачивается по ставке 1,25x от входной ставки для некэшированных данных, в то время как чтение из кэша продолжает получать 90% скидку, как при чтении из кэша.
В июле мы также запускаем GPT-5.6 Sol на платформе Cerebras со скоростью до 750 токенов в секунду, предоставляя клиентам доступ к передовым технологиям с беспрецедентной скоростью. Первоначально доступ будет ограничен для избранных клиентов по мере расширения возможностей.
Мы рады продолжить изучение материала, полученного в ходе этого предварительного тестирования, и вскоре представить GPT-5.6 Sol, Terra и Luna большему числу пользователей.
1. Мы оцениваем задержку и стоимость API, анализируя поведение наших моделей в производственной среде и проводя моделирование в автономном режиме. Эти оценки учитывают детали вызовов инструментов, выборку токенов и входные токены. Результаты в реальных условиях могут существенно отличаться и зависеть от многих факторов, не учтенных в нашем моделировании. Мы моделируем задержку при высокой скорости API и стоимость при стандартной цене API.
2. Все модели оценивались с использованием API-инструмента ExploitBench с 5 начальными значениями и обеспечением непрерывности рассуждений.
3. Мы запустили ExploitGym на нашем альфа-API, который выдает ответы быстрее, чем наш публичный API, а затем масштабировали его до уровня нашего публичного API. При масштабировании задержек до ожидаемых скоростей для нашего публичного API некоторые расчетные задержки превышают временные ограничения в 2 и 6 часов, несмотря на то, что они корректно соблюдались во время оценочного запуска. Для повышения скорости обработки критически важных задач мы предлагаем приоритетную обработку в API и быстрый режим в Codex.
4. Модели, для которых не указаны выходные токены, задержка или стоимость, отображены горизонтальными пунктирными линиями.
Источник: openai.com
Похожие записи
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
