Это первый запуск подобных моделей за последние пять лет, поскольку в США растет давление в связи с доминированием Китая в области открытых моделей.

Компания OpenAI наконец-то выпустила свои первые модели с открытым весом для больших языков после GPT-2 2019 года. Эти новые модели «gpt-oss» доступны в двух размерах и показывают результаты, схожие с результатами моделей o3-mini и o4-mini компании в нескольких бенчмарках. В отличие от моделей, доступных через веб-интерфейс OpenAI, эти новые открытые модели можно свободно загружать, запускать и даже изменять на ноутбуках и других локальных устройствах.
За долгие годы отсутствия открытой версии LLM некоторые пользователи стали называть её уничижительным «ClosedAI». Это чувство разочарования усилилось в последние несколько месяцев, поскольку выход этих долгожданных моделей дважды откладывался — сначала в июне, а затем в июле. Однако с их выпуском OpenAI вновь обретает популярность среди пользователей открытых моделей.
Это особенно примечательно в то время, когда Meta, которая ранее доминировала на американском рынке открытых моделей со своими моделями Llama, может переориентироваться на закрытые релизы, и когда китайские открытые модели, такие как предложения DeepSeek, Kimi K2 и серия Qwen от Alibaba, становятся более популярными, чем их американские конкуренты.
Связанная история
Теперь можно безопасно и удобно запускать полезные модели прямо со своего компьютера. Вот как это сделать.
«Подавляющее большинство наших [корпоративных и стартап-клиентов] уже используют множество открытых моделей», — заявил Кейси Дворак, руководитель исследовательской программы OpenAI, на пресс-конференции, посвящённой выпуску модели. «Поскольку у OpenAI нет [конкурентной] открытой модели, мы хотели восполнить этот пробел и фактически предоставить им возможность использовать нашу технологию повсеместно».
Новые модели доступны в двух размерах. Меньшая из них теоретически может работать с 16 ГБ оперативной памяти — это минимальный объём, который Apple в настоящее время предлагает для своих компьютеров. Для более крупной модели потребуется высокопроизводительный ноутбук или специализированное оборудование.
Открытые модели имеют несколько ключевых сфер применения. Некоторые организации могут захотеть адаптировать модели под свои нужды или сэкономить, запуская модели на собственном оборудовании, хотя это оборудование требует значительных первоначальных затрат. Другим, например, больницам, юридическим фирмам и государственным учреждениям, могут потребоваться модели, которые можно запускать локально, из соображений безопасности данных.
OpenAI способствовала развитию этой деятельности, выпуская свои открытые модели под разрешительной лицензией Apache 2.0, которая позволяет использовать их в коммерческих целях. Натан Ламберт, руководитель программы пост-обучения в Институте искусственного интеллекта Аллена, считает этот выбор похвальным: подобные лицензии типичны для китайских открытых моделей, но Meta выпустила свои модели Llama под специальной, более ограничительной лицензией. «Это очень хорошо для открытого сообщества», — говорит он.
Исследователям, изучающим работу LLM, также нужны открытые модели, чтобы они могли детально изучать их и манипулировать ими. «Отчасти речь идёт о восстановлении доминирования OpenAI в исследовательской экосистеме», — говорит Питер Хендерсон, доцент Принстонского университета, много работавший с открытыми моделями. Если исследователи возьмут gpt-oss в качестве новых рабочих лошадок, OpenAI может получить от этого конкретные преимущества, говорит Хендерсон, — компания может внедрить инновации, открытые другими исследователями, в свою собственную экосистему моделей.
В более широком смысле, по словам Ламберта, выпуск открытой модели сейчас может помочь OpenAI восстановить свой статус в постоянно растущей среде ИИ. «Это возвращает нас к временам, когда их считали компанией, работающей в сфере ИИ», — говорит он. Пользователи, желающие использовать открытые модели, теперь смогут удовлетворить все свои потребности с помощью продуктов OpenAI, а не прибегать к Llama от Meta или Qwen от Alibaba, когда им нужно запустить что-то локально.
Рост популярности китайских открытых моделей, таких как Qwen, за последний год, возможно, стал особенно важным фактором в расчётах OpenAI. Сотрудник OpenAI на пресс-конференции подчеркнул, что компания не рассматривает эти открытые модели как ответ на действия какой-либо другой компании в сфере ИИ, но OpenAI явно учитывает геополитические последствия доминирования Китая в области открытых моделей. «Широкий доступ к этим эффективным моделям с открытыми весами, созданным в США, способствует расширению демократических рельсов ИИ», — написала компания в блоге, анонсируя выпуск моделей.
С тех пор, как DeepSeek ворвался на сцену ИИ в начале 2025 года, наблюдатели заметили, что китайские модели часто отказываются обсуждать темы, которые Коммунистическая партия Китая считает запретными, например, о площади Тяньаньмэнь. Подобные наблюдения, а также долгосрочные риски, такие как возможность того, что агентные модели могут намеренно писать уязвимый код, вызвали у некоторых экспертов по ИИ обеспокоенность растущим внедрением китайских моделей. «Открытые модели — это форма мягкой силы», — говорит Хендерсон.
В понедельник Ламберт опубликовал отчёт, в котором подробно описывается, как китайские модели обгоняют американские, такие как Llama, и содержится призыв к возобновлению поддержки отечественных открытых моделей. Несколько известных исследователей и предпринимателей в области искусственного интеллекта, включая генерального директора HuggingFace Клемента Деланга, Перси Ляна из Стэнфорда и бывшего исследователя OpenAI Майлза Брандейджа, подписали соглашение.
Администрация Трампа также подчеркнула важность разработки открытых моделей в своём Плане действий в области ИИ. Как с этим выпуском модели, так и с предыдущими заявлениями, OpenAI поддерживает эту позицию. «В своих документах, касающихся плана действий, [OpenAI] довольно чётко дала понять, что считает отношения США и Китая ключевым вопросом и хочет позиционировать себя как очень важную организацию для американской системы», — говорит Риши Боммасани, старший научный сотрудник Стэнфордского института искусственного интеллекта, ориентированного на человека.
По словам Ламберта, OpenAI может получить конкретные политические преимущества от присоединения к приоритетам администрации в области ИИ. По мере того, как компания продолжает наращивать свою обширную вычислительную инфраструктуру, ей потребуются политическая поддержка и одобрение, а лояльное руководство может сыграть важную роль.
Источник: www.technologyreview.com



























