Image

OpenAI запускает открытые модели безопасности “gpt-oss-safeguard”

8ecbd91ae4c3cab71da20948a8e4f91b

Искусственный интеллект не только генерирует контент, но и начинает определять, должен ли этот контент быть сгенерирован. То, что до недавнего времени казалось второстепенной функцией, сегодня становится центральной необходимостью: контролировать, что производится, как распространяется и по каким критериям. В этом контексте OpenAI только что сделала важный шаг, открыв доступ к своим новым моделям рассуждений для классификации безопасности: gpt-oss-safeguard.

Это модели с открытым исходным кодом, предназначенные для ранжирования контента по индивидуальным критериям безопасности в соответствии с политикой использования каждой платформы или разработчика. OpenAI выпустила две версии: одну со 120 миллиардами параметров и другую с 20 миллиардами, обе доступны под лицензией Apache 2.0, что позволяет свободно использовать их и интегрировать в существующие системы без коммерческих ограничений.

Главное новшество этих моделей не только в том, что они классифицируют, но и в том, как они это делают. Вместо того, чтобы просто выносить двоичный вердикт (“разрешено” или “запрещено”), gpt-oss-safeguard шаг за шагом объясняют свои доводы. Они используют методы «цепочки мыслей», которые позволяют понять, почему контент был помечен в соответствии с определенной политикой, и упрощают изменение этой политики без необходимости переподготовки модели. Эта модульность особенно ценна в условиях, когда стандарты быстро меняются или различаются в разных сообществах.

Возможные варианты использования широки. Форум видеоигр может настроить модель для обнаружения ловушек или автоматических сценариев, в то время как сайт с обзорами может использовать ее для выявления ложных отзывов. Социальные платформы, образовательные системы, торговые площадки или технические форумы могут адаптировать логику модели к вашим конкретным потребностям, включив ее в качестве уровня аргументации в свою инфраструктуру модерации.

Источник: andreyex.ru

Источник: ai-news.ru

✅ Найденные теги: OpenAI, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.
ideipro logotyp
Отражение деревьев в воде озера, спокойная гладь.
ideipro logotyp
Цифровой компонент на фоне блокчейн-технологии и сетевых данных.
Пирамида факторов риска, симптомов и локаций для тропических заболеваний.
Улучшение моделей работы мозга с помощью ZAPBench
ideipro logotyp
Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.
Image Not Found
Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.

Дженсен Хуанг утверждает, что Nvidia сокращает свое участие в проектах OpenAI и Anthropic, но его объяснение порождает больше вопросов, чем дает ответов.

Автор изображения: Патрик Т. Фэллон / Contributor / Getty Images В среду на конференции Morgan Stanley по технологиям, медиа и телекоммуникациям в центре Сан-Франциско генеральный директор Nvidia Дженсен Хуанг заявил, что недавние инвестиции его компании в OpenAI…

Мар 5, 2026
ideipro logotyp

Лучшие терапевтические пистолеты Theragun и инструменты Therabody для более эффективного восстановления (2026)

От массажных пистолетов до компрессионных сапог и светодиодных масок для лица — это лучшие устройства в линейке оздоровительных продуктов Therabody. Источник: www.wired.com ✅ Найденные теги: Therabody, Theragun, Восстановление, Инструменты, Лучшие, новости, Терапевтические ПистолетыПохожие записиДженсен Хуанг утверждает, что…

Мар 5, 2026
Отражение деревьев в воде озера, спокойная гладь.

Загрузка: как ИИ меняет игру в го и загадка кибербезопасности

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Искусственный интеллект меняет образ мышления лучших в мире игроков в го. Десять лет назад AlphaGo, программа искусственного интеллекта от…

Мар 5, 2026
ideipro logotyp

Материалы учредительного заседания Международного общества трактографии — IST 2025, Бордо.

arXiv:2602.12410v2 Тип объявления: replace-cross Аннотация: Данная подборка включает в себя тезисы докладов, представленных на постерных, презентационных и устных сессиях на первой конференции Международного общества трактографии (IST Conference 2025), состоявшейся в Бордо, Франция, с 13 по 16 октября…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых