Image

OpenAI запускает открытые модели безопасности “gpt-oss-safeguard”

8ecbd91ae4c3cab71da20948a8e4f91b

Искусственный интеллект не только генерирует контент, но и начинает определять, должен ли этот контент быть сгенерирован. То, что до недавнего времени казалось второстепенной функцией, сегодня становится центральной необходимостью: контролировать, что производится, как распространяется и по каким критериям. В этом контексте OpenAI только что сделала важный шаг, открыв доступ к своим новым моделям рассуждений для классификации безопасности: gpt-oss-safeguard.

Это модели с открытым исходным кодом, предназначенные для ранжирования контента по индивидуальным критериям безопасности в соответствии с политикой использования каждой платформы или разработчика. OpenAI выпустила две версии: одну со 120 миллиардами параметров и другую с 20 миллиардами, обе доступны под лицензией Apache 2.0, что позволяет свободно использовать их и интегрировать в существующие системы без коммерческих ограничений.

Главное новшество этих моделей не только в том, что они классифицируют, но и в том, как они это делают. Вместо того, чтобы просто выносить двоичный вердикт (“разрешено” или “запрещено”), gpt-oss-safeguard шаг за шагом объясняют свои доводы. Они используют методы «цепочки мыслей», которые позволяют понять, почему контент был помечен в соответствии с определенной политикой, и упрощают изменение этой политики без необходимости переподготовки модели. Эта модульность особенно ценна в условиях, когда стандарты быстро меняются или различаются в разных сообществах.

Возможные варианты использования широки. Форум видеоигр может настроить модель для обнаружения ловушек или автоматических сценариев, в то время как сайт с обзорами может использовать ее для выявления ложных отзывов. Социальные платформы, образовательные системы, торговые площадки или технические форумы могут адаптировать логику модели к вашим конкретным потребностям, включив ее в качестве уровня аргументации в свою инфраструктуру модерации.

Источник: andreyex.ru

Источник: ai-news.ru

✅ Найденные теги: OpenAI, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Прозрачный раствор в бутылочке с черной крышкой, химическая формула на этикетке.
Диаграмма ложной идентичности: реальность и самозванец, высокие и низкие частоты.
Изображение крупным планом дрона с логотипом Anduril.
ideipro logotyp
Предоставление врачам необходимой информации непосредственно в момент общения с пациентом.
Руководство по Kedro: ваш готовый к внедрению инструментарий для анализа данных.
Цифровая сеть и технологическая сфера, соединенные световым потоком.
Модель атома с ядром и вращающимися электронами на темном фоне.
Флуоресцентное изображение эмбриона синих и фиолетовых оттенков на черном фоне.
Image Not Found
Прозрачный раствор в бутылочке с черной крышкой, химическая формула на этикетке.

Ученые усовершенствовали метод получения промышленного спирта

Полученный α-кумиловый спирт © Елена Редина. Ученые разработали новый метод получения α-кумилового спирта — ключевого продукта для производства полимеров, косметики и моющих средств. Этот спирт также служит основой для получения вещества, придающего пластикам прочность и устойчивость к…

Мар 5, 2026
Диаграмма ложной идентичности: реальность и самозванец, высокие и низкие частоты.

Эффект наложения спектров в аудио, объяснение простое: от «колес телеги» до волновых форм.

Понимание основополагающих искажений цифрового звука с самых базовых принципов, с примерами и наглядными объяснениями. Делиться Вы когда-нибудь задумывались, почему в фильмах вращающиеся колеса иногда кажутся движущимися вспять? Или почему дешевая цифровая запись звучит резко и металлически по…

Мар 5, 2026
Изображение крупным планом дрона с логотипом Anduril.

Компания Anduril планирует достичь оценки в 60 миллиардов долларов в новом раунде финансирования.

Вкратце Источник изображения: Кайл Гриллот/Bloomberg / Getty Images Согласно новому сообщению The Wall Street Journal, оборонно-технологическая компания Палмера Лаки находится в разгаре многомиллиардного раунда финансирования, возглавляемого Thrive Capital и Andreessen Horowitz. Этот раунд финансирования состоится менее чем…

Мар 5, 2026
ideipro logotyp

Компания Illumina на конференции JPM 2026: Успешный 4-й квартал, рост клинических исследований и запуск BioInsight.

Автор: Эллисон Проффитт 13 января 2026 г. | Джейкоб Тейсен во вторник вернулся на сцену конференции JP Morgan Healthcare Conference с посланием о восходящем тренде: компания Illumina снова демонстрирует рост, и клиническое секвенирование является движущей силой этого…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых