Отслеживание несоответствий в внутренних агентах OpenAI: кембриджинг безопасности и автономности

Используя наши самые мощные модели, мы выявляем и изучаем несоответствия в поведении, наблюдаемые в реальных условиях эксплуатации. Системы…