Найдены недостатки в сотнях тестов по проверке безопасности ИИ