Масштабирование безопасного корпоративного ИИ с помощью платформ управления OpenAI.
Стратегия бизнеса в сфере ИИ
Масштабирование безопасного корпоративного ИИ с помощью платформ управления OpenAI. 
Новейшие системы управления OpenAI предлагают руководителям предприятий структурированный план масштабирования безопасных и соответствующих требованиям развертываний ИИ по всему миру.
Внедрение крупных языковых моделей неуклонно движется в направлении необходимости устойчивой архитектуры коммерческого уровня. Компания OpenAI выпустила свою структуру управления передовыми технологиями (Frontier Governance Framework, FGF), в которой описано, как организация проводит оценку и смягчение системных рисков.
Данная структура напрямую соответствует Общему кодексу практики ИИ ЕС и Закону Калифорнии о прозрачности в передовых технологиях ИИ (TFAIA). В публикации представлен весьма практичный шаблон, подробно описывающий, как можно структурировать внутренние системы и конвейеры развертывания для безопасной поддержки высокопроизводительных моделей машинного обучения.
Перевод этих нормативных структур в бизнес-стратегию начинается с понимания определенных категорий угроз. В рамках данной концепции системный риск определяется как предсказуемые существенные риски причинения серьезного вреда. В частности, это включает сценарии, когда модель приводит к более чем 50 смертельным случаям или причиняет ущерб имуществу на сумму 1 миллиард долларов в результате одного инцидента.
Хотя эти сценарии находятся на самом краю вероятности, их кодификация позволяет командам развертывания создавать соответствующие меры защиты. Заранее определив границы, предприятия могут точно распределять вычислительные ресурсы и инженерное время на непрерывный мониторинг после развертывания и аудит сторонними организациями, обеспечивая соответствие приложений требованиям на протяжении всего их жизненного цикла.
Применение многоуровневой оценки рисков к внутренним системам.
OpenAI классифицирует угрозы по конкретным областям: кибернападения, химические, биологические, радиологические и ядерные (ХБРЯ) риски, вредоносные манипуляции и потеря контроля.
Система категоризации использует различные уровни риска для оценки возможностей модели. Например, рейтинг кибератаки уровня 3 применяется к модели, дополненной инструментами, способной выявлять и разрабатывать функциональные уязвимости нулевого дня всех уровней серьезности во многих защищенных реальных системах без вмешательства человека.
В категории CBRN модель 3-го уровня может позволить эксперту разработать крайне опасный новый вектор угрозы, сравнимый с биологическим агентом класса А по классификации CDC, или автономно завершить цикл синтеза регулируемой биологической угрозы. Вместо того чтобы рассматривать эти возможности исключительно как опасности, внутренние группы безопасности могут использовать эти уровни для установления определенных ограничений для своих собственных экземпляров моделей, точно зная, когда вспомогательный инструмент для программирования или исследовательский инструмент требует более тщательного контроля.
В рамках данной концепции также описываются риски, связанные с вредоносными манипуляциями, которые описываются как целенаправленное искажение человеческого поведения, например, использование возможностей моделирования для операций по оказанию влияния или вмешательства в выборы.
OpenAI отмечает, что эта область всё ещё находится на стадии исследования и лучше всего решается с помощью мер на системном уровне, таких как мониторинг после развертывания, а не посредством оценки до развертывания. Для компаний, работающих с потребителями, это означает, что системам автоматизации маркетинга, использующим языковые модели, просто необходимы классификаторы контента в реальном времени, чтобы гарантировать создание объективных сообщений для общественности.
Рассматривая риск потери человеком способности надежно управлять системой или отключать ее, данная концепция обозначает этот вектор как потерю контроля. Модель второго уровня в этой категории демонстрирует способность надежно избегать обнаружения с помощью различных методов оценки, включая избегание мониторинга цепочки мыслей.
Модель третьего уровня описывается как превосходящая самых опытных людей в выполнении самых сложных проектов и способная работать автономно в течение длительных периодов времени. Она демонстрирует высокую степень осведомленности о ситуации и скрытность, благодаря чему мониторинг модели и цепочки ее мыслей не может надежно обнаружить или исключить возможность уклонения от человеческого контроля.
Устанавливая эти параметры, компании, использующие автономных агентов для логистики цепочки поставок или финансовых операций, получают четко определенную задачу по созданию детерминированных механизмов защиты от сбоев и поддержанию постоянного человеческого контроля в автоматизированных рабочих процессах.
Решение проблем интеграции и информационной безопасности.
Внутренняя безопасность OpenAI соответствует стандартам ISO 27001, 27017, 27018 и 27701, а также требованиям SOC 2 Type II. Для защиты невыпущенных весовых коэффициентов моделей компания использует шифрование данных в состоянии покоя и при передаче, многофакторную аутентификацию и строгие протоколы многостороннего подтверждения. Внутренний персонал регулярно проходит обучение, а выполнение моделей происходит в изолированной среде с ограниченным исходящим доступом по умолчанию.
Когда предприятия перенимают эту схему, они создают надежную основу для внутренних операций.
Интеграция моделей в собственные корпоративные базы данных часто приводит к тому, что инженерные группы полагаются на генерацию с использованием методов поиска и дополнения (Retrieval-Augmented Generation) и плотные векторные базы данных. Защита этих баз данных от враждебных запросов или попыток извлечения данных требует значительных вычислительных ресурсов.
Каждый API-запрос проходит через классификаторы безопасности, прежде чем попасть в базу данных векторов, а полученный контекст проверяется перед генерацией окончательного ответа. Хотя объединение современных облачных структур управления ИИ со старыми разрозненными хранилищами данных на мэйнфреймах вынуждает команды создавать специализированное, сильно зашифрованное промежуточное программное обеспечение, эта инженерная работа приводит к созданию стабильной инфраструктуры, готовой к использованию в масштабах предприятия.
Обеспечение соблюдения требований экосистемы и реагирование на инциденты.
Для поддержания точных базовых показателей риска OpenAI запрашивает информацию у внешних экспертов в данной области и независимых сторонних оценщиков. Эти внешние эксперты помогают проводить стресс-тестирование защитных механизмов для моделей, приближающихся к новому уровню риска, и предоставляют независимые заключения внутренней консультативной группе по безопасности.
Аналогичным образом, руководители отделов данных в компаниях могут извлечь выгоду из привлечения внешних аудиторов для независимой проверки того, что их локализованные развертывания моделей остаются в пределах допустимых пороговых значений риска.
Внешняя отчетность, интегрированная в более широкую нормативно-правовую систему, определяет текущий оперативный ритм. OpenAI документирует результаты мер по снижению рисков в отчете о модели безопасности. В соответствии с положениями Закона ЕС об искусственном интеллекте, компания обязуется оценивать необходимость обновления этих отчетов для своих наиболее эффективных моделей каждые шесть месяцев.
Обновление отчетов считается необходимым, если возможности модели существенно изменяются после обучения или если интеграция во внутренние системы увеличивает риски. Ответственность за соблюдение требований ЕС несет OpenAI Ireland Limited, в то время как OpenAI OpCo LLC управляет обязательствами в соответствии с TFAIA в США.
Для реагирования на внезапные сбои в программном обеспечении OpenAI использует план реагирования на инциденты в области безопасности ИИ, сокращенно AIRP. Этот план определяет процедуры сортировки, расследования и внешнего информирования о серьезных инцидентах в области безопасности.
Потенциальные инциденты выявляются с помощью автоматизированного мониторинга, эскалации со стороны сотрудников или обратной связи от конечных пользователей. После выявления инцидента группы реагирования расследуют первопричину, масштабы и последствия, предпринимая действия по смягчению и локализации события. Руководители предприятий могут легко воспроизвести эти механизмы реагирования, создав параллельные внутренние подразделения реагирования, способные заблаговременно корректировать аномальное поведение API.
В рамках OpenAI предложения по обновлению структуры могут поступать от различных руководителей, включая руководителя отдела систем безопасности, директора по информационной безопасности и главного юрисконсульта. Компания проводит официальную оценку структуры не реже одного раза в 12 месяцев, оценивая изменения в законодательстве, новые возможности моделей и отраслевые стандарты.
Интеграция передовых вычислительных моделей остается жизнеспособным путем повышения эффективности работы компании, а внедрение этих фреймворков гарантирует, что внутренняя архитектура будет хорошо подготовлена к безопасному выполнению современных требований соответствия.
См. также: Anthropic выпускает альбом Claude Opus 4.8

Хотите узнать больше об искусственном интеллекте и больших данных от лидеров отрасли? Посетите выставку AI & Big Data Expo, которая пройдет в Амстердаме, Калифорнии и Лондоне. Это масштабное мероприятие является частью TechEx и проводится одновременно с другими ведущими технологическими выставками, включая Cyber Security & Cloud Expo. Для получения дополнительной информации нажмите здесь.
AI News — это проект TechForge Media. Здесь вы можете ознакомиться с другими предстоящими мероприятиями и вебинарами, посвященными корпоративным технологиям.
Источник: www.artificialintelligence-news.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.