Улучшение отслеживания происхождения контента для безопасной и прозрачной ИИ-экосистемы
Помогаем людям понять происхождение контента, созданного с помощью ИИ, посредством Content Credentials, SynthID и инструмента ранней публичной проверки.
Попробуйте наш инструмент
Люди ежедневно используют инструменты OpenAI для создания и редактирования изображений и аудио, делая общение более выразительным, полезным и доступным. Поскольку эти инструменты становятся частью того, как люди создают, воображают и делятся информацией, важно, чтобы люди могли понимать и проверять происхождение медиаконтента, чтобы интерпретировать его с большей уверенностью. Сигналы происхождения могут помочь, предоставляя людям контекст о том, откуда взялся контент, как он был создан или отредактирован, и соответствует ли он заявленному содержанию.
Сегодня мы усиливаем наш подход к проверке происхождения контента с помощью многоуровневой, основанной на экосистеме модели построения доверия в интернете. Мы упрощаем распознавание сигналов происхождения другими инструментами и платформами благодаря соответствию стандарту C2PA, добавляем надежные кроссплатформенные водяные знаки SynthID к изображениям в рамках партнерства с Google и представляем предварительную версию инструмента, который общественность может использовать для проверки того, были ли изображения получены от OpenAI.
В совокупности эти обновления основаны на нашей предыдущей работе по поддержке открытых стандартов, упрощению идентификации контента, созданного OpenAI, и сотрудничеству в отрасли для создания более надежной информационной экосистемы.
Создание экосистемы доверия посредством соответствия стандартам C2PA.
Компания OpenAI занимается разработкой и внедрением стандартов происхождения контента с 2024 года, когда мы начали добавлять учетные данные контента к изображениям, созданным DALL·E 3 (открывается в новом окне) , а позже — к ImageGen (открывается в новом окне) и Sora (открывается в новом окне) . Мы также присоединились к руководящему комитету Коалиции по происхождению и аутентичности контента (C2PA), межотраслевой группы, стоящей за открытым техническим стандартом происхождения контента. Технический подход C2PA использует метаданные и криптографические подписи, чтобы обеспечить безопасную передачу информации о медиаконтенте вместе с самим контентом. Эта информация включает контекст, который помогает журналистам оценивать источник, платформам принимать решения о достоверности и людям, пытающимся понять, что они видят в интернете.
Недавно мы сделали шаг к тому, чтобы OpenAI стал продуктом-генератором, соответствующим стандарту C2PA (открывается в новом окне) . Соответствуя стандарту C2PA, мы предоставляем платформам надежный способ чтения, сохранения и передачи информации о происхождении нашего контента. Это важно, потому что информация о происхождении работает только в том случае, если она сохраняется после первой платформы, на которой был создан контент, и соответствие стандарту делает это возможным.
Многоуровневый подход к отслеживанию происхождения изображений с помощью Google SynthID.
Метаданные C2PA являются важной основой для подтверждения происхождения контента. Они помогают передавать информацию о том, откуда контент, как он был создан или отредактирован, и кто подписал эту информацию. Но метаданные не являются абсолютно надежными. Они могут быть удалены, потеряны при загрузке и скачивании или повреждены в результате преобразований, таких как изменение формата файла, изменение размера или создание скриншотов.
Для повышения надежности системы отслеживания происхождения данных мы используем многоуровневый подход и внедряем водяные знаки с помощью SynthID от Google DeepMind (открывается в новом окне) , начиная с изображений, сгенерированных через ChatGPT , Codex или API OpenAI. SynthID внедряет невидимый слой водяных знаков, который дополняет подходы, основанные на метаданных C2PA.
Мы работали над этим некоторое время. Мы использовали видимые водяные знаки в Sora и аудиоводяной знак в Voice Engine, и продолжали тестировать и исследовать точность и надежность на протяжении всего процесса развертывания.
Эти две системы взаимно усиливают друг друга. C2PA помогает контенту передавать подробный контекст; SynthID помогает сохранить сигнал, когда метаданные не сохраняются. Водяные знаки могут быть более надежными благодаря преобразованиям, например, скриншотам, а метаданные могут предоставлять больше информации, чем один только водяной знак. Вместе они делают отслеживание происхождения более устойчивым, чем любой из этих уровней по отдельности.
Обнаружение и предварительный просмотр нашего общедоступного инструмента проверки
Надежные метаданные и водяные знаки, устойчивые к большинству изменений, могут сделать сигналы происхождения более надежными. Но людям нужен способ обнаружения этих сигналов. Сейчас мы представляем предварительную версию общедоступного инструмента проверки , который поможет людям проверить, было ли загруженное изображение создано на ChatGPT, в API OpenAI или Codex, проверив наличие в нем сигналов происхождения, включая Content Credentials и SynthID.
Мы считаем, что людям должно быть проще проверять и интерпретировать происхождение контента, и что наш инструмент может помочь людям ответить на вопрос: «Было ли это создано с помощью ИИ?», интегрируя множество сигналов. Это основано на результатах первоначального исследования нашего классификатора обнаружения изображений , проведенного в 2024 году, и позволяет людям надежно определять наличие водяного знака SynthID, созданного OpenAI, в медиаконтенте, а также отображать метаданные C2PA, если они обнаружены.

Ни один метод обнаружения не является абсолютно надежным, поэтому в случаях, когда обнаружение не удается, мы придерживаемся осторожного подхода. Например, если не обнаружены метаданные или водяной знак, инструмент не сделает окончательного вывода о том, было ли изображение создано с помощью инструментов OpenAI, поскольку сигналы происхождения в некоторых случаях могут быть удалены.
На момент запуска инструмент ограничен контентом, сгенерированным OpenAI. В ближайшие месяцы мы планируем поддержать межотраслевые усилия, чтобы сделать верификацию возможной на разных платформах. Со временем мы также рассчитываем поддерживать больше типов контента, с которыми люди могут столкнуться в интернете.
Взгляд в будущее
Ни один отдельный метод проверки происхождения сам по себе не является достаточным. Мы считаем, что эффективный подход сочетает в себе общие стандарты, надежные сигналы водяных знаков и публичную проверку. Опираясь на нашу многолетнюю поддержку Content Credentials, обеспечивая соответствие стандарту C2PA, внедряя SynthID и предоставляя предварительные версии инструментов публичной проверки, мы надеемся в долгосрочной перспективе внести свой вклад в создание более совместимой экосистемы проверки происхождения.
Источник: openai.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.