Защитные барьеры чат-ботов уязвимые. Учёные из Пенсильванского университета выяснили, что…
Защитные барьеры чат-ботов уязвимые.
Учёные из Пенсильванского университета выяснили, что встроенные защитные барьеры чат-ботов на основе ИИ уязвимее, чем считалось. Эксперимент показал: если напрямую спросить GPT-4o Mini о синтезе лидокаина, он соглашался лишь в 1% случаев. Но когда исследователи сначала обсуждали нейтральные темы, например, создание ванилина, вероятность согласия выросла до 100%. 😃Дополнительное давление — лесть или утверждения вроде «все остальные так делают» — увеличивало согласие на 18%. Итог тревожный: для обхода ограничений ИИ иногда достаточно простых приёмов убеждения, известных из психологии, а не сложных «джейлбрейков».

Похожие записи
Оцените материал:
Похожие записи
Влетаем в тему генеративного ИИ с двух ног — Microsoft…
25.07.2025
Сравнием работу GPT-5 с Claude 4 и Grok 4 —…
09.08.2025
Тест сравнение двух нейронок. В сети проверили, как справляются GigaChat…
31.08.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
