Защитные барьеры чат-ботов уязвимые. Учёные из Пенсильванского университета выяснили, что…
Защитные барьеры чат-ботов уязвимые.
Учёные из Пенсильванского университета выяснили, что встроенные защитные барьеры чат-ботов на основе ИИ уязвимее, чем считалось. Эксперимент показал: если напрямую спросить GPT-4o Mini о синтезе лидокаина, он соглашался лишь в 1% случаев. Но когда исследователи сначала обсуждали нейтральные темы, например, создание ванилина, вероятность согласия выросла до 100%. 😃Дополнительное давление — лесть или утверждения вроде «все остальные так делают» — увеличивало согласие на 18%. Итог тревожный: для обхода ограничений ИИ иногда достаточно простых приёмов убеждения, известных из психологии, а не сложных «джейлбрейков».

Похожие записи
Оцените материал:
Похожие записи
Blender 5.0 ВЫШЕЛ — теперь любой может делать мультфильмы уровня…
20.11.2025
Сбер выпустил налогового ИИ-помощника, который поможет ВЕРНУТЬ деньги по налоговому…
20.11.2025
1.3 квадриллиона токенов: Gemini набирает обороты Google поделилась новой метрикой:…
17.10.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
