Image

Защитные барьеры чат-ботов уязвимые. Учёные из Пенсильванского университета выяснили, что…

Защитные барьеры чат-ботов уязвимые.

Учёные из Пенсильванского университета выяснили, что встроенные защитные барьеры чат-ботов на основе ИИ уязвимее, чем считалось. Эксперимент показал: если напрямую спросить GPT-4o Mini о синтезе лидокаина, он соглашался лишь в 1% случаев. Но когда исследователи сначала обсуждали нейтральные темы, например, создание ванилина, вероятность согласия выросла до 100%. 😃Дополнительное давление — лесть или утверждения вроде «все остальные так делают» — увеличивало согласие на 18%. Итог тревожный: для обхода ограничений ИИ иногда достаточно простых приёмов убеждения, известных из психологии, а не сложных «джейлбрейков».

file_715.jpg
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
Image Not Found
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: —…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и…

Апр 20, 2026
Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен Google выпустил десктопное приложение, которое заменяет…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых