Архив рубрики ~Коротко из Telegram~

Защитные барьеры чат-ботов уязвимые. Учёные из Пенсильванского университета выяснили, что…

Защитные барьеры чат-ботов уязвимые. Учёные из Пенсильванского университета выяснили, что…

Защитные барьеры чат-ботов уязвимые.

Учёные из Пенсильванского университета выяснили, что встроенные защитные барьеры чат-ботов на основе ИИ уязвимее, чем считалось. Эксперимент показал: если напрямую спросить GPT-4o Mini о синтезе лидокаина, он соглашался лишь в 1% случаев. Но когда исследователи сначала обсуждали нейтральные темы, например, создание ванилина, вероятность согласия выросла до 100%. 😃Дополнительное давление — лесть или утверждения вроде «все остальные так делают» — увеличивало согласие на 18%. Итог тревожный: для обхода ограничений ИИ иногда достаточно простых приёмов убеждения, известных из психологии, а не сложных «джейлбрейков».

file_715.jpg

Оцените материал:

Читайте также
Архив рубрики ~Лента новостей~ План получения степени магистра права (LLM) в области инженерии к 2026 году Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси. Архив рубрики ~Лента новостей~ А вас вайб-кодеры уже достали? Архив рубрики ~Лента новостей~ ЕС опубликовал руководство по маркировке контента, созданного с помощью ИИ, в преддверии крайнего срока, установленного на август для вступления в силу Закона об ИИ. Архив рубрики ~Обо всем~ Голландская крайне правая партия выплатила компенсацию художнику, изменившему изображение с помощью ИИ. Архив рубрики ~Лента новостей~ Спасут ли теперь шапочки из фольги от Старлинка Илона Маска?? Архив рубрики ~Лента новостей~ Опыт построения ИИ-продукта в соло-режиме Архив рубрики ~Полезное~ Передовая платформа для создания видео с искусственным интеллектом Magic HourAI Архив рубрики ~Лента новостей~ Компания Anthropic закрывает Fable и модели Mythos по указанию администрации Трампа. Архив рубрики ~Обо всем~ Ученые уточнили времена существования древних культур Придонья: Гуманитарные науки Архив рубрики ~Лента новостей~ Компания Fox приобретет Roku за 22 миллиарда долларов. Архив рубрики ~Лента новостей~ Операционная система Wear OS 7 от Google намекает на будущее, в котором очки и носимые устройства будут работать в гармонии. Архив рубрики ~Обо всем~ AMD объяснила приличную задержку выхода FSR 4.1 для видеокарт на RDNA 2 Архив рубрики ~Лента новостей~ Прекратите писать циклы в Pandas: 7 более быстрых альтернатив. Архив рубрики ~Лента новостей~ План получения степени магистра права (LLM) в области инженерии к 2026 году Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси. Архив рубрики ~Лента новостей~ А вас вайб-кодеры уже достали? Архив рубрики ~Лента новостей~ ЕС опубликовал руководство по маркировке контента, созданного с помощью ИИ, в преддверии крайнего срока, установленного на август для вступления в силу Закона об ИИ. Архив рубрики ~Обо всем~ Голландская крайне правая партия выплатила компенсацию художнику, изменившему изображение с помощью ИИ. Архив рубрики ~Лента новостей~ Спасут ли теперь шапочки из фольги от Старлинка Илона Маска?? Архив рубрики ~Лента новостей~ Опыт построения ИИ-продукта в соло-режиме Архив рубрики ~Полезное~ Передовая платформа для создания видео с искусственным интеллектом Magic HourAI Архив рубрики ~Лента новостей~ Компания Anthropic закрывает Fable и модели Mythos по указанию администрации Трампа. Архив рубрики ~Обо всем~ Ученые уточнили времена существования древних культур Придонья: Гуманитарные науки Архив рубрики ~Лента новостей~ Компания Fox приобретет Roku за 22 миллиарда долларов. Архив рубрики ~Лента новостей~ Операционная система Wear OS 7 от Google намекает на будущее, в котором очки и носимые устройства будут работать в гармонии. Архив рубрики ~Обо всем~ AMD объяснила приличную задержку выхода FSR 4.1 для видеокарт на RDNA 2 Архив рубрики ~Лента новостей~ Прекратите писать циклы в Pandas: 7 более быстрых альтернатив.