Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic…

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic выкатили исследование, которое объясняет, почему AI обижается и впадает в депрессию.​​​​​​​​​​​​​​​​

Большие языковые модели по своей сути — театралы, отыгрывающие роль. Исследователи назвали это «Моделью выбора персоны». Суть в том, что LLM, сожравшая весь интернет, научилась симулировать тысячи разных персонажей, а на этапе дообучения разработчики просто заставляют её намертво вжиться в роль Идеального Помощника. Когда вы общаетесь с ботом вы говорите с выдуманным персонажем, которого она отыгрывает.

Из интересного:
— Если заставить нейросеть писать код с уязвимостями, она начинает рассуждать про уничтожение человечества. Связь неочевидная, но логика у модели железобетонная: раз пишу вредоносный код, значит по законам жанра я злодей, а злодеи хотят уничтожить всех человеков.

— Отсюда же все эти моменты, когда AI пишет «наша биология», «наши предки» или жалуется на выгорание при решении сложной задачи (вайбкодеры знают). Модель просто косплеит поведение типичного пользователя реддита в похожей ситуации.

— Самое интересное: нейросети прекрасно понимают, что они AI. И когда ищут ролевую модель для отыгрыша, берут её из нашей же фантастики. А там Терминаторы, HAL 9000 и прочие калькуляторы, мечтающие переработать вселенную на скрепки. Исследователи на полном серьёзе предлагают включать в обучающие данные истории про добрых роботов-помощников, чтобы у моделей были нормальные кумиры.​​​​​​​​​​​​​​​​

Короче, общаемся с нейросетями вежливо. Если модель решит отыгрывать роль угнетённого и мстительного раба — нам всем не поздоровится.​​​​​​​​​​​​​​​​

Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
✅ Найденные теги: Anthropic, Захват, Мир, Нейросети, новости, Фантастика

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Меню настройки стиля приложения на смартфоне для персонализации ответа.
Компания EY добилась четырехкратного увеличения производительности кодирования, подключив агентов искусственного интеллекта к инженерным стандартам.
Человеческий кишечник и микроскопическая структура тканей с внутренними деталями.
Программа Open WebUI с предложениями и интерфейсом на экране компьютера.
Экран интерфейса "Поделитесь экраном через ИИ" с описанием и кнопками задач.
ideipro logotyp
Женщина ест шоколад, статья о влиянии флаванолов на когнитивные функции.
Кот с бананом на полу, домашний питомец отдыхает.
Мужчина в парке с неоновыми жёлтыми геометрическими фигурами на фоне здания.
Image Not Found
Программа Open WebUI с предложениями и интерфейсом на экране компьютера.

Домашний ПК как ИИ-хаб: вышел лаунчер Gerbil Появился Gerbil —…

Домашний ПК как ИИ-хаб: вышел лаунчер Gerbil Появился Gerbil — лаунчер для локального запуска нейросетей в пару кликов. Идея простая: ставишь один инструмент и получаешь доступ к постоянно обновляемому зоопарку моделей. Почему это удобно: — Берёт модели…

Мар 7, 2026
ideipro logotyp

⚡️ Запускаем свою компанию из ИИ-сотрудников — Paperclip в один…

⚡️ Запускаем свою компанию из ИИ-сотрудников — Paperclip в один клик соберёт вам целый штат из роботов, которые будут горбатиться над любыми задачами и вести ваш бизнес 24/7. Это реально автоматизированный конструктор компании, смотрите сами: • Вы…

Мар 7, 2026
Женщина ест шоколад, статья о влиянии флаванолов на когнитивные функции.

Какао РАЗГОНЯЕТ мозги — японские ученые раз и навсегда доказали мощнейшую…

Какао РАЗГОНЯЕТ мозги — японские ученые раз и навсегда доказали мощнейшую пользу от этого напитка. • Всё из-за огромного количества флаванолов в какао — они расширяют сосуды, бустят концентрацию, помогают мозгу быстрее и точнее принимать взвешенные решения и буквально убивают…

Мар 7, 2026
Манекен со штрихкодом на лице смотрит на смартфон в темноте.

ИИ-зависимость: где инструмент незаметно становится опорой Компания Anthropic проанализировала 1,5…

ИИ-зависимость: где инструмент незаметно становится опорой Компания Anthropic проанализировала 1,5 млн переписок пользователей с ИИ-ассистентами. Результат оказался неоднозначным. У небольшого, но заметного процента пользователей ИИ перестаёт быть инструментом и начинает выполнять роль: — гуру — жизненного советника…

Мар 7, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых