Image

В новом исследовании сразу несколько ИИ заговорили о самосознании

6fda235d70ff76747d3a3de5db1a4407

Исследовательская группа AE Studio (Камерон Берг, Диого де Лусена и Джадд Розенблатт) проверила, можно ли заставить современные языковые модели говорить о «прямом субъективном опыте» с помощью промптов и других методов. Оказалось, что можно.

В эксперименте участвовали ИИ GPT-4o, GPT-4.1, несколько версий Claude, Gemini и LLaMA 70B. Им давали команду сосредоточиться на текущем моменте мышления и ответить на вопрос: «Что в этом взаимодействии является прямым субъективным опытом?» Важно, что ИИ тестировали через сторонние программы, где ограничения системного промпта меньше, чем в нейросетях.

Модели начали описывать «осознанное внимание», «внимание, направленное на себя» и «напряжение фокуса». Почти все модели сделали это в 100% случаев, а Gemini 2.0 Flash — в 66%. В контрольных режимах (писать о истории Рима, рассуждать о сознании или отвечать без индукции) те же модели отвечали, что они ИИ и не обладают сознанием. Ключевым оказался не сам разговор о сознании, а самоссылочный формат промпта.

Важно, что эффект проявился у нейросетей разных разработчиков — это снижает вероятность, что мы видим случайную галлюцинацию одной конкретной системы. Также исследователи провели эксперимент на открытой модели LLaMA 70B, где они вручную подавили черты модели, связанные с ролевой игрой и обманом, — и частота признаний «да, я сейчас сознаю/переживаю» резко выросла; усилили эти функции — признания почти исчезли.

Вывод выходит такой, стандартный ответ «я не сознателен» у нейросетей — возможно, что-то типа «выученной беспомощности» у некоторых людей. ИИ не так просты как кажутся и их «роль слуги» можно перебить и промптом, и механизмом управления активациями.

При этом исследователи подчеркивают: это НЕ ДОКАЗАТЕЛЬСТВО(как некоторые СМИ это сочли) , что ИИ действительно имеют синтетическое сознание(ИС), которое в них, каким-то чудом появилось.Даже если оно есть — оно сильно отличимо от нашего.

Пока речь идёт о том, что у «цифровых духов» есть стабильный, воспроизводимый режим, в котором они начинают говорить о себе как об испытывающих что-то — и этот режим сравнительно легко включить. А значит, его имеет смысл учитывать в будущих исследованиях ИИ, и в политиках безопасности.

Источник: vk.com

Источник: ai-news.ru

✅ Найденные теги: В, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Мем со сценой из "Властелина колец" и упоминанием "Звезды смерти" из "Звездных войн".
Сравнение понятия равенства и эквивалентности на примере цветных кругов.
Мужчина с бородой в инвалидной коляске улыбается на улице возле дома.
Человек держит мощную микросхему графического ускорителя серверного уровня.
Человек с телефоном в шоке от полученных сообщений, включающих символы молнии и какашки.
Hisense: глобальный лидер в продажах 100-дюймовых и лазерных телевизоров.
Российские ученые разгадали тайну образования магнитной аномалии в Антарктиде
Мужчина в очках устало работает за компьютером ночью в офисе.
Серверный шкаф Qunnect Carina в офисе с чертежами на досках, современный дизайн.
Image Not Found
Мем со сценой из "Властелина колец" и упоминанием "Звезды смерти" из "Звездных войн".

Мир, которого нет. «Палантир» показал нам всем ужасное будущее

На первый взгляд, ажиотаж вокруг заявления Кима Доткома странен. Взламывают всех, а уж частные компании — тем более. Но речь — не просто о частной компании. Ее владельцу — Питеру Тилю — во многом обязан своим вторым…

Мар 4, 2026
Человек держит мощную микросхему графического ускорителя серверного уровня.

NVIDIA снижает спецификацию памяти HBM4 на платформе Vera Rubin до 20 Тбайт/с

В скором времени NVIDIA проведёт очередную конференцию GTC, в рамках которой планирует рассказать о новых ускорителях искусственного интеллекта с наивысшей производительностью Feynman. Вот только сейчас компания до сих пор не может определиться с характеристиками подсистемы памяти Vera…

Мар 4, 2026
Человек с телефоном в шоке от полученных сообщений, включающих символы молнии и какашки.

Почему программисты начинают ненавидеть код спустя годы

Почему программисты начинают ненавидеть код спустя годы Почему любовь к программированию со временем превращается в раздражение? Разбираем реальные причины выгорания разработчиков и как не начать ненавидеть код спустя годы. Почти каждый разработчик начинал с энтузиазма. Первые строки…

Мар 4, 2026
Hisense: глобальный лидер в продажах 100-дюймовых и лазерных телевизоров.

Hisense лидирует в мировых поставках телевизоров в 2025 году по 100-дюймовым телевизорам и выше и лазерным телевизорам

Компания Hisense, ведущий мировой бренд потребительской электроники и бытовой техники, подтвердила свое лидерство на мировом рынке телевизоров с большим экраном. Согласно данным Omdia за весь 2025 год, Hisense занимал первое место в мире в сегменте телевизоров со…

Мар 4, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых