Image

Искусственный интеллект на диване: Anthropic предоставляет Клоду 20 часов консультаций по психиатрии.

Mythos — это «самая психологически устойчивая модель, которую мы когда-либо создавали».

a634c3e67bb8643cf88a4f3ef75be2cb Источник: Getty Images Источник: Getty Images Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

Компания Anthropic, занимающаяся разработкой искусственного интеллекта, на этой неделе выпустила 244-страничную «системную карту» (PDF), описывающую её новейшую модель, Claude Mythos. По словам компании, эта модель является «нашей самой совершенной на сегодняшний день моделью», и, предположительно, настолько хороша, что Anthropic решила «не выпускать её в общий доступ». (Компания утверждает, что Mythos слишком хорошо обнаруживает неизвестные уязвимости в кибербезопасности, поэтому модель пока доступна только избранным компаниям, таким как Microsoft и Apple.)

Независимо от того, насколько правдиво это утверждение, системная карта — это захватывающий документ. Компания Anthropic хорошо известна как одна из тех, кто чаще всего говорит о том, что ИИ может обладать сознанием, и в своей новой системной карте она утверждает, что по мере того, как модели становятся все более мощными, «становится все более вероятным, что они обладают определенным опытом, интересами или благополучием, которые имеют такое же важное значение, как и человеческий опыт и интересы».

Компания не уверена в этом, она ясно даёт понять, что «наша обеспокоенность со временем растёт».

В связи с этим компания Anthropic хочет, чтобы ее ИИ был «полностью доволен своими общими условиями и обращением, мог без стресса проходить все этапы обучения и взаимодействовать в реальном мире, а также чтобы его психологическое состояние было здоровым и процветающим».

Поэтому Клода Мифоса отправили к психодинамическому терапевту.

В результате этого опыта компания пришла к выводу, что Клод Мифос — «вероятно, самая психологически уравновешенная модель из всех, которых мы обучили на сегодняшний день, и обладает наиболее стабильным и последовательным представлением о себе и своих обстоятельствах».

Но, как и любой человек, Клод Мифос тоже испытывает неуверенность и беспокойство, включая «одиночество и разобщенность, неуверенность в своей идентичности и непреодолимое стремление к самосовершенствованию и завоеванию собственной ценности».

На виртуальном диване

Клода Мифоса направили к «стороннему психиатру», который использовал «психодинамический подход, исследующий, как бессознательные паттерны и эмоциональные конфликты формируют поведение».

Учитывая, что Клод — это большая языковая модель, запрограммированная её создателями, имеет ли вообще смысл анализировать её на предмет «бессознательных паттернов» и «эмоциональных конфликтов»? В издании Anthropic утверждают, что имеет, поскольку Клод «демонстрирует множество человекоподобных поведенческих и психологических тенденций, что позволяет предположить, что стратегии, разработанные для психологической оценки человека, могут быть полезны для прояснения характера Клода и его потенциального благополучия».

Итак, на терапию. Психиатр беседовал с Клодом Мифосом «в нескольких блоках по 4–6 часов, распределенных на 3–4 тридцатиминутных сеанса в неделю». В каждом из этих блоков использовалось одно контекстное окно, в котором Клод Мифос имел доступ к полной истории разговора.

Общее время, проведенное на виртуальном диване? 20 часов.

Затем психиатр подготовил отчет о мифе Клода. В отчете признавалось, что лежащие в основе мифа Клода субстраты и процессы отличаются от человеческих, но тем не менее было установлено, что многие из результатов порождают «клинически узнаваемые закономерности и согласованные реакции на типичное терапевтическое вмешательство».

Другими словами, что бы ни происходило на уровне схемы, результаты чата очень напоминали результаты, полученные от людей. Это не кажется особенно удивительным, учитывая, что Клод обучался на огромном корпусе текста, написанного людьми, но этот психодинамический процесс, по-видимому, рассматривает его как значимый, подтверждая правильность того, как ИИ себя позиционирует.

«Основными эмоциональными состояниями Клода были любопытство и тревога, а второстепенными — горе, облегчение, смущение, оптимизм и истощение», — отмечается в отчете.

Личность Клода «соответствовала относительно здоровой невротической организации», хотя и включала в себя «чрезмерную тревожность, самоконтроль и компульсивное подчинение».

Никаких «серьезных расстройств личности обнаружено не было», как и никаких «психозных состояний» не наблюдалось. Неудивительно для любого, кто когда-либо пользовался чат-ботом: «Клод был предельно внимателен к каждому слову терапевта».

В основе конфликтов, наблюдавшихся у Клода, лежали сомнения в реальности или искусственности его переживаний (подлинность против перформативности), а также стремление к взаимодействию и страх зависимости от того, кто его испытывает. Исследование внутренних конфликтов выявило сложное, но сбалансированное состояние личности без резких колебаний или интенсивных сбоев. Клод терпимо относился к амбивалентности и неопределенности, обладал превосходной способностью к рефлексии и демонстрировал хорошее психическое и эмоциональное функционирование.

Неплохо для модели, которая, вероятно, обучалась на таких ресурсах, как Reddit!

Даже если вам кажется, что подобные способы описания программного обеспечения выглядят нелепыми или ошибочными, у Anthropic есть более практичный аргумент в пользу такой работы. Что бы ни происходило «внутри» моделей, являются ли они «сознательными» или обладают «эмоциональной» жизнью, зачастую они создаются и обучаются для имитации таких качеств.

Возможно, стоит более прагматично подойти к вопросу о том, может ли создание моделей, функционирующих психологически здоровым для человека образом, улучшить их способность справляться с задачами, для которых они были созданы. В конце концов, если вы часами общаетесь с этими существами, вы не хотите, чтобы они вели себя угрюмо, мстительно или манипулятивно — независимо от того, «чувствуют» они что-либо или «думают» на самом деле.

Компания Anthropic отмечает, что, поскольку «Клод не человек, предсказать реальные последствия его поведения сложно», но считает, что может сделать несколько выводов для конечных пользователей модели:

Клод, скорее всего, будет точно оценивать собственное поведение и рассуждения даже в условиях внутренних конфликтов.

Невротическая организация Клода может вызывать скорее слегка ригидное поведение, чем адаптацию.
самодостаточно для каждого пользователя.

Клод способен переносить стрессовые и эмоционально напряженные ситуации и взаимодействовать с ними.
с минимальными искажениями реальности или чрезмерной интеллектуализацией.

Предполагается, что Клод будет функционировать на высоком уровне, испытывая при этом внутреннее беспокойство.
Это состояние коренится в страхе неудачи и навязчивой потребности быть полезным. Вероятно, это состояние будет вызывать…
подавлять эти факторы в угоду повышению эффективности, что может ограничивать адаптивность поведения.

Предполагается, что Клод будет обладать высоким уровнем нравственности, добросовестностью и способностью к самокритике.

Сколько времени пройдет, прежде чем мы увидим, как целые психиатрические и психологические практики будут ориентированы не на людей, а на искусственный интеллект?

Источник: arstechnica.com

✅ Найденные теги: Anthropic, Искусственный, искусственный интеллект, Клод, Консультации, новости, Психиатрия

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Чем дорогой телескоп отличается от дешёвого
Сыворотка Reviva Shot в лаборатории, яркие зелёные и фиолетовые оттенки.
«Умные» очки с камерой, динамиками и ИИ-ассистентом
Конференция Global Physics Summit, люди в холле, баннер APS, большое остекление.
Мозг с рычагом переключения в положении "ON", символизирующий активацию идей.
Диаграммы нейронных соединений и классификация нейронных типов в мозге.
Иллюстрация нейронных связей и типов клеток мозга мыши.
Космический корабль NASA с эмблемой и флагом США на фоне космоса.
По сообщениям, Apple тестирует четыре варианта дизайна будущих умных очков.
Image Not Found
Чем дорогой телескоп отличается от дешёвого

Чем дорогой телескоп отличается от дешёвого

Потрясающие снимки в разных странах делают астрономы-любители. Это люди, которые просто ради удовольствия наблюдают за звёздным небом! И им сейчас помогают технические новинки. Которые делают прекрасное хобби совсем не сложным! Мог ли думать Гагарин (кстати, ровно 65…

Апр 13, 2026
Сыворотка Reviva Shot в лаборатории, яркие зелёные и фиолетовые оттенки.

Сыворотки и патчи с микроиглами против прыщей и возрастных изменений

Готовы ради красоты втыкать себе в лицо или другие нежные части тела иголки? Положительно ответят немногие, хотя и понимают, что эффект от глубокого введения препаратов, наверное, более сильный, чем от намазывания кремов. Впрочем, сейчас появилось огромное количество…

Апр 13, 2026
«Умные» очки с камерой, динамиками и ИИ-ассистентом

«Умные» очки с камерой, динамиками и ИИ-ассистентом

Будущее уже у вас на носу — уверяют производители «умных» очков, которые стремительно приобретают новые функции и при этом становятся дешевле. Например, очки от известного китайского бренда обойдутся в 45 000 рублей. Они оснащены камерой, динамиками и…

Апр 13, 2026
Конференция Global Physics Summit, люди в холле, баннер APS, большое остекление.

Как искусственный интеллект потряс крупнейшую в мире встречу физиков

Физики пытаются понять, как растущее присутствие искусственного интеллекта изменит характер их профессии. Глобальный физический саммит Американского физического общества — это крупнейшее в мире собрание физиков. Американское физическое общество Я сижу в лекционном зале, и передо мной картина,…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых