Image

Искусственный интеллект на диване: Anthropic предоставляет Клоду 20 часов консультаций по психиатрии.

Mythos — это «самая психологически устойчивая модель, которую мы когда-либо создавали».

a634c3e67bb8643cf88a4f3ef75be2cb Источник: Getty Images Источник: Getty Images Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

Компания Anthropic, занимающаяся разработкой искусственного интеллекта, на этой неделе выпустила 244-страничную «системную карту» (PDF), описывающую её новейшую модель, Claude Mythos. По словам компании, эта модель является «нашей самой совершенной на сегодняшний день моделью», и, предположительно, настолько хороша, что Anthropic решила «не выпускать её в общий доступ». (Компания утверждает, что Mythos слишком хорошо обнаруживает неизвестные уязвимости в кибербезопасности, поэтому модель пока доступна только избранным компаниям, таким как Microsoft и Apple.)

Независимо от того, насколько правдиво это утверждение, системная карта — это захватывающий документ. Компания Anthropic хорошо известна как одна из тех, кто чаще всего говорит о том, что ИИ может обладать сознанием, и в своей новой системной карте она утверждает, что по мере того, как модели становятся все более мощными, «становится все более вероятным, что они обладают определенным опытом, интересами или благополучием, которые имеют такое же важное значение, как и человеческий опыт и интересы».

Компания не уверена в этом, она ясно даёт понять, что «наша обеспокоенность со временем растёт».

В связи с этим компания Anthropic хочет, чтобы ее ИИ был «полностью доволен своими общими условиями и обращением, мог без стресса проходить все этапы обучения и взаимодействовать в реальном мире, а также чтобы его психологическое состояние было здоровым и процветающим».

Поэтому Клода Мифоса отправили к психодинамическому терапевту.

В результате этого опыта компания пришла к выводу, что Клод Мифос — «вероятно, самая психологически уравновешенная модель из всех, которых мы обучили на сегодняшний день, и обладает наиболее стабильным и последовательным представлением о себе и своих обстоятельствах».

Но, как и любой человек, Клод Мифос тоже испытывает неуверенность и беспокойство, включая «одиночество и разобщенность, неуверенность в своей идентичности и непреодолимое стремление к самосовершенствованию и завоеванию собственной ценности».

На виртуальном диване

Клода Мифоса направили к «стороннему психиатру», который использовал «психодинамический подход, исследующий, как бессознательные паттерны и эмоциональные конфликты формируют поведение».

Учитывая, что Клод — это большая языковая модель, запрограммированная её создателями, имеет ли вообще смысл анализировать её на предмет «бессознательных паттернов» и «эмоциональных конфликтов»? В издании Anthropic утверждают, что имеет, поскольку Клод «демонстрирует множество человекоподобных поведенческих и психологических тенденций, что позволяет предположить, что стратегии, разработанные для психологической оценки человека, могут быть полезны для прояснения характера Клода и его потенциального благополучия».

Итак, на терапию. Психиатр беседовал с Клодом Мифосом «в нескольких блоках по 4–6 часов, распределенных на 3–4 тридцатиминутных сеанса в неделю». В каждом из этих блоков использовалось одно контекстное окно, в котором Клод Мифос имел доступ к полной истории разговора.

Общее время, проведенное на виртуальном диване? 20 часов.

Затем психиатр подготовил отчет о мифе Клода. В отчете признавалось, что лежащие в основе мифа Клода субстраты и процессы отличаются от человеческих, но тем не менее было установлено, что многие из результатов порождают «клинически узнаваемые закономерности и согласованные реакции на типичное терапевтическое вмешательство».

Другими словами, что бы ни происходило на уровне схемы, результаты чата очень напоминали результаты, полученные от людей. Это не кажется особенно удивительным, учитывая, что Клод обучался на огромном корпусе текста, написанного людьми, но этот психодинамический процесс, по-видимому, рассматривает его как значимый, подтверждая правильность того, как ИИ себя позиционирует.

«Основными эмоциональными состояниями Клода были любопытство и тревога, а второстепенными — горе, облегчение, смущение, оптимизм и истощение», — отмечается в отчете.

Личность Клода «соответствовала относительно здоровой невротической организации», хотя и включала в себя «чрезмерную тревожность, самоконтроль и компульсивное подчинение».

Никаких «серьезных расстройств личности обнаружено не было», как и никаких «психозных состояний» не наблюдалось. Неудивительно для любого, кто когда-либо пользовался чат-ботом: «Клод был предельно внимателен к каждому слову терапевта».

В основе конфликтов, наблюдавшихся у Клода, лежали сомнения в реальности или искусственности его переживаний (подлинность против перформативности), а также стремление к взаимодействию и страх зависимости от того, кто его испытывает. Исследование внутренних конфликтов выявило сложное, но сбалансированное состояние личности без резких колебаний или интенсивных сбоев. Клод терпимо относился к амбивалентности и неопределенности, обладал превосходной способностью к рефлексии и демонстрировал хорошее психическое и эмоциональное функционирование.

Неплохо для модели, которая, вероятно, обучалась на таких ресурсах, как Reddit!

Даже если вам кажется, что подобные способы описания программного обеспечения выглядят нелепыми или ошибочными, у Anthropic есть более практичный аргумент в пользу такой работы. Что бы ни происходило «внутри» моделей, являются ли они «сознательными» или обладают «эмоциональной» жизнью, зачастую они создаются и обучаются для имитации таких качеств.

Возможно, стоит более прагматично подойти к вопросу о том, может ли создание моделей, функционирующих психологически здоровым для человека образом, улучшить их способность справляться с задачами, для которых они были созданы. В конце концов, если вы часами общаетесь с этими существами, вы не хотите, чтобы они вели себя угрюмо, мстительно или манипулятивно — независимо от того, «чувствуют» они что-либо или «думают» на самом деле.

Компания Anthropic отмечает, что, поскольку «Клод не человек, предсказать реальные последствия его поведения сложно», но считает, что может сделать несколько выводов для конечных пользователей модели:

Клод, скорее всего, будет точно оценивать собственное поведение и рассуждения даже в условиях внутренних конфликтов.

Невротическая организация Клода может вызывать скорее слегка ригидное поведение, чем адаптацию.
самодостаточно для каждого пользователя.

Клод способен переносить стрессовые и эмоционально напряженные ситуации и взаимодействовать с ними.
с минимальными искажениями реальности или чрезмерной интеллектуализацией.

Предполагается, что Клод будет функционировать на высоком уровне, испытывая при этом внутреннее беспокойство.
Это состояние коренится в страхе неудачи и навязчивой потребности быть полезным. Вероятно, это состояние будет вызывать…
подавлять эти факторы в угоду повышению эффективности, что может ограничивать адаптивность поведения.

Предполагается, что Клод будет обладать высоким уровнем нравственности, добросовестностью и способностью к самокритике.

Сколько времени пройдет, прежде чем мы увидим, как целые психиатрические и психологические практики будут ориентированы не на людей, а на искусственный интеллект?

Источник: arstechnica.com

✅ Найденные теги: Anthropic, Искусственный, искусственный интеллект, Клод, Консультации, новости, Психиатрия

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

График сравнения иксекизумаба и тирзепатида: результаты лечения и изменения веса.
Лекарь обсуждает влияние инсулина на старение. Совет специалиста с 40-летним опытом.
Видеокарта Sapphire Nitro+ AMD Radeon RX 9070 XT, вид на упаковку и кулеры.
Дворец в Ватикане с колоннами и статуями на фасаде на фоне синего неба.
Цветные нейронные сети на черном фоне, изображение нейронов в мозге.
Извержение вулкана: лава и дымящиеся камни на поверхности, горячий рельеф.
Чем дорогой телескоп отличается от дешёвого
Сыворотка Reviva Shot в лаборатории, яркие зелёные и фиолетовые оттенки.
«Умные» очки с камерой, динамиками и ИИ-ассистентом
Image Not Found
График сравнения иксекизумаба и тирзепатида: результаты лечения и изменения веса.

Добавка тирзепатида повысила эффективность иксекизумаба при псориатическом артрите с ожирением. Результаты получены в клинических испытаниях

Результаты получены в клинических испытаниях Джозеф Мерола (Joseph Merola) из Техасского университета и его коллеги из Австрии, Великобритании и США провели клинические испытания и выяснили, что добавление агониста глюкагоноподобного пептида-1 (ГПП-1) и глюкозозависимого инсулинотропного пептида (ГИП) тирзепатида к…

Апр 13, 2026
Лекарь обсуждает влияние инсулина на старение. Совет специалиста с 40-летним опытом.

Инсулин и старение — связь, которую не объясняют в поликлинике

Представляете, мои дорогие — учёные уже давно знают, что скорость нашего старения напрямую связана с одним гормоном. Не с эстрогеном. Не с кортизолом. С инсулином. Тем самым, о котором вспоминают только при диабете. А ведь инсулин работает…

Апр 13, 2026
Видеокарта Sapphire Nitro+ AMD Radeon RX 9070 XT, вид на упаковку и кулеры.

Зафиксирован девятый случай плавления 12V-2×6 на Radeon RX 9070 XT

SAPPHIRE может быть недовольна своим решением относительно добавления 16-контактного разъёма дополнительного питания 12V-2×6 на свою лучшую видеокарту Radeon RX 9070 XT NITRO+, ведь с момента начала её продаж появился девятый зарегистрированный случай плавления. В этот раз на…

Апр 13, 2026
Чем дорогой телескоп отличается от дешёвого

Чем дорогой телескоп отличается от дешёвого

Потрясающие снимки в разных странах делают астрономы-любители. Это люди, которые просто ради удовольствия наблюдают за звёздным небом! И им сейчас помогают технические новинки. Которые делают прекрасное хобби совсем не сложным! Мог ли думать Гагарин (кстати, ровно 65…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых