Чему меня научил Astro от Amazon о том, как наделить роботов душой.
В 2018 году Amazon пригласила меня на должность ведущего дизайнера пользовательского интерфейса и звука для Astro, их первого потребительского домашнего робота. Astro использовал камеры и другие датчики для построения карты и навигации по дому и рабочему месту, а также мог активно патрулировать территорию, следить за близкими и перевозить мелкие предметы с помощью встроенного грузового отсека. Хотя набор функций и форм-фактор были четко определены, изначально не было четкого представления о характере робота. На самом деле, еще до того, как у Astro появилось имя, возникали два главных вопроса: это просто Alexa на колесах или робот со своим собственным характером?
В команде Astro мнения разделились. Один из вариантов заключался в том, чтобы сосредоточиться на Alexa и рассматривать мобильного робота просто как дополнительную функцию. Я, как и большинство членов команды UX, выступал за то, чтобы Astro не фокусировался на Alexa. Мы считали, что устройство, которое перемещается по вашему дому и поворачивается к вам с определенной целью, никогда не может быть просто бытовым прибором. Люди будут приписывать ему определенные черты характера, хотим мы этого или нет, поэтому вопрос заключался лишь в том, сформировали ли мы эти черты сами или позволили им проявиться случайно.
В конечном итоге, Astro стал Astro, а не Alexa, и пользовательское тестирование подтвердило правильность нашего решения. Люди не воспринимали робота как Alexa. Они видели в нем самостоятельного персонажа, и именно таким они его и хотели видеть. Alexa на устройстве казалась несколько странной и жутковатой, но создание собственного голоса для Astro в 2018 году было слишком медленным и дорогостоящим процессом. Поэтому мы остановились на Alexa как на вспомогательном персонаже, который занимался собственно разговором, в то время как Astro стал главным персонажем, общающимся настолько, насколько это возможно без слов, посредством звука, движений и мимики.
Меня пригласили в команду Astro, чтобы определить язык звукового оформления и голос робота. Но некому было проработать истинный характер робота. Невозможно принять ни одного реального решения о персонаже, не определив его сначала. Каждый выбор, касающийся движений, звуков, пауз или реакций Astro, был выбором, связанным с характером, и эти решения требовали совместной работы всех специалистов. В качестве ведущего звукорежиссера я объединял звук, движение и характер, и то, как они взаимодействуют в каждом сюжетном моменте. Аниматоры, которые программировали движения и мимику Astro, были великолепны в своем деле, но эмоциональная линия, которую они анимировали, сначала создавалась на основе звуковой (а значит, и характерной) работы. Поэтому я взял на себя эту роль, и именно здесь началась моя настоящая работа. То, что я узнал о создании характера для роботов, применимо почти ко всему, что сейчас создается в области воплощенного ИИ.
Персонаж — это система дизайна.
Разработка персонажа для Astro означала ответы на вопросы, которые никогда раньше не задавались о товарах в Amazon: Каков диапазон эмоций в базовом состоянии этого робота? Как этот робот передает неуверенность, не подрывая доверия? Где проходит грань между выразительностью и раздражением? Каковы уязвимые места в характере этого устройства?
Это вопросы проектирования. На них есть реальные ответы, и каждая команда, работающая над продуктом, должна отталкиваться от них. Например, изначально эмоциональный диапазон Астро был задуман как относительно небольшой. Мы никогда не хотели, чтобы Астро слишком расстраивался или слишком злился. Он мог изображать грусть, но быстро приходил в себя и заканчивал реакцию на позитивной ноте, чтобы сохранить позитивный настрой.
Характер персонажа проявляется в каждой детали и может создавать разрозненное впечатление, если он неправильно определен. Даже если это всего лишь небольшая неточность в анимации или технически правильный, но неуместный в контексте ответ, пользователи чувствуют все эти несоответствия, даже если не могут их назвать. Посмотрите, что происходит в начале и в конце этой последовательности Sing:
Астро переходит из ничего в эмоциональный момент, а затем снова возвращается в ничто. Ни нарастания, ни спада, ни ощущения, что чувство откуда-то взялось или куда-то могло деться. Я упорно добивался улучшения проработки персонажей, переходов между выразительными моментами, которые делают выступление непрерывным, а не смонтированным, но это так и не было реализовано. Сам момент работает. Но без проработки он воспринимается как отрывок, воспроизводимый роботом, а не как нечто, исходящее изнутри самого робота-персонажа.
Сюжет и звуковое оформление в начале
Мы решили, что у Астро не будет озвучки, но у него был кое-что, выполняющее ту же функцию: словарь звуков, тонов и ритмов, который служил ему голосом. Этот словарь стал основным выражением личности персонажа. Движения и мимика робота были построены вокруг него.
Последовательность пробуждения Астро — отличный тому пример. Пробуждение было не просто анимацией загрузки на экране; это было целое представление. Сначала медленный и скромный, робот спокойно ориентировался, затем растянул экран, проверил колеса и, наконец, жестом вверх в сторону телескопической мачты, слегка поднял ее и исполнил небольшой танец радости. Звук, движение и взгляд синхронизировались в единой хореографии.
События, происходящие с этим персонажем, изначально были описаны как история. Астро впервые просыпается в своем новом доме. Его главное стремление — стать частью семьи, поэтому это тот момент, которого он ждал, это его предназначение. Будучи ответственным персонажем, он хочет убедиться, что все в порядке, прежде чем представиться и начать осваивать свой новый дом.
Этот сюжет появился первым, потому что он определял все остальные наши решения. После того, как история была написана, звук придал ей метафорический голос: возбужденные интонации, ритмичные шаги, когда он проверял колеса, и яркая мелодичная фраза, когда Астро впервые посмотрел на свою новую семью и представился. После того, как звук был записан, аниматоры занялись движением и мимикой, ориентируясь на эмоциональную линию, заданную звуком. Движение не было определяющим — оно следовало за настроением истории и звуками, подобно тому, как аниматор следует за записанным голосовым фрагментом.
Эта последовательность пробуждения стала одним из самых обсуждаемых моментов на ранних этапах пользовательского тестирования. Люди описывали её как «живую». Реакция не ограничивалась каким-либо одним элементом. Все три канала (звук, движение и мимика) гармонично передавали один и тот же определённый характер.
Контекст – это то место, где персонаж становится реальным.
Наиболее убедительные персонажи определяются не фиксированным характером, а тем, как они реагируют на окружающую среду и людей в ней. Они остаются узнаваемыми, даже адаптируясь. Это я называю контекстуальным характером. Робот, живущий в доме, не находится в одном эмоциональном состоянии. Он перемещается по комнатам с разной энергетикой, встречает людей в разном настроении, работает в разное время суток и реагирует на бесконечное множество социальных ситуаций, для которых он изначально не был предназначен.
Нам удалось приблизиться к контекстно-зависимому воспроизведению звука Астро. Когда подавался конкретный фрагмент окружающей среды, система прекрасно адаптировалась, и Астро казался совершенно живым. Но каждое подобное состояние всё ещё было предсказанием, которое мы делали вручную — ситуацией, которую нам приходилось заранее представлять и к которой нужно было разработать ответ. Случайная обстановка в доме создаёт для робота гораздо больше ситуаций, чем кто-либо может предсказать, поэтому всегда оставался длинный список моментов, к которым система никогда не была готова.
Разница между продуктом, который люди описывают как «умный», и продуктом, который они описывают как «осознающий», часто сводится к следующему. Умность — это возможности. Осознанность — это контекст. Присутствие — это характер. А характер всегда проявляется в реакции на окружающих, на окружающую среду, на собственное развивающееся состояние. Именно это создает ощущение эмоционального присутствия чего-то рядом с вами.
Именно здесь ИИ кардинально меняет правила игры в дизайне персонажей, выходя далеко за рамки возможностей Astro. Адаптация, управляемая ИИ, не требует контекстных прогнозов, на которые мы полагались ранее. Она изучает специфические ритмы, предпочтения и эмоциональный контекст людей, с которыми она живет и работает. Персонаж не просто реагирует на контекст. Он развивается вместе с ним.
Чего не хватает отрасли?
Характер и душа грядущей волны воплощенных в искусственный интеллект продуктов, похоже, почти всегда остаются на втором плане. А характер, определенный на позднем этапе, определяется по умолчанию. Он становится суммой тысяч мелких решений, принятых разными людьми, которые думали обо всем, кроме характера. Люди проецируют характер на устройства, независимо от того, планируете вы это или нет, особенно если эти устройства двигаются — робот, который движется, уже является персонажем. Если никто не разработал этот характер, результатом будут продукты, которые ощущаются как ничто, или, что еще хуже, как непонятные и не заслуживающие доверия. Технически впечатляющие, но безжизненные.
С Astro у нас не всё получилось идеально. Параллельно развивалось так много процессов, что к характеристикам редко относились как к вспомогательному инструменту, и это было понятно. Когда вы создаёте первый в своём роде продукт, громче всего звучат поломки, сроки, затраты, функции, которые клиент может указать на коробке. Характеристики звучат тише всего этого. Легко предположить, что их можно добавить позже. В такой большой команде, как команда Amazon Astro, даже самая большая идея может попасть в план развития, когда она конкурирует с сотней других, которые в данный момент кажутся более срочными. Всё это произошло не из-за равнодушия людей. Причина в том, что характеристики сложно расставить по приоритетам, пока не увидишь, чего они стоят.
Мои обращения к руководителям продуктовых проектов
Если вы создаёте продукт, который будет находиться в одном физическом пространстве или использоваться для общения с людьми, стоит учесть три момента:
Прежде чем определять характер, определите характер. Вам нужен защищаемый характер с достаточной эмоциональной логикой, чтобы последовательно отвечать на сложные вопросы. Найдите ответы на вопросы о характере на раннем этапе, и пусть все дисциплины строятся на одном фундаменте.
Встраивайте сюжет и звук в процесс создания персонажей, а не в производственный процесс. Сюжет и звук, разработанные одновременно с определением персонажей, могут влиять на логику движений, мимики и взаимодействия. Это требует иного подхода к сотрудничеству и иного подхода к подбору персонала.
Проектирование ориентировано на адаптацию, а не просто на единообразие. Единообразие характеристик необходимо, но наиболее значимыми в жизни людей станут те продукты, которые будут развиваться в процессе использования. Инфраструктура для этого становится всё более доступной, но подход к проектированию, позволяющий этим воспользоваться, по-прежнему встречается редко.
Полную версию этой истории можно прочитать на Medium.
Похожие записи
Оцените материал:
Похожие записи
Обучение на основе парных предпочтений: Введение в модель Брэдли-Терри
28.05.2026
Нейробиология какао и горького шоколада. Главное, что надо знать
14.06.2026
Обзор Fitbit Air: отслеживание здоровья для поколения искусственного интеллекта
28.05.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
