В эксклюзивном интервью пионер в области искусственного интеллекта делится планами по развитию своей новой парижской компании AMI Labs.

Ян Лекун — лауреат премии Тьюринга и ведущий исследователь в области искусственного интеллекта, но в мире технологий он давно известен как фигура, идущая против течения. Он считает, что нынешняя одержимость индустрии большими языковыми моделями ошибочна и в конечном итоге не сможет решить многие насущные проблемы.
Вместо этого он считает, что нам следует делать ставку на мировые модели — другой тип ИИ, который точно отражает динамику реального мира. Он также является убежденным сторонником ИИ с открытым исходным кодом и критикует закрытый подход передовых лабораторий, таких как OpenAI и Anthropic.
Возможно, поэтому неудивительно, что он недавно покинул Meta, где занимал должность главного научного сотрудника FAIR (Fundamental AI Research), влиятельной исследовательской лаборатории компании, которую он основал. Meta испытывала трудности с продвижением своей модели ИИ с открытым исходным кодом Llama и пережила внутренние перестановки, включая спорное приобретение ScaleAI.
ЛеКун дал эксклюзивное онлайн-интервью из своей парижской квартиры изданию MIT Technology Review, где обсудил свой новый проект, жизнь после Meta, будущее искусственного интеллекта и то, почему, по его мнению, отрасль гонится за неправильными идеями.
Приведённые ниже вопросы и ответы отредактированы для ясности и краткости.
Вы только что объявили о создании новой компании — Advanced Machine Intelligence (AMI). Расскажите о главных идеях, лежащих в её основе.
Это будет глобальная компания, но со штаб-квартирой в Париже. Произносится как «ами» — по-французски это означает «друг». Я в восторге. В Европе очень высокая концентрация талантов, но им не всегда предоставляются подходящие условия для развития. И, безусловно, существует огромный спрос со стороны отрасли и правительств на заслуживающую доверия передовую компанию в области искусственного интеллекта, которая не была бы ни китайской, ни американской. Думаю, это сыграет нам на руку.
Итак, амбициозная альтернатива существующей сейчас дихотомии США-Китай. Что побудило вас пойти по этому третьему пути?
Ну, у многих стран есть проблемы с суверенитетом, и они хотят контролировать ИИ. Я же выступаю за то, чтобы ИИ стал платформой, а большинство платформ, как правило, становятся открытыми. К сожалению, американская индустрия движется не в этом направлении. Верно? По мере роста конкуренции они чувствуют необходимость сохранять секретность. Я думаю, это стратегическая ошибка.
Связанная статья
Это, безусловно, верно для OpenAI, которая перешла от очень открытой к очень закрытой, а Anthropic всегда была закрытой. Google была относительно немного открытой. А что насчет Meta, посмотрим. У меня такое ощущение, что сейчас ситуация развивается не в позитивном направлении.
Одновременно с этим Китай полностью принял этот открытый подход. Таким образом, все ведущие платформы ИИ с открытым исходным кодом являются китайскими, и в результате академические круги и стартапы за пределами США, по сути, переняли китайские модели. В этом нет ничего плохого — китайские модели хороши. Китайские инженеры и ученые великолепны. Но, знаете, если в будущем весь наш информационный рацион будет обрабатываться с помощью ИИ, и выбор будет либо в пользу англоязычных моделей, созданных проприетарными компаниями, всегда близкими к США, либо в пользу китайских моделей, которые могут быть с открытым исходным кодом, но нуждаются в доработке, чтобы отвечать на вопросы о событиях на площади Тяньаньмэнь в 1989 году, — это, знаете ли, не очень приятное и привлекательное будущее.
Будущие модели должны быть способны к тонкой настройке любым пользователем и обеспечивать очень высокое разнообразие вариантов помощи со стороны ИИ, с учетом различных языковых способностей, систем ценностей, политических взглядов и интересов. Высокое разнообразие вариантов помощи необходимо по той же причине, по которой необходимо высокое разнообразие информации в прессе.
Это, безусловно, убедительная презентация. Как инвесторы пока что воспринимают эту идею всерьез?
Им это очень нравится. Многие венчурные капиталисты всячески поддерживают идею открытого исходного кода, потому что знают, что многие небольшие стартапы очень сильно зависят от моделей с открытым исходным кодом. У них нет средств для обучения собственной модели, и с точки зрения стратегии использование проприетарной модели для них довольно опасно.
Вы недавно покинули Meta. Каково ваше мнение о компании и руководстве Марка Цукерберга? Существует мнение, что Meta упустила свое преимущество в области искусственного интеллекта.
Я считаю, что FAIR [лаборатория ЛеКуна в Meta] добилась огромных успехов в исследовательской части. Менее успешным оказалось внедрение этих исследований в практические технологии и продукты. Марк принял ряд решений, которые, по его мнению, были наилучшими для компании. Возможно, я не со всеми из них согласен. Например, группу робототехники в FAIR уволили, что, на мой взгляд, было стратегической ошибкой. Но я не являюсь директором FAIR. Люди принимают решения рационально, и нет причин расстраиваться.
Значит, никаких разногласий? Может ли Meta стать будущим клиентом AMI?
Meta может стать нашим первым клиентом! Посмотрим. Наша работа не является прямой конкуренцией. Наш фокус на моделях физического мира сильно отличается от их фокуса на генеративном ИИ и LLM.
Вы работали над ИИ задолго до того, как магистерские программы стали общепринятым подходом. Но с появлением ChatGPT магистерские программы стали практически синонимом ИИ.
Да, и мы собираемся это изменить. Публичное лицо ИИ, пожалуй, в основном состоит из LLM-систем и чат-ботов различных типов. Но новейшие из них — это не чистые LLM-системы. Это LLM-системы, дополненные множеством других элементов, таких как системы восприятия и код, решающий конкретные задачи. Таким образом, мы будем рассматривать LLM-системы как своего рода оркестраторов в системах.
Помимо степеней магистра права, за кулисами работает множество систем искусственного интеллекта, управляющих значительной частью нашего общества. Это и программы помощи водителю в автомобиле, и быстрая обработка МРТ-снимков, и алгоритмы, управляющие социальными сетями — всё это ИИ.
Вы неоднократно заявляли, что степень магистра права (LLM) может дать нам лишь ограниченные возможности. Считаете ли вы, что в наши дни программы LLM переоценены? Можете ли вы кратко изложить нашим читателям, почему, по вашему мнению, степени LLM недостаточно?
В каком-то смысле их не переоценили, а именно: они чрезвычайно полезны для многих людей, особенно если вы пишете тексты, проводите исследования или пишете код. Люди с развитым интеллектом очень хорошо умеют работать с языком. Но у людей сложилось иллюзия, или заблуждение, что это лишь вопрос времени, когда мы сможем масштабировать их до уровня человеческого интеллекта, и это просто неправда.
По-настоящему сложная задача — это понимание реального мира. Это парадокс Моравека (феномен, отмеченный учёным-компьютерщиком Хансом Моравеком в 1988 году): то, что легко для нас, например, восприятие и навигация, сложно для компьютеров, и наоборот. LLM-ы ограничены дискретным миром текста. Они не могут по-настоящему рассуждать или планировать, потому что им не хватает модели мира. Они не могут предсказывать последствия своих действий. Именно поэтому у нас нет домашнего робота, столь же ловкого, как домашняя кошка, или по-настоящему автономного автомобиля.
У нас появятся системы искусственного интеллекта, обладающие человекоподобным и человеческим уровнем интеллекта, но они не будут построены на основе магистров прикладных наук, и это не произойдет в следующем году или через два года. На это потребуется время. Прежде чем у нас появятся системы ИИ с человеческим уровнем интеллекта, должны произойти крупные концептуальные прорывы. Именно над этим я и работаю. И эта компания, AMI Labs, сосредоточена на следующем поколении.
Ваше решение — это модели мира и архитектура JEPA (JEPA, или «совместная архитектура прогнозирования на основе встраивания», — это обучающая платформа, которая тренирует модели ИИ понимать мир, созданная ЛеКуном во время его работы в Meta). Какова будет краткая презентация?
Мир непредсказуем. Если вы попытаетесь создать генеративную модель, которая предсказывает каждую деталь будущего, она потерпит неудачу. JEPA — это не генеративный ИИ. Это система, которая учится очень хорошо представлять видео. Ключ к успеху — это изучение абстрактного представления мира и прогнозирование в этом абстрактном пространстве, игнорируя детали, которые невозможно предсказать. Именно это и делает JEPA. Она изучает основные правила мира на основе наблюдений, подобно тому, как младенец изучает гравитацию. Это основа здравого смысла, и это ключ к созданию по-настоящему интеллектуальных систем, способных рассуждать и планировать в реальном мире. Самые интересные работы в этой области пока что ведутся в академических кругах, а не в крупных промышленных лабораториях, застрявших в мире магистерских программ.
Отсутствие нетекстовых данных стало проблемой на пути дальнейшего развития систем искусственного интеллекта в понимании физического мира. JEPA обучена на видео. Какие еще типы данных вы будете использовать?
Наши системы будут обучаться на видео, аудио и сенсорных данных всех видов — не только текстовых. Мы работаем с различными модальностями, от положения роботизированной руки до данных лидара и аудио. Я также участвую в проекте, использующем JEPA для моделирования сложных физических и клинических явлений.
Какие конкретные, реальные практические применения вы видите для моделей мира?
Области применения огромны. Представьте себе сложные промышленные процессы, где используются тысячи датчиков, например, в реактивном двигателе, на металлургическом заводе или химическом предприятии. В настоящее время не существует метода, позволяющего построить полную, целостную модель этих систем. Модель окружающего мира могла бы обучаться на основе данных датчиков и предсказывать поведение системы. Или представьте себе умные очки, которые могут следить за вашими действиями, распознавать их и предсказывать дальнейшие шаги для оказания помощи. Именно это, наконец, сделает агентные системы надежными. Агентная система, которая должна совершать действия в окружающем мире, не может работать надежно, если у нее нет модели окружающего мира, предсказывающей последствия ее действий. Без нее система неизбежно будет совершать ошибки. Это ключ к созданию всего, от действительно полезных домашних роботов до автономного вождения 5-го уровня.
В последнее время человекоподобные роботы пользуются огромной популярностью, особенно те, которые производят китайские компании. А что вы думаете по этому поводу?
Существует множество способов грубой силы обойти ограничения систем машинного обучения, которые требуют огромного количества обучающих данных для выполнения чего бы то ни было. Поэтому секрет всех компаний, которые заставляют роботов заниматься кунг-фу или танцевать, заключается в том, что все это планируется заранее. Но, честно говоря, никто — абсолютно никто — не знает, как сделать этих роботов достаточно умными, чтобы они были полезны. Поверьте мне на слово.
Для каждой задачи требуется огромное количество обучающих данных для дистанционного управления, и когда окружающая среда немного меняется, обобщение оказывается не очень эффективным. Это говорит о том, что нам не хватает чего-то очень важного. Причина, по которой 17-летний подросток может научиться водить машину за 20 часов, заключается в том, что он уже много знает о том, как устроен окружающий мир. Если мы хотим создать универсального домашнего робота, нам нужны системы, которые хорошо понимают физический мир. Этого не произойдет, пока у нас не будет хороших моделей окружающего мира и планирования.
Всё чаще высказывается мнение, что проводить фундаментальные исследования в области искусственного интеллекта в академической среде становится всё сложнее из-за огромных вычислительных ресурсов, необходимых для этого. Как вы считаете, самые важные инновации теперь будут исходить из промышленности?
Нет. Магистратура по праву сейчас — это разработка технологий, а не исследования. Действительно, академическому сообществу очень сложно играть там важную роль из-за требований к вычислительным ресурсам, доступу к данным и инженерной поддержке. Но сейчас это продукт. Это не то, чем академическое сообщество должно интересоваться. Это как распознавание речи в начале 2010-х — проблема была решена, и прогресс был в руках промышленности.
Связанная статья
Академическая среда должна работать над долгосрочными задачами, выходящими за рамки возможностей существующих систем. Вот почему я говорю людям в университетах: не работайте над моделями долгосрочного развития. В этом нет смысла. Вы не сможете конкурировать с тем, что происходит в промышленности. Работайте над чем-то другим. Изобретайте новые методы. Прорывы не произойдут за счет масштабирования моделей долгосрочного развития. Самые интересные работы по моделям мира исходят из академической среды, а не из крупных промышленных лабораторий. Вся идея использования механизмов внимания в нейронных сетях возникла в Университете Монреаля. Эта исследовательская работа положила начало всей революции. Теперь, когда крупные компании закрываются, темпы прорывов замедлятся. Академической среде нужен доступ к вычислительным ресурсам, но они должны быть сосредоточены на следующем большом прорыве, а не на усовершенствовании предыдущего.
Вы многогранная личность: профессор, исследователь, педагог, общественный деятель… А теперь вы взяли на себя новую роль. Как она будет выглядеть в вашей жизни?
Я стану исполнительным председателем компании, а Алекс ЛеБрун [мой бывший коллега из Meta AI] — генеральным директором. Будет ЛеКун и ЛеБрун — приятно произносить это по-французски.
Я собираюсь сохранить свою должность в Нью-Йоркском университете. Я преподаю один курс в год, у меня есть аспиранты и постдоки, поэтому я останусь работать в Нью-Йорке. Но я довольно часто езжу в Париж из-за своей лаборатории.
Значит ли это, что вам не придётся много работать руками?
Ну, есть два способа быть вовлеченным в процесс. Первый — это управлять людьми изо дня в день, а второй — непосредственно участвовать в исследовательских проектах, верно?
Я умею управлять, но мне это не нравится. Это не моя жизненная миссия. Моя главная задача — максимально продвигать науку и технологии, вдохновлять других людей на работу над интересными проектами и вносить свой вклад в их развитие. Именно этим я занимаюсь в Meta последние семь лет. Я основал FAIR и руководил им четыре-пять лет. Мне не очень нравилось быть директором. Я не силен в управлении карьерой. Я гораздо больше визионер и ученый.
Почему Алекс ЛеБрун идеально подходит для этой работы?
Алекс — серийный предприниматель; он создал три успешные компании в сфере искусственного интеллекта. Первую он продал Microsoft; вторую — Facebook, где возглавлял инженерное подразделение FAIR в Париже. Затем он ушел, чтобы создать Nabla, очень успешную компанию в сфере здравоохранения. Когда я предложил ему присоединиться ко мне в этом проекте, он почти сразу согласился. У него есть опыт, необходимый для создания компании, что позволит мне сосредоточиться на науке и технологиях.
Ваш головной офис находится в Париже. Где еще вы планируете открыть офисы?
Мы — глобальная компания. У нас будет офис в Северной Америке.
Надеюсь, в Нью-Йорк?
Нью-Йорк — прекрасный город. Я ведь там живу, правда? И это не Силиконовая долина. Силиконовая долина — это своего рода монокультура.
А что насчет Азии? Думаю, Сингапур тоже?
Наверное, да. Можете сами догадаться.
А как вы привлекаете талантливых сотрудников?
У нас нет проблем с набором персонала. В сообществе исследователей ИИ много людей, которые считают, что будущее ИИ — в моделях мира. Эти люди, независимо от уровня заработной платы, будут мотивированы работать у нас, потому что они верят в технологическое будущее, которое мы строим. Мы уже привлекли специалистов из таких компаний, как OpenAI, Google DeepMind и xAI.
Я слышал, что Сайнинг Се, известный исследователь из Нью-Йоркского университета и Google DeepMind, может присоединиться к вам в качестве главного научного сотрудника. Есть какие-нибудь комментарии?
Сайнинг — блестящий исследователь. Я им очень восхищаюсь. Я уже дважды его нанимал. Я нанимал его в FAIR, и убедил своих коллег в Нью-Йоркском университете, что нам следует взять его и туда. Скажем так, я очень его уважаю.
Когда вы будете готовы поделиться более подробной информацией об AMI Labs, например, о финансовой поддержке или других ключевых членах команды?
Скоро — может быть, в феврале. Я вам сообщу.
Источник: www.technologyreview.com



























