Вы уже знаете, что агенты и небольшие языковые модели — это следующее большое событие. Вот пять других горячих трендов, на которые стоит обратить внимание в этом году.

В серии статей «Что дальше?» MIT Technology Review рассматривает различные отрасли, тенденции и технологии, чтобы дать вам первый взгляд на будущее. С остальными публикациями можно ознакомиться здесь.
Последние пару лет мы пытаемся предсказать, что будет дальше в сфере искусственного интеллекта. Это пустая трата времени, учитывая, как быстро развивается эта индустрия. Но мы на верном пути, и мы снова в деле.
Каковы были наши результаты в прошлый раз? Четыре главных тренда, на которые стоит обратить внимание в 2024 году, включают в себя так называемые настраиваемые чат-боты — интерактивные вспомогательные приложения, работающие на основе больших мультимодальных языковых моделей (верно: мы ещё не знали об этом, но речь шла о том, что все теперь называют агентами, самой популярной области в сфере искусственного интеллекта); генеративное видео (верно: мало какие технологии развивались так быстро за последние 12 месяцев, а OpenAI и Google DeepMind выпустили свои флагманские модели генерации видео, Sora и Veo, с разницей в неделю в декабре); и более универсальные роботы, способные выполнять более широкий спектр задач (верно: выгоды от больших языковых моделей продолжают распространяться и на другие сферы технологической индустрии, и робототехника возглавляет этот список).
Мы также говорили, что дезинформация о выборах, генерируемая искусственным интеллектом, будет повсюду, но здесь, к счастью, мы ошиблись. В этом году было много поводов для негодования, но политических дипфейков было мало.
Итак, что же нас ждёт в 2025 году? Мы не будем обращать внимания на очевидное: можно быть уверенным, что агенты и более компактные, но эффективные языковые модели продолжат формировать отрасль. Вместо этого представляем пять альтернативных вариантов от нашей команды ИИ.
1. Генеративные виртуальные игровые площадки
Если 2023 год стал годом генеративных изображений, а 2024 — годом генеративного видео, что же будет дальше? Если вы выбрали генеративные виртуальные миры (то есть видеоигры), то всем привет!

Мы получили небольшое представление об этой технологии в феврале, когда Google DeepMind представила генеративную модель Genie, способную превратить неподвижное изображение в 2D-платформер с сайд-скроллингом, с которым игроки могли бы взаимодействовать. В декабре компания представила Genie 2 — модель, способную превратить начальное изображение в целый виртуальный мир.
Другие компании разрабатывают аналогичные технологии. В октябре стартапы Decart и Etched, занимающиеся разработкой ИИ, представили неофициальный хак Minecraft, в котором каждый кадр игры генерируется на лету прямо во время игры. А World Labs, стартап, соучредителем которого является Фэй-Фэй Ли — создатель ImageNet, обширного набора фотографий, положившего начало буму глубокого обучения, — разрабатывает так называемые большие модели мира (LWM).
Одно из очевидных применений — видеоигры. Эти ранние эксперименты носят игровой характер, и генеративное 3D-моделирование может быть использовано для исследования концепций дизайна новых игр, превращая набросок в игровую среду на лету. Это может привести к появлению совершенно новых типов игр.
Но их также можно использовать для обучения роботов. World Labs хочет разработать так называемый пространственный интеллект — способность машин интерпретировать повседневный мир и взаимодействовать с ним. Однако исследователям робототехники не хватает качественных данных о реальных сценариях, которые можно было бы использовать для обучения таких технологий. Создание бесчисленных виртуальных миров и размещение в них виртуальных роботов для обучения методом проб и ошибок могло бы помочь компенсировать этот недостаток.
— Уилл Дуглас Хэвен
2. Большие языковые модели, которые «рассуждают»

Ажиотаж был оправдан. Когда OpenAI представила o1 в сентябре, она представила новую парадигму работы больших языковых моделей. Два месяца спустя компания практически во всех отношениях продвинула эту парадигму, представив o3 — модель, которая, возможно, навсегда изменит эту технологию.
Большинство моделей, включая флагманскую модель GPT-4 от OpenAI, выдают первый попавшийся ответ. Иногда он верный, иногда нет. Но новые модели компании обучены прорабатывать свои ответы шаг за шагом, разбивая сложные задачи на ряд более простых. Когда один подход не работает, они пробуют другой. Этот метод, известный как «рассуждение» (да, мы прекрасно понимаем, насколько многозначен этот термин), может сделать эту технологию более точной, особенно для математических, физических и логических задач.
Связанная история
Следующим крупным шагом станут инструменты искусственного интеллекта, способные выполнять более сложные задачи. Вот как они будут работать.
Это также важно для агентов.
В декабре Google DeepMind представила новый экспериментальный веб-браузерный агент под названием Mariner. Во время предварительной демонстрации, которую компания предоставила журналу MIT Technology Review, Mariner, похоже, застрял. Мегха Гоэл, менеджер по продукту компании, попросила агента найти рецепт рождественского печенья, похожего на то, что она ему дала. Маринер нашла рецепт в интернете и начала добавлять ингредиенты в онлайн-корзину покупок Гоэл.
Затем он застрял, не сумев определить, какой тип муки выбрать. Гоэл наблюдал, как Mariner объясняет свои действия в окне чата: «Он пишет: „Я воспользуюсь кнопкой „Назад“ в браузере, чтобы вернуться к рецепту“».
Это был знаменательный момент. Вместо того, чтобы упереться в стену, агент разбил задачу на отдельные действия и выбрал то, которое могло решить проблему. Понять, что нужно нажать кнопку «Назад», может показаться элементарным, но для бездумного бота это сродни высшим математикам. И это сработало: Маринер вернулся к рецепту, подтвердил тип муки и продолжил наполнять корзину Гоэла.
Google DeepMind также создает экспериментальную версию Gemini 2.0, своей новейшей большой языковой модели, которая использует этот пошаговый подход к решению проблем, называемую Gemini 2.0 Flash Thinking.
Но OpenAI и Google — лишь вершина айсберга. Многие компании разрабатывают крупные языковые модели, использующие схожие подходы, что позволяет им эффективнее решать широкий спектр задач, от кулинарии до программирования. В этом году ожидается гораздо больше разговоров о логическом мышлении (мы знаем, знаем).
— Уилл Дуглас Хэвен
3. Настало время расцвета ИИ в науке

Одно из самых интересных применений ИИ — ускорение научных открытий в естественных науках. Возможно, ярчайшим подтверждением потенциала ИИ в этой области стало вручение Нобелевской премии по химии Демису Хассабису и Джону М. Джамперу из Google DeepMind в октябре прошлого года за создание инструмента AlphaFold, позволяющего решать задачи сворачивания белков, а также Дэвиду Бейкеру за создание инструментов для разработки новых белков.
Ожидается, что эта тенденция сохранится в следующем году, и мы увидим больше наборов данных и моделей, специально предназначенных для научных открытий. Белки были идеальной целью для ИИ, поскольку в этой области уже имелись отличные наборы данных, на которых можно было обучать модели ИИ.
Поиски следующего большого прорыва уже начались. Одной из потенциальных областей является материаловедение. Meta опубликовала обширные наборы данных и моделей, которые могут помочь учёным использовать ИИ для гораздо более быстрого открытия новых материалов, а в декабре Hugging Face совместно со стартапом Entalpic запустили LeMaterial — проект с открытым исходным кодом, призванный упростить и ускорить исследования материалов. Их первый проект — это набор данных, который объединяет, очищает и стандартизирует наиболее известные наборы данных о материалах.
Создатели моделей ИИ также стремятся представить свои генеративные продукты в качестве исследовательских инструментов для учёных. OpenAI позволил учёным протестировать свою новейшую модель o1 и посмотреть, как она может помочь им в исследованиях. Результаты оказались обнадеживающими.
Наличие инструмента на основе ИИ, способного работать подобно учёным, — одна из фантазий технологического сектора. В манифесте, опубликованном в октябре прошлого года, основатель Anthropic Дарио Амодеи выделил науку, особенно биологию, как одну из ключевых областей, где мощный ИИ может быть полезен. Амодеи предполагает, что в будущем ИИ может стать не только методом анализа данных, но и «виртуальным биологом, выполняющим все задачи, которые выполняют биологи». Мы всё ещё далеки от этого сценария. Но в следующем году мы, возможно, увидим важные шаги к его достижению.
—Мелисса Хейккиля
4. Компании, занимающиеся разработкой ИИ, становятся ближе к национальной безопасности

Компании, занимающиеся разработкой ИИ, готовые предоставить свои инструменты для охраны границ, сбора разведывательной информации и других задач по обеспечению национальной безопасности, могут заработать немалые деньги.
Американские военные запустили ряд инициатив, демонстрирующих их стремление к внедрению ИИ: от программы «Репликатор», вдохновлённой войной на Украине, которая предполагает выделение 1 миллиарда долларов на малые беспилотники, до подразделения по быстрому развитию возможностей искусственного интеллекта (ИИ), которое внедряет ИИ во всё: от принятия решений на поле боя до логистики. Европейские вооружённые силы испытывают давление, вынуждающее их увеличивать инвестиции в технологии, что вызвано опасениями, что администрация Дональда Трампа сократит расходы на Украину. Растущая напряжённость между Тайванем и Китаем также серьёзно беспокоит военных стратегов.
Связанная история
В США до сих пор нет федерального закона о конфиденциальности. Однако недавние меры принудительного характера в отношении посредников данных могут обеспечить новые меры защиты личной информации американцев.
В 2025 году эти тенденции продолжат быть благом для компаний оборонных технологий, таких как Palantir, Anduril и других, которые теперь используют секретные военные данные для обучения моделей ИИ.
Глубокие карманы оборонной промышленности привлекут и ведущие компании в сфере ИИ. В декабре компания OpenAI объявила о партнерстве с Anduril в рамках программы по уничтожению беспилотников, завершив тем самым годичный отказ от политики сотрудничества с военными. Компания присоединяется к Microsoft, Amazon и Google, которые уже много лет сотрудничают с Пентагоном.
Другие конкуренты в сфере ИИ, тратящие миллиарды на обучение и разработку новых моделей, столкнутся с большим давлением в 2025 году, заставляющим их серьёзно задуматься о доходах. Возможно, они найдут достаточно клиентов из невоенной сферы, готовых щедро платить за ИИ-агентов, способных решать сложные задачи, или представителей творческих отраслей, готовых тратиться на генераторы изображений и видео.
Но у них также будет всё больше соблазна побороться за выгодные контракты с Пентагоном. Ожидается, что компании будут бороться за то, не будет ли работа над оборонными проектами считаться противоречащей их ценностям. Компания OpenAI мотивировала изменение своей позиции тем, что «демократии должны продолжать играть ведущую роль в разработке ИИ», — написала компания, полагая, что предоставление своих моделей военным будет способствовать достижению этой цели. В 2025 году мы увидим, как другие последуют её примеру.
—Джеймс О'Доннелл
5. Nvidia видит законную конкуренцию

На протяжении большей части нынешнего бума искусственного интеллекта, если вы были технологическим стартапом, желающим попробовать свои силы в создании модели искусственного интеллекта, Дженсен Хуанг был вашим помощником. Будучи генеральным директором Nvidia, самой дорогой корпорации в мире, Хуанг помог компании стать бесспорным лидером в производстве чипов, используемых как для обучения моделей искусственного интеллекта, так и для проверки модели при её использовании, что называется «логическим выводом».
В 2025 году ситуацию может изменить ряд факторов. Во-первых, такие гиганты, как Amazon, Broadcom, AMD и другие, вкладывают значительные средства в новые чипы, и есть предварительные признаки того, что они могут составить серьезную конкуренцию чипам Nvidia, особенно в области вывода, где лидерство Nvidia не столь прочно.
Всё больше стартапов атакуют Nvidia с другой стороны. Вместо того, чтобы пытаться хоть немного улучшить разработки Nvidia, такие стартапы, как Groq, делают более рискованные ставки на совершенно новые архитектуры чипов, которые со временем обещают обеспечить более эффективное обучение. В 2025 году эти эксперименты всё ещё будут находиться на ранней стадии, но вполне возможно, что появление серьёзного конкурента изменит представление о том, что топовые модели ИИ полагаются исключительно на чипы Nvidia.
В основе этой конкуренции лежит геополитическая война чипов, которая будет продолжаться. До сих пор эта война опиралась на две стратегии. С одной стороны, Запад стремится ограничить экспорт в Китай передовых чипов и технологий их производства. С другой стороны, такие меры, как Закон США о чипах и матрицах (CHIPS), направлены на стимулирование внутреннего производства полупроводников.
Дональд Трамп может ужесточить экспортный контроль и пообещал ввести огромные пошлины на любые товары, импортируемые из Китая. В 2025 году такие пошлины поставят Тайвань, на который США сильно полагаются благодаря производителю микросхем TSMC, в центр торговых войн. Это связано с тем, что Тайвань заявил, что поможет тайваньским компаниям, работающим в Китае, вернуться на остров, чтобы избежать предлагаемых пошлин. Это может вызвать дальнейшую критику со стороны Трампа, который выразил недовольство расходами США на защиту Тайваня от Китая.
Пока неясно, как будут действовать эти силы, но это лишь дополнительно подтолкнёт производителей чипов к снижению зависимости от Тайваня, что и является целью закона CHIPS. По мере того, как законопроект начнёт циркулировать, следующий год может принести первые доказательства того, что он существенно стимулирует внутреннее производство чипов.
—Джеймс О'Доннелл
Исправление: мы уточнили, что министр экономики Тайваня говорил о возвращении тайваньских фирм на Тайвань.
Источник: www.technologyreview.com



























