Архив рубрики ~Лента новостей~

Нет Claude Fable 5? Не проблема: Sakana достигает передовых результатов благодаря новой многомодельной системе автоматического синтеза Fugu.

Нет Claude Fable 5? Не проблема: Sakana достигает передовых результатов благодаря новой многомодельной системе автоматического синтеза Fugu.
Нет Claude Fable 5? Не проблема: Sakana достигает передовых результатов благодаря новой многомодельной системе автоматического синтеза Fugu.

Карл Франзен

Вчера вечером стартап Sakana, все больше ориентирующийся на корпоративный сегмент в области искусственного интеллекта, запустил Fugu — систему оркестровки для множества агентов, обеспечивающую производительность ИИ на передовом уровне благодаря единому API, совместимому с OpenAI.

Разработанная для разработчиков, предприятий и стран, стремящихся к устойчивости к зависимости от поставщика и геополитическому экспортному контролю, система Fugu (в переводе с японского — «рыба-фугу») обходит традиционную монолитную структуру модели, динамически направляя запросы к заменяемому пулу специализированных агентов искусственного интеллекта.

Генеральный директор и соучредитель Sakana Дэвид Ха, ранее работавший в Google Brain, позиционировал Fugu как более надежный вариант для корпоративных рабочих процессов, чем любой отдельный поставщик моделей ИИ, после того, как 12 июня Anthropic отозвала публичный доступ к своим самым мощным моделям, Claude Mythos 5 и Claude Fable 5, в связи с распоряжением правительства США об экспортном контроле. Как написал Ха сегодня в своем посте на X:

«Fugu динамически управляет лучшими в мире моделями для решения сложных задач. Мы доказываем, что хорошо организованный пул взаимозаменяемых агентов может сравниться с ограниченными по своим возможностям моделями, такими как Fable и Mythos. Но Fugu — это нечто большее, чем просто производительность. Я считаю, что модели оркестровки — это следующий рубеж, выходящий за рамки более крупных моделей. Опора на модель одной компании для национальной инфраструктуры — это огромный риск. Как показали недавние меры экспортного контроля, доступ к лучшим моделям может исчезнуть в одночасье. Коллективный интеллект — это практическая защита от такой концентрации власти. Fugu просто обходит ограничения поставщиков, полагаясь на полностью взаимозаменяемый пул агентов».

В документации Sakana AI прямо указано, что конкретные модели, которые выбирает Fugu, и способ их координации являются собственностью компании, то есть эта информация о маршрутизации скрыта от пользователя по замыслу разработчиков. В документации лишь в общих чертах упоминается «разнообразный набор мощных моделей», «множество LLM» или «специализированные модели», без указания конкретного количества.

Выступая в роли сложного координатора, а не автономной базовой модели, Fugu достигает качества результатов, сопоставимого с моделями высшего уровня, такими как Fable и Mythos, в сторонних тестах агентных задач, при этом коренным образом меняя подход разработчиков к развертыванию критически важной инфраструктуры ИИ.

Как работает Sakana Fugu и в чем ее преимущества перед Claude Fable 5 от Anthropic.

По своей сути, Sakana Fugu работает как генеральный подрядчик. При получении сложного запроса Fugu не пытается выполнить каждый этап самостоятельно.

Вместо этого, система разбивает проблему на подзадачи, делегирует их группе экспертов по базовым моделям, проверяет их работу и синтезирует конечный результат.

Функциональная схема Сакана Фугу

«Fugu сам по себе является LLM, обученным вызывать различные LLM в пуле агентов, включая рекурсивные экземпляры самого себя», — отметила команда Sakana AI в своем техническом пресс-релизе.

Основанная на двух исследовательских работах Саканы 2026 года — TRINITY и Conductor — система автономно управляет всем жизненным циклом выбора и проверки модели, используя стратегии координации, основанные на обучении, а не на разработанных вручную рабочих процессах. Для конечного пользователя этот многоагентный рой полностью абстрагирован за стандартной точкой доступа API.

Компания Sakana AI предлагает два варианта системы для удовлетворения различных операционных нагрузок:

  • Fugu: Высокоскоростная модель с низкой задержкой, оптимизированная для повседневных задач. Она разработана как движок по умолчанию для интерактивных чат-ботов и интегрируется непосредственно в среды разработки, такие как Codex.

  • Fugu Ultra: флагманский уровень, разработанный для сложных задач с высокими ставками, таких как исследования в области ИИ, анализ кибербезопасности и многоэтапные патентные расследования. По словам Саканы, Fugu Ultra координирует работу более широкого круга экспертов и сопоставляет ведущие в отрасли монолитные модели с использованием строгих научных и логических критериев.

Кроме того, в тарифном плане с оплатой по факту использования стандартный Fugu взимает динамическую плату в зависимости от активированных базовых моделей, тогда как Fugu Ultra использует фиксированную структуру ценообразования, начинающуюся с 5 долларов за миллион входных токенов и 30 долларов за миллион выходных токенов.

Как показывают диаграммы результатов тестирования, предоставленные Sakana, Fugu фактически превосходит производительность Claude Fable 5 от Anthropic на LiveCodeBench, открытом бенчмарке, тестирующем навыки программирования на регулярно обновляемых задачах решения программных проблем (Fugu Ultra: 93,2, Fugu: 92,9, Fable: 89,8), и опережает предыдущую модель Claude Mythos Preview на GPQA-D (Diamond), тесте из 198 вопросов с множественным выбором для аспирантов по биологии, физике и химии (Fugu Ultra: 95,5, Fugu: 95,5, Mythos Preview: 94,6).

Сравнительная таблица показателей Fugu

Благодаря координации работы нескольких моделей от разных поставщиков, Fugu, по сути, обеспечивает встроенную избыточность в стек ИИ. Если один из поставщиков выходит из строя или сталкивается с внезапными нормативными ограничениями, Fugu обходит источник сбоя, поддерживая бесперебойную работу.

Лицензирование и доступность

Fugu предлагается как коммерческий, проприетарный API-сервис, а не как фреймворк с открытым исходным кодом.

Поскольку основная интеллектуальная собственность Sakana заключается в ее неочевидных моделях взаимодействия, конкретная информация о маршрутизации — то есть, какие именно базовые модели Fugu выбирает для данного запроса — остается конфиденциальной и намеренно скрывается от пользователя.

Однако Sakana предоставляет важные средства контроля для обеспечения соответствия корпоративных требований к защите данных. Разработчики могут явно исключать определенные модели или поставщиков из пула маршрутизации Fugu, чтобы поддерживать строгие корпоративные стандарты конфиденциальности.

Кроме того, пользователи могут отказаться от использования своих запросов в будущих обучающих данных. Географически Fugu ограничен в своей деятельности в пределах Европейского союза (ЕС) и Европейской экономической зоны (ЕЭЗ), в то время как Sakana работает над приведением своей архитектуры маршрутизации данных в соответствие с правилами GDPR.

Цены довольно высокие.

В большинстве регионов (за исключением ЕС и ЕЭЗ) Fugu доступен сразу же по подписке и с оплатой по факту использования.

Команды могут выбрать ежемесячную подписку, предназначенную для индивидуального или ручного использования: стандартный уровень за 20 долларов в месяц для несложных рабочих процессов, уровень Pro за 100 долларов в месяц, обеспечивающий 10-кратное стандартное использование, и уровень Max за 200 долларов в месяц, предлагающий 20-кратное использование для непрерывных, длительных задач. Мне не удалось найти точное количество токенов, покрываемых этими планами, но я связался с Ha on X для получения дополнительной информации.

В рамках первоначального запуска Sakana предлагает бесплатный второй месяц пользователям, оформившим подписку на любой тарифный план до 31 июля 2026 года.

Для масштабирования на уровне предприятия и развертывания в производственной среде Sakana предлагает гибкий тарифный план с оплатой по мере использования. Что особенно важно для сред с высокими рисками, запросы, поступающие по этой модели оплаты по факту использования, обрабатываются с более высоким приоритетом, чем запросы по ежемесячным подпискам.

В рамках этой структуры стандартный движок Fugu взимает единую плату за базовую модель самого высокого уровня, участвующую в запросе, без начисления комиссий за работу нескольких агентов. Флагманский уровень Fugu Ultra (fugu-ultra-20260615) использует фиксированную структуру ценообразования за один миллион токенов: 5 долларов за входные данные, 30 долларов за выходные данные и 0,50 доллара за кэшированные входные данные. Эти ставки увеличиваются до 10, 45 и 1,00 доллара соответственно для экстремальных нагрузок с использованием контекстных окон свыше 272 000 токенов. Это делает его одним из самых дорогих вариантов по сравнению с отдельными моделями ИИ через API поставщиков:

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Модель

Вход

Выход

Общая стоимость

Источник

MiMo-V2.5 Flash

0,10 доллара

0,30 доллара

0,40 доллара

Сяоми МиМо

deepseek-v4-flash

0,14 доллара

0,28 доллара

0,42 доллара

DeepSeek

deepseek-v4-pro

0,435 доллара

0,87 доллара

1,305 доллара

DeepSeek

МиниМакс-М3

0,30 доллара

1,20 доллара

1,50 доллара

МиниМакс

Фонарик Gemini 3.1

0,25 доллара

1,50 доллара

1,75 доллара

Google

Qwen3.7-Plus

0,40 доллара

1,60 доллара

2,00 доллара

Alibaba Cloud

MiMo-V2.5

0,40 доллара

2,00 доллара

2,40 доллара

Сяоми МиМо

Grok 4.3 (низкий контекст)

1,25 доллара

2,50 доллара

3,75 доллара

xAI

MiMo-V2.5 Pro (≤256K)

1,00 долл.

3,00 доллара

4,00 доллара

Сяоми МиМо

Кими-К2.6

0,95 доллара

4,00 доллара

4,95 доллара

Лунный выстрел

GLM-5.2

1,40 доллара

4,40 доллара

5,80 долларов

З.ай

Grok 4.3 (высококонтекстный)

2,50 доллара

5,00 долларов

7,50 долларов

xAI

MiMo-V2.5 Pro (>256K)

2,00 доллара

6,00 долларов

8,00 долларов

Сяоми МиМо

Qwen3.7-Max

2,50 доллара

7,50 долларов

10,00 долларов

Alibaba Cloud

Вспышка Gemini 3.5

1,50 доллара

9,00 долларов

10,50 долларов

Google

Gemini 3.1 Pro Preview (≤200K)

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.4

2,50 доллара

15,00 долларов

17,50 долларов

OpenAI

Gemini 3.1 Pro Preview (>200K)

4,00 доллара

18,00 долларов

22,00 долларов

Google

Клод Опус 4.8

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

ГПТ-5.5

5,00 долларов

30,00 долларов

35,00 долларов

OpenAI

Сакана Фугу Ультра

5,00 долларов

30,00 долларов

35,00 долларов

Сакана ИИ

Клод Басня 5 / Клод Мифос 5

10,00 долларов

50,00 долларов

60,00 долларов

Антропический

Разработчикам, моделирующим операционные затраты, следует также учитывать существенную архитектурную особенность в том, как Fugu выставляет счета за свои возможности работы с несколькими агентами. Согласно документации для разработчиков, ответы API Fugu Ultra содержат подробные поля использования, которые отделяют видимую пользователю генерацию токенов от внутренней работы по оркестрации. Фоновые токены, потребляемые и генерируемые Fugu при делегировании подзадач, проверке кода или маршрутизации между базовыми агентами, не поглощаются поставщиком; они представляют собой реальное использование токенов и учитываются в окончательной стоимости запроса по стандартным тарифам.

Обзор рынка оркестровки: Fugu против конкурентов и примечательные эталонные показатели.

Для понимания положения Fugu в экосистеме ИИ к середине 2026 года крайне важно различать маршрутизацию моделей и оркестровку многоагентных систем .

За последний год резко возросло внедрение в корпоративной среде стандартных платформ маршрутизации, таких как Not Diamond, Martian и открытый фреймворк RouteLLM. Эти системы действуют как интеллектуальные диспетчеры воздушного движения; используя семантические классификаторы или метамодели, они анализируют входящий запрос и прогнозируют, какая из базовых моделей обеспечит наилучшее качество или наиболее экономичный ответ, соответствующим образом распределяя запрос.

Fugu работает по принципиально иной парадигме. Вместо принятия решения о маршрутизации за один раз, Fugu больше соответствует сложным многоэтапным системам, таким как Router-R1 (фреймворк, представленный на NeurIPS 2025). Он разбивает запрос на части, сочетает рассуждения с делегированием и динамически назначает подзадачи нескольким моделям параллельно или последовательно, прежде чем синтезировать окончательный результат.

Хотя такие фреймворки, как LangGraph, CrewAI и Microsoft AutoGen, предоставляют разработчикам инструменты для создания аналогичных многоагентных систем, они требуют огромной ручной настройки — определения ролей, настройки условных связей и управления состоянием в длительных циклах.

Fugu полностью абстрагирует эти операционные издержки. По сути, это рабочий процесс в стиле LangGraph, представленный в виде единого, «черного ящика» API-интерфейса.

В конечном итоге возможности системы оркестровки ограничены базовыми моделями, входящими в её состав, что подтверждается результатами собственных сравнительных тестов Sakana по сравнению с автономными моделями нового поколения.

В сложных задачах программирования и агентного управления коллективный интеллект демонстрирует явное преимущество перед стандартными моделями. Fugu Ultra показал результат 73,7 в SWE-Bench Pro , значительно превзойдя Claude Opus 4.8 от Anthropic (69,2) и GPT-5.5 от OpenAI (58,6).

Однако Fugu — это не панацея, и его производительность не является абсолютной. По сравнению с узкоспециализированными или ограниченными в доступе монолитными моделями, Fugu иногда уступает:

  • SWE-Bench Pro: Хотя Fugu Ultra (73,7) превзошла большинство доступных моделей, ее с большим отрывом обошла ограниченно доступная модель Fable 5 (80,0) от Anthropic, которая в настоящее время отсутствует в списке сменных модулей Fugu из-за распоряжения правительства США об экспортном контроле и последующего решения Anthropic полностью исключить эту модель из глобального использования.

  • Последний экзамен человечества: Fugu Ultra (50.0) с небольшим отрывом обогнал Opus 4.8 (49.8), но снова уступил Fable 5 (53.3).

  • Длинный контекст и безопасность: В тесте MRCRv2 на полноту заполнения длинного контекста GPT-5.5 от OpenAI сохранил лидерство (94,8 против 93,6 у Fugu Ultra), а Opus 4.8 остался лучшим в бенчмарке кибербезопасности CTI-REALM (69,6 против 69,4 у Fugu Ultra).

Количественные данные указывают на очевидный вывод: Fugu очень эффективно повышает производительность при решении сложных многоэтапных задач (например, при написании сложной HTML5-игры с нуля), используя объединенные сильные стороны нескольких моделей среднего и высокого уровня.

Однако, если рассматривать ситуацию методом грубой силы в рамках одной, сильно ограниченной области, крупнейшие автономные модели в отрасли по-прежнему сохраняют преимущество — при условии, что предприятие может обеспечить бесперебойный доступ к ним.

Информация о создании компании Sakana и её значительных достижениях на сегодняшний день.

Компания Sakana AI была основана в Токио в 2023 году Ллионом Джонсом, соавтором основополагающей статьи Google 2017 года «Внимание — это все, что вам нужно», и Дэвидом Ха, бывшим руководителем исследовательского отдела Stability AI.

Разочарованные бюрократией крупных технологических компаний и чрезмерной зацикленностью отрасли на масштабировании единых, масштабных фундаментальных моделей, основатели создали Sakana на основе принципов биомимикрии и эволюционных вычислений.

Название компании, происходящее от японского слова, означающего «рыба», отражает её основную техническую концепцию: использование коллективного «роевого» интеллекта вместо грубой силы вычислений. После оценки в 2,6 миллиарда долларов в рамках раунда финансирования серии B в конце 2025 года и недавнего запуска в июне 2026 года Marlin — автономного восьмичасового исследовательского агента для сектора B2B — Fugu представляет собой коммерциализацию технологии многоагентной маршрутизации Sakana для обычных разработчиков.

В онлайн-сообществе, занимающемся искусственным интеллектом, реакция на эту идею неоднозначна.

В ответ на появление Fugu сообщество разработчиков тщательно протестировало его практические компромиссы, сопоставив эффективность маршрутизации с мощью монолитных базовых моделей.

Крис (@ChrissGPT на X), наблюдатель за развитием ИИ, разработчик и влиятельный человек в этой области, подчеркнул специфическую полезность Fugu по сравнению с базовым ИИ.

«Для простого и понятного запроса вы, вероятно, [использовали бы Fable 5, Mythos или GPT-5.5 напрямую]», — отметил он, но утверждал, что истинная ценность Fugu проявляется в сложных, многоэтапных средах. «…будь то делегирование, проверка, синтез, анализ кода, циклы исследований, анализ безопасности… тем больше смысла в использовании этого инструмента», — написал он.

Крис также указал на стратегическое геополитическое преимущество архитектуры Fugu, отметив, что если доступ к передовым технологиям ИИ будет внезапно отозван из-за регулирования или экспортного контроля, оркестратор сможет динамически заменять модели, чтобы предотвратить полный отказ системы.

Владелец креативного агентства Mark Studios Марк Сантос (@markksantos) провел прямое сравнение в реальных условиях, поручив компаниям Fugu Ultra и Claude Opus 4.8 создать клон игры «Crossy Road» с использованием Three.js. Результаты подчеркнули операционные различия между оркестратором и монолитным гигантом:

  • Sakana Fugu Ultra: Задание было выполнено за 22 минуты, используя около 89 000 жетонов, что обошлось примерно в 7,32 доллара. Однако в финальной версии игры присутствовали незначительные логические ошибки, такие как инвертированные повороты и неудобные ракурсы камеры.

  • Claude Opus 4.8: Заняло 79 минут, было сожжено около 940 000 токенов на сумму почти 37,85 долларов, и приложение застряло в цикле повторных попыток, требующем вмешательства человека. Несмотря на неэффективность, в конечном итоге был создан превосходный дизайн и функциональность приложения.

В заключение эксперимента Сантос заявил: «С точки зрения функциональности, качества и дизайна приложения победил Opus. С точки зрения скорости и производительности модели победил Fugu…».

Эли Бакуч, инженер-исследователь в компании Prime Intellect, предоставляющей облачную инфраструктуру и системы для открытого ИИ, отметил на X: «Чтобы было ясно, это оркестратор с закрытым исходным кодом, работающий поверх моделей с закрытым исходным кодом. Если раньше вы не контролировали модели, то теперь вы даже не контролируете, какие из них используются и в каком объеме. Это не „суверенитет ИИ“…»

Эти первые тесты и отзывы отражают мнение, высказанное пользователем Reddit GreedyWorking1499 в ходе первоначальных обсуждений платформы: « Пока не будет доказано обратное, это всего лишь высокотехнологичный маршрутизатор/оболочка, а не фундаментальный скачок в развитии интеллекта, как это было с Mythos/Fable».

Однако, поскольку предприятия все чаще требуют механизмов защиты от зависимости от одного поставщика, Sakana доказывает, что объединение коллективного интеллекта в единую конечную точку API является весьма перспективным коммерческим решением.

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ ⭐️ Steam Machine будет стоить $1049 за версию на 512… Архив рубрики ~Обо всем~ Какие кондиционеры лучше: оконные или портативные? Наши эксклюзивные лабораторные тесты выявили явного победителя. Новости робототехники Bear Robotics Знакомство Киниси Робототехника, чтобы расширить возможности физического искусственного интеллекта Архив рубрики ~Обо всем~ Марсоход НАСА «Персеверанс» завершил первый запланированный с использованием искусственного интеллекта запуск на Марсе. Новости робототехники Робот-велосипедист впервые без посторонней помощи выполнил переднее сальто благодаря аспиранту. Новости робототехники Роботы учатся предвидеть хаос, но по-прежнему не способны распознать явно человеческий сигнал. Архив рубрики ~Обо всем~ Искусственный интеллект, который общается сам с собой, учится быстрее и умнее. Архив рубрики ~Обо всем~ Труд как коммодитис. Комодитизация труда. Информация и искусство как commodité Архив рубрики ~Обо всем~ Ученые составили мировую карту густоты арбускулярной микоризы. Длину всех ее гиф оценили в половину расстояния от Земли до центра Млечного пути Новости робототехники Китайская компания Seres, известная своими электромобилями, представила первого андроида Xiaosai, который умеет распознавать людей и вести с ними диалог Новости робототехники У роботов очень короткая память. Можно ли это исправить? Архив рубрики ~Обо всем~ JUNO уточнил параметры осцилляций нейтрино. Для этого хватило 59 дней наблюдений за реакторными антинейтрино Архив рубрики ~Коротко из Telegram~ Ведомости провели титаническую работу и посчитали, сколько в России иностранных… Архив рубрики ~Коротко из Telegram~ LogicBallsAI собрал 500+ AI-инструментов для текста в одном месте Появился… Архив рубрики ~Коротко из Telegram~ ⭐️ Steam Machine будет стоить $1049 за версию на 512… Архив рубрики ~Обо всем~ Какие кондиционеры лучше: оконные или портативные? Наши эксклюзивные лабораторные тесты выявили явного победителя. Новости робототехники Bear Robotics Знакомство Киниси Робототехника, чтобы расширить возможности физического искусственного интеллекта Архив рубрики ~Обо всем~ Марсоход НАСА «Персеверанс» завершил первый запланированный с использованием искусственного интеллекта запуск на Марсе. Новости робототехники Робот-велосипедист впервые без посторонней помощи выполнил переднее сальто благодаря аспиранту. Новости робототехники Роботы учатся предвидеть хаос, но по-прежнему не способны распознать явно человеческий сигнал. Архив рубрики ~Обо всем~ Искусственный интеллект, который общается сам с собой, учится быстрее и умнее. Архив рубрики ~Обо всем~ Труд как коммодитис. Комодитизация труда. Информация и искусство как commodité Архив рубрики ~Обо всем~ Ученые составили мировую карту густоты арбускулярной микоризы. Длину всех ее гиф оценили в половину расстояния от Земли до центра Млечного пути Новости робототехники Китайская компания Seres, известная своими электромобилями, представила первого андроида Xiaosai, который умеет распознавать людей и вести с ними диалог Новости робототехники У роботов очень короткая память. Можно ли это исправить? Архив рубрики ~Обо всем~ JUNO уточнил параметры осцилляций нейтрино. Для этого хватило 59 дней наблюдений за реакторными антинейтрино Архив рубрики ~Коротко из Telegram~ Ведомости провели титаническую работу и посчитали, сколько в России иностранных… Архив рубрики ~Коротко из Telegram~ LogicBallsAI собрал 500+ AI-инструментов для текста в одном месте Появился…

Оставить комментарий