• Главная
  • Архив рубрики ~Лента новостей~
  • Компания Mistral AI запускает Forge, чтобы помочь компаниям создавать собственные модели искусственного интеллекта, бросая вызов гигантам облачных вычислений.
Image

Компания Mistral AI запускает Forge, чтобы помочь компаниям создавать собственные модели искусственного интеллекта, бросая вызов гигантам облачных вычислений.

Содержание

Майкл Нуньес

nuneybits Векторное изображение кузницы, созданной из компьютерного кода в co e81353af-4d23-4b20-853d-84fad8cc9b3f

Источник: VentureBeat, создано с помощью Midjourney

В понедельник компания Mistral AI запустила Forge, платформу для обучения корпоративных моделей, которая позволяет организациям создавать, настраивать и постоянно совершенствовать модели ИИ, используя собственные данные. Этот шаг ставит французскую лабораторию ИИ в один ряд с гипермасштабными облачными провайдерами на одном из наиболее значимых и наименее изученных рынков корпоративных технологий.

Это объявление завершает невероятно насыщенную неделю для Mistral, которая также выпустила свою модель Mistral Small 4, представила Leanstral — агент с открытым исходным кодом для формальной верификации — и присоединилась к недавно сформированной коалиции Nvidia Nemotron в качестве соразработчика первой открытой базовой модели коалиции. В совокупности эти шаги рисуют картину компании, которая больше не довольствуется конкуренцией только за счет бенчмарков моделей и вместо этого стремится стать инфраструктурной основой для организаций, которые хотят владеть своим ИИ, а не арендовать его.

Forge значительно превосходит API для тонкой настройки, которые Mistral и его конкуренты предлагали в течение последнего года. Платформа поддерживает полный цикл обучения моделей: предварительное обучение на больших внутренних наборах данных, последующее обучение с помощью контролируемой тонкой настройки, DPO и ODPO, и — что особенно важно — конвейеры обучения с подкреплением, разработанные для согласования моделей с внутренними политиками, критериями оценки и операционными целями с течением времени.

«Forge — это платформа для обучения моделей от Mistral», — заявила Элиза Саламанка, руководитель отдела продуктов Mistral AI, в эксклюзивном интервью VentureBeat перед запуском. «Мы разрабатывали её в фоновом режиме с нашими специалистами по искусственному интеллекту. Главное преимущество Forge заключается в том, что она позволяет предприятиям и государственным структурам настраивать модели ИИ под свои конкретные потребности».

Почему, по мнению Mistral, тонкой настройки API уже недостаточно для серьезного корпоративного ИИ

Различие, которое проводит Мистраль — между легкой тонкой настройкой и полным циклом обучения модели — имеет решающее значение для понимания того, почему существует Forge и кому он служит.

В течение последних двух лет внедрение ИИ в большинстве предприятий следовало знакомой схеме: компании выбирают универсальную модель от OpenAI, Anthropic, Google или поставщика с открытым исходным кодом, а затем применяют тонкую настройку через облачный API для корректировки поведения модели под узкий набор задач. Такой подход хорошо работает для пилотных проектов и многих сценариев использования в производственной среде. Однако Саламанка утверждает, что он принципиально останавливается на достигнутом, когда организации пытаются решить свои самые сложные проблемы.

«У нас был API для тонкой настройки, основанный на контролируемой тонкой настройке. Думаю, пару месяцев назад это был своего рода стандарт», — сказал Саламанка в интервью VentureBeat. «Он позволяет достичь состояния, соответствующего концепции. Но когда вы действительно хотите добиться желаемой производительности, вам нужно идти дальше. Сегодня специалисты по искусственному интеллекту не используют API для тонкой настройки. Они используют гораздо более продвинутые инструменты, и именно это предлагает Forge».

По словам Саламанки, Forge представляет собой набор инструментов, используемых внутри компании специалистами Mistral по искусственному интеллекту для создания флагманских моделей, включая стратегии смешивания данных, конвейеры генерации данных, оптимизацию распределенных вычислений и проверенные на практике алгоритмы обучения. Она провела четкую параллель между Forge и инструментами с открытым исходным кодом и руководствами от сообщества, которые сегодня доступны бесплатно.

«На рынке нет платформы, которая предоставляла бы реальные, работающие в реальных условиях рецепты обучения», — сказал Саламанка. «Другие репозитории с открытым исходным кодом или другие инструменты могут предоставлять общие конфигурации или руководства от сообщества, но они не предоставляют проверенный рецепт, который мы используем сегодня для всех наших флагманских моделей».

От древних рукописей до языков количественного анализа в хедж-фондах: первые клиенты показывают, чего не могут сделать готовые решения на основе ИИ.

Очевидный вопрос, стоящий перед любым продуктом, подобным Forge, — это спрос. На рынке, где GPT-5, Claude, Gemini и растущий парк моделей с открытым исходным кодом могут решать огромное количество задач, зачем предприятию вкладывать время, вычислительные ресурсы и опыт, необходимые для обучения собственной модели с нуля?

Саламанка прямо признала наличие этого вопроса, но отметила, что необходимость в таких моделях возникает быстро, как только компании выходят за рамки общих сценариев использования. «Многие из существующих моделей могут помочь вам добиться больших успехов, — сказала она. — Но когда вы рассматриваете, что сделает вас конкурентоспособными по сравнению с конкурентами, — все могут использовать существующие модели. Если же вы хотите пойти дальше, вам необходимо создать собственные модели. Вам нужно использовать свою конфиденциальную информацию».

Приведенные ею примеры из реальной жизни иллюстрируют ограничения существующей экосистемы моделей. В одном случае компания Mistral работала с государственным учреждением, которое хранило древние рукописи с отсутствующим текстом в поврежденных фрагментах. «Доступные модели не могли этого сделать, потому что они никогда не видели эти данные», — объяснила Саламанка. «Оцифровка была не очень хорошей. Были обнаружены некоторые уникальные закономерности и символы, поэтому мы создали для них модель, чтобы заполнить пробелы. Теперь эта модель используется их исследователями, и это ускоряет публикацию и понимание этих документов».

В другом проекте компания Mistral сотрудничала с Ericsson для адаптации своей модели Codestral для перевода устаревшего кода на современный. По словам Саламанки, Ericsson накопила за полдесятилетия собственные знания о внутреннем языке вызовов — кодовой базе настолько специализированной, что ни одна стандартная модель никогда с ней не сталкивалась. «Конкретный эффект заключается в том, что процесс ручной миграции, занимающий год и требующий шести месяцев адаптации каждого инженера, превращается в нечто действительно масштабируемое и быстрое», — сказала она.

Пожалуй, наиболее показательный пример связан с хедж-фондами. Саламанка рассказал о работе с финансовыми фирмами по настройке моделей для собственных количественных языков программирования — своего рода тщательно охраняемой интеллектуальной собственности, которую эти фирмы хранят локально и никогда не предоставляют облачным сервисам ИИ. Используя возможности обучения с подкреплением Forge, Mistral помог одному хедж-фонду разработать собственные бенчмарки, а затем обучил модель превзойти их, создав, по словам Саламанки, «уникальную модель, которая смогла дать им необходимое конкурентное преимущество».

Как Forge зарабатывает деньги: лицензионные сборы, конвейеры обработки данных и встроенные специалисты по искусственному интеллекту.

Бизнес-модель Forge отражает сложность обучения корпоративных моделей. По словам Саламанки, компания работает по нескольким источникам дохода. Для клиентов, которые запускают задачи обучения на собственных кластерах графических процессоров — распространенное требование в высокорегулируемых или чувствительных к интеллектуальной собственности отраслях — Mistral не взимает плату за вычислительные ресурсы. Вместо этого компания взимает лицензионный сбор за саму платформу Forge, а также дополнительные сборы за услуги обработки данных и то, что Mistral называет «специалистами, работающими на передовой» — встроенных исследователей в области ИИ, которые работают вместе с командой клиента.

«Сегодня ни один из конкурентов не продает встроенных специалистов в качестве части своей платформы для обучения», — сказал Саламанка.

Эта модель явно перекликается с ранней стратегией Palantir, где инженеры, работающие непосредственно на местах, служили важнейшим связующим звеном между мощным программным обеспечением и сложной реальностью корпоративных данных. Она также предполагает, что Mistral осознает фундаментальную истину о текущем состоянии корпоративного ИИ: одной технологии недостаточно. Большинству организаций не хватает внутренней экспертизы для разработки эффективных алгоритмов обучения, обработки данных в больших масштабах или преодоления коварного ландшафта оптимизации распределенного обучения на графических процессорах.

Сама инфраструктура отличается гибкостью. Обучение может проходить на собственных кластерах Mistral, на Mistral Compute (выделенная инфраструктура компании) или полностью на собственных центрах обработки данных заказчика. «У нас есть множество различных сценариев, и мы поддерживаем все», — сказал Саламанка.

Главное преимущество Forge — это возможность хранить конфиденциальные данные вне облака.

Одним из главных конкурентных преимуществ Forge, на котором делает акцент Mistral, является конфиденциальность данных. Саламанка подчеркнул, что когда клиенты проводят обучение на собственной инфраструктуре, Mistral вообще не видит эти данные.

«Это находится в их кластерах, это вместе с их данными — мы ничего из этого не видим, поэтому это полностью под их контролем», — сказала она. «Я думаю, это то, что отличает нас от конкурентов, где вам нужно загружать свои данные, и это создает эффект «черного ящика»».

Это имеет огромное значение в таких секторах, как оборона, разведка, финансовые услуги и здравоохранение, где юридические и репутационные риски, связанные с раскрытием конфиденциальных данных стороннему облачному сервису, могут стать решающим фактором. Компания Mistral уже сотрудничает с такими организациями, как ASML, DSO National Laboratories Singapore, Европейское космическое агентство, Агентство науки и технологий Министерства внутренних дел Сингапура и Reply — этот список говорит о том, что компания целенаправленно ориентируется на наиболее чувствительные к данным сегменты корпоративного рынка.

Forge также включает в себя возможности обработки данных, разработанные компанией Mistral в рамках обучения собственных моделей: сбор данных, их обработка и генерация синтетических данных. «Данные — это критически важная часть любой задачи обучения сегодня, — сказал Саламанка. — Вам нужны качественные данные. Вам нужно достаточное количество данных, чтобы гарантировать высокую производительность модели. Наша компания накопила огромный опыт в создании таких конвейеров обработки данных».

В эпоху агентов искусственного интеллекта, как утверждает Мистраль, пользовательские модели по-прежнему имеют большее значение, чем серверы MCP.

Время запуска Forge поднимает важный стратегический вопрос. В 2026 году индустрия ИИ будет полностью поглощена агентами — автономными системами искусственного интеллекта, способными использовать инструменты, управлять многоэтапными рабочими процессами и выполнять действия от имени пользователей. Если будущее принадлежит агентам, почему важна базовая модель? Разве компании не могут просто подключиться к лучшей доступной модели через MCP-сервер или API и сосредоточить свои усилия на оркестрации?

Саламанка решительно возразила против такой формулировки. «У клиентов, с которыми мы работаем, некоторые из этих конкретных проблем — это то, что ни один сервер MCP никогда не сможет решить», — сказала она. «Вам действительно нужна эта информация. Вам действительно нужно создать такую модель, которая поможет вам решить вашу самую важную бизнес-проблему».

Она также утверждала, что настройка модели необходима даже в чисто агентных архитектурах. «Есть определенные агентные модели поведения, которые необходимо внедрить в модель, — сказала Саламанка. — Это может касаться шаблонов рассуждений, конкретных типов документации, обеспечения правильности траекторий рассуждений. Даже в тех случаях, когда люди полностью переходят на агентную архитектуру, все равно необходима настройка модели — например, с помощью методов обучения с подкреплением — чтобы добиться нужного уровня производительности».

В пресс-релизе Mistral эта связь явно обозначена, поскольку утверждается, что пользовательские модели повышают надежность корпоративных агентов, обеспечивая более глубокое понимание внутренней среды: более точный выбор инструментов, более надежные многоэтапные рабочие процессы и решения, отражающие внутреннюю политику, а не общие предположения.

Платформа также поддерживает философию проектирования «агент прежде всего». Forge предоставляет интерфейсы, позволяющие автономным агентам — включая собственного агента кодирования Vibe от Mistral — запускать эксперименты по обучению, находить оптимальные гиперпараметры, планировать задания и генерировать синтетические данные. «Мы фактически разрабатывали Forge с учетом потребностей ИИ», — сказал Саламанка. «Мы уже тестируем, как автономные агенты могут запускать эксперименты по обучению».

Mistral Small 4, Leanstral и коалиция Nvidia: неделя, которая переосмыслила амбиции компании.

Чтобы в полной мере оценить значимость Forge, полезно рассматривать его в контексте других анонсов, сделанных Mistral на той же неделе — целой серии релизов, которые в совокупности представляют собой самое амбициозное расширение за короткую историю компании.

Буквально вчера компания Mistral выпустила Leanstral, первый агент с открытым исходным кодом для Lean 4, системы автоматического доказательства, используемой в формальной математике и верификации программного обеспечения. Leanstral работает всего с 6 миллиардами активных параметров и предназначен для реалистичных репозиториев формального анализа, а не для решения отдельных задач математических соревнований. В тот же день Mistral запустила Mistral Small 4, модель, использующую смесь экспертов, с общим количеством параметров 119 миллиардов, но всего 6 миллиардами активных параметров на запрос. Она работает на 40 процентов быстрее своего предшественника и обрабатывает в три раза больше запросов в секунду. Обе модели распространяются под лицензией Apache 2.0 — самой либеральной лицензией с открытым исходным кодом, широко используемой в настоящее время.

А еще есть коалиция Nvidia Nemotron. Объявленная на конференции Nvidia GTC, эта коалиция представляет собой первое в своем роде сотрудничество между Nvidia и группой лабораторий искусственного интеллекта — включая Mistral, Perplexity, LangChain, Cursor, Black Forest Labs, Reflection AI, Sarvam и Thinking Machines Lab — для совместной разработки моделей открытого поколения. Первый проект коалиции — это базовая модель, разработанная совместно Mistral AI и Nvidia, обученная на облачной платформе Nvidia DGX Cloud, которая ляжет в основу будущего семейства открытых моделей Nvidia Nemotron 4.

«Открытые передовые модели — это то, как ИИ становится настоящей платформой», — заявил Артур Менш, соучредитель и генеральный директор Mistral AI, в заявлении Nvidia. «Вместе с Nvidia мы займем ведущую роль в обучении и развитии передовых моделей в масштабах всей страны».

Эта роль коалиции имеет стратегическое значение. Она позиционирует Mistral не просто как потребителя вычислительной инфраструктуры Nvidia, но и как соавтора базовых моделей, на которых будет строиться вся экосистема. Для компании, которая все еще значительно уступает своим американским конкурентам, это невероятно важное место за столом переговоров.

Forge критикует Amazon, Microsoft и Google — и заявляет, что они не могут проникнуть достаточно глубоко.

Forge выходит на рынок, который уже переполнен — по крайней мере, на первый взгляд. Amazon Bedrock, Microsoft Azure AI Foundry и Google Cloud Vertex AI предлагают возможности обучения и настройки моделей. Но Саламанка утверждал, что эти предложения принципиально ограничены в двух отношениях.

Во-первых, они работают только в облаке. «В одном из случаев ответить очень просто — они хотят запускать это на своих собственных серверах, поэтому все эти инструменты, доступные в облаке, им просто недоступны», — сказала Саламанка. Во-вторых, она утверждала, что инструменты обучения, предлагаемые крупными компаниями, в основном предоставляют упрощенные API-интерфейсы, которые не обеспечивают той глубины контроля, которая необходима для серьезного обучения моделей.

Существует также вопрос зависимости. Саламанка описала компании, изначально ориентированные на цифровые технологии, которые создавали продукты на основе моделей с закрытым исходным кодом, но затем выпуск новой модели — более многословной, чем предыдущая — привел к сбою в их производственных процессах. «Когда вы полагаетесь на модели с закрытым исходным кодом, вы также сильно зависите от обновлений модели, которые имеют побочные эффекты», — предупредила она.

Этот аргумент перекликается с более широкой концепцией суверенитета, которая способствовала подъему Mistral в Европе и за ее пределами. Компания позиционирует себя как альтернатива для организаций, которые хотят владеть своим стеком ИИ, а не арендовать его у американских гипермасштабных компаний. Forge расширяет этот аргумент от вывода к обучению: речь идет не просто о запуске моделей, которыми вы владеете, а об их первоначальном создании.

Здесь также важна открытая основа. Компания Mistral выпускает модели под разрешительными лицензиями с момента своего основания, и Саламанка подчеркнула, что компания строит Forge как открытую платформу. Хотя в настоящее время она работает с собственными моделями Mistral, она подтвердила, что планируется поддержка других архитектур с открытым исходным кодом. «Мы глубоко привержены открытому исходному коду. Это было частью нашей ДНК с самого начала, и мы строили Forge как открытую платформу — это лишь вопрос времени, когда мы откроем ее для других моделей с открытым исходным кодом».

Уход одного из соучредителей в компанию xAI подчеркивает, почему Mistral превращает экспертные знания в продукт.

Запуск Forge также совпадает с жесткой конкуренцией за таланты. Как сообщало издание FinTech Weekly 14 марта, Девендра Сингх Чаплот — соучредитель Mistral AI, возглавлявший мультимодальную группу компании и участвовавший в обучении Mistral 7B, Mixtral 8x7B и Mistral Large — ушел в компанию xAI Илона Маска, где будет работать над обучением модели Grok. Ранее Чаплот также был одним из основателей Thinking Machines Lab, стартапа в области искусственного интеллекта, основанного бывшим техническим директором OpenAI Мирой Мурати.

Потеря сооснователя никогда не бывает незначительной, но, похоже, Mistral компенсирует это скорее институциональными возможностями, чем индивидуальным талантом. Forge, по сути, представляет собой продукт, созданный на основе коллективного опыта компании в области обучения — рецептов, конвейеров, оптимизации распределенных вычислений — в форме, которая может масштабироваться за пределы возможностей любого отдельного исследователя. Упаковав эти знания в платформу и объединив их с работающими в ней учеными, Mistral пытается создать устойчивый конкурентный актив, который не исчезнет после ухода ключевого сотрудника.

Главная ставка Mistral: победят компании, которые владеют их моделями искусственного интеллекта.

Forge — это ставка на конкретную теорию будущего корпоративного ИИ: что наиболее ценными будут системы ИИ, обученные на основе собственных знаний, управляемые внутренней политикой и работающие под непосредственным контролем организации. Это контрастирует с преобладающей парадигмой последних двух лет, в которой предприятия в основном использовали ИИ как облачный сервис — мощный, но универсальный, удобный, но неконтролируемый.

Вопрос в том, будет ли достаточное количество предприятий готово вложить средства. Обучение моделей — дорогостоящий, технически сложный процесс, требующий постоянной организационной поддержки. Forge снижает эти барьеры — благодаря автоматизации инфраструктуры, проверенным на практике алгоритмам и привлеченным ученым — но не устраняет их полностью.

По всей видимости, компания Mistral рассчитывает на то, что организации, которые больше всего выиграют от ИИ — те, кто обладает многолетним опытом и знаниями в узкоспециализированных областях, — это именно те, для кого универсальные модели наименее эффективны. Именно в этих компаниях разрыв между возможностями универсальной модели и реальными потребностями бизнеса наиболее велик, и именно здесь конкурентное преимущество от сокращения этого разрыва наиболее велико.

Forge поддерживает как плотные, так и смешанные архитектуры с экспертами, учитывая различные компромиссы между производительностью, стоимостью и эксплуатационными ограничениями. Он обрабатывает многомодальные входные данные. Он разработан для непрерывной адаптации, а не для однократного обучения, и имеет встроенные фреймворки оценки, которые позволяют предприятиям тестировать модели на внутренних эталонах перед развертыванием в производственной среде.

В течение последних двух лет стратегия внедрения ИИ в корпоративной среде была довольно простой: выбираешь модель, вызываешь API, внедряешь функцию. Теперь же компания Mistral задает более сложный вопрос: получат ли организации, готовые выполнять сложную, дорогостоящую и не самую привлекательную работу по обучению собственных моделей, то, чего никогда не получат пользователи API?

Несправедливое преимущество.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Forge, Mistral AI, искусственный интеллект, Компания, Модели, новости, Облачные Вычисления

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Компания Latent привлекла 80 миллионов долларов для своей платформы по одобрению лекарственных препаратов на основе ИИ | MobiHealthNews
STAT+: Novo Nordisk и Hims достигли соглашения, положившего конец ожесточенному спору о продажах Wegovy.
Матрица покрытия рекомендаций ИИ, частично и полностью покрытые категории.
Джефф Безос только что объявил о планах создания третьей мегагруппировки спутников — на этот раз для центров обработки данных.
Комиссия по ценным бумагам и биржам (SEC) прекращает четырехлетнее расследование в отношении стартапа по производству электромобилей Faraday Future.
ideipro logotyp
Почему мир не перерабатывает больше ядерных отходов
ideipro logotyp
Брайан Хедден назначен со-заместителем декана по вопросам социальной и этической ответственности в сфере вычислительной техники.
Image Not Found
Компания Latent привлекла 80 миллионов долларов для своей платформы по одобрению лекарственных препаратов на основе ИИ | MobiHealthNews

Компания Latent привлекла 80 миллионов долларов для своей платформы по одобрению лекарственных препаратов на основе ИИ | MobiHealthNews

Компания планирует использовать полученные средства для усовершенствования своей платформы, расширения штата сотрудников и развития партнерских отношений с системами здравоохранения для автоматизации процессов утверждения лекарственных препаратов. Инвестиции Фото: Hispanolistic/Getty Images Компания Latent, занимающаяся автоматизацией процессов утверждения лекарственных препаратов,…

Мар 23, 2026
STAT+: Novo Nordisk и Hims достигли соглашения, положившего конец ожесточенному спору о продажах Wegovy.

STAT+: Novo Nordisk и Hims достигли соглашения, положившего конец ожесточенному спору о продажах Wegovy.

Датская фармацевтическая компания отзовет иск, а гигант цифрового здравоохранения прекратит продажу препаратов, изготовленных по индивидуальным рецептам. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей МАДС КЛАУС РАСМУССЕН / Ritzau Scanpix /…

Мар 23, 2026
Матрица покрытия рекомендаций ИИ, частично и полностью покрытые категории.

PRIMARY-AI: стандарты, основанные на результатах, для защиты первичной медицинской помощи в эпоху ИИ.

Доступ через ваше учебное заведение. Купить или оформить подписку. Искусственный интеллект (ИИ) внедряется в первичном звене здравоохранения в больших масштабах — от диагностической поддержки и стратификации рисков до сортировки пациентов и ведения клинической документации — без какой-либо…

Мар 23, 2026
Джефф Безос только что объявил о планах создания третьей мегагруппировки спутников — на этот раз для центров обработки данных.

Джефф Безос только что объявил о планах создания третьей мегагруппировки спутников — на этот раз для центров обработки данных.

«Космические центры обработки данных станут дополнением к наземной инфраструктуре». Джефф Безос нацелился на еще одно мегасозвездие. Фото: Джо Рэдл/Getty Images. Джефф Безос нацелился на еще одно мегасозвездие. Фото: Джо Рэдл/Getty Images. Настройки текста. Текст рассказа Размер Маленький…

Мар 23, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых