
Французский стартап Mistral в области ИИ во вторник представил новое семейство моделей Mistral 3 с открытым весом. Цель этого запуска — доказать, что он может стать лидером в области общедоступности ИИ и обслуживания корпоративных клиентов лучше, чем конкуренты из числа крупных технологических компаний.
Выпуск из 10 моделей включает крупную модель Frontier с многомодальными и многоязычными возможностями, а также девять меньших моделей с возможностью автономной работы и полной настройкой.
Запуск совпал с тем, что компания Mistral, разрабатывающая языковые модели с открытыми весами и ориентированный на Европу чат-бот ИИ Le Chat, похоже, пытается догнать некоторые из передовых моделей Кремниевой долины с закрытым исходным кодом. Модели с открытыми весами публикуют свои весовые коэффициенты в открытом доступе, чтобы любой желающий мог их скачать и запустить. В то же время модели с закрытым исходным кодом, такие как ChatGPT от OpenAI, сохраняют свои весовые коэффициенты в своей собственности и предоставляют доступ только через API или контролируемые интерфейсы.
Двухлетний стартап, основанный бывшими исследователями DeepMind и Meta, на сегодняшний день привлек около 2,7 млрд долларов США при оценке в 13,7 млрд долларов США — это мелочь по сравнению с цифрами, которые приводят такие конкуренты, как OpenAI (привлечено 57 млрд долларов США при оценке в 500 млрд долларов США) и Anthropic (привлечено 45 млрд долларов США при оценке в 350 млрд долларов США).
Однако Mistral пытается доказать, что больше не всегда значит лучше, особенно в корпоративных сценариях использования.
«Наши клиенты иногда рады начать с очень большой [закрытой] модели, которую не нужно настраивать… но при её развертывании они понимают, что это дорого и медленно», — рассказал TechCrunch Гийом Лампле, соучредитель и главный научный сотрудник Mistral. «Затем они обращаются к нам, чтобы мы доработали небольшие модели для более эффективной работы с данным вариантом использования».
«На практике подавляющее большинство случаев использования в корпоративной среде можно реализовать с помощью небольших моделей, особенно если их точно настроить», — продолжил Лэмпл.
По словам Лэмпла, первоначальные сравнения с эталонными моделями, которые значительно отстают от конкурентов с закрытым исходным кодом, могут быть обманчивы. Крупные модели с закрытым исходным кодом могут работать лучше сразу, но реальный прирост достигается при настройке.
«Во многих случаях вы действительно можете сравниться с моделями с закрытым исходным кодом или даже превзойти их», — сказал он.
Французы готовят 👀
Ministral 3 8B 2512, Vision, Apache 2.0 pic.twitter.com/kUAvgSGoqX
— Xeophon @ NeurIPS 🇺🇸 (@xeophon_) 30 ноября 2025 г.
Модель Mistral для крупных передовых систем, получившая название Mistral Large 3, догоняет по некоторым важным возможностям более крупные модели искусственного интеллекта с закрытым исходным кодом, такие как OpenAI GPT-4o и Google Gemini 2, но при этом конкурирует с несколькими конкурентами с открытым исходным кодом. Large 3 — одна из первых моделей с открытым передовым интерфейсом, сочетающая в себе мультимодальные и многоязыковые возможности, что ставит её в один ряд с Llama 3 от Meta и Qwen3-Omni от Alibaba. Многие другие компании в настоящее время объединяют впечатляющие модели для крупных языковых систем с отдельными мультимодальными моделями меньшего размера, как это уже делала Mistral с такими моделями, как Pixtral и Mistral Small 3.1.
Large 3 также имеет архитектуру «гранулированной смеси экспертов» с 41 млрд активных параметров и 675 млрд общих параметров, что обеспечивает эффективные рассуждения в окне контекста размером 256 тыс. параметров. Такая архитектура обеспечивает как скорость, так и функциональность, позволяя обрабатывать объёмные документы и выступать в качестве агентского помощника для решения сложных корпоративных задач. Mistral позиционирует Large 3 как подходящий инструмент для анализа документов, кодирования, создания контента, создания ИИ-помощников и автоматизации рабочих процессов.
С выпуском нового семейства малых моделей под названием Ministral 3 компания смело заявляет, что меньшие модели не просто достаточны — они превосходны.
Линейка включает девять отдельных высокопроизводительных плотных моделей трех размеров (параметры 14B, 8B и 3B) и трех вариантов: Base (предварительно обученная базовая модель), Instruct (оптимизированная для чата и рабочих процессов в стиле помощника) и Reasoning (оптимизированная для сложных логических и аналитических задач).
Mistral заявляет, что эта линейка предоставляет разработчикам и компаниям гибкость в подборе моделей под конкретные задачи, независимо от того, нужна ли им чистая производительность, экономическая эффективность или специализированные возможности. Компания утверждает, что Ministral 3 имеет показатели на уровне или выше, чем другие лидеры в открытом весе, при этом он более эффективен и генерирует меньше токенов для эквивалентных задач. Все варианты поддерживают машинное зрение, обрабатывают от 128 до 256 тысяч контекстных окон и работают на разных языках.
Важная часть предложения — практичность. Лэмпл подчёркивает, что Ministral 3 может работать на одном графическом процессоре, что делает его пригодным для развёртывания на доступном оборудовании — от локальных серверов до ноутбуков, роботов и других периферийных устройств с ограниченным подключением. Это важно не только для предприятий, хранящих данные внутри компании, но и для студентов, которым нужна обратная связь офлайн, или для групп робототехников, работающих удалённо. По мнению Лэмпла, повышение эффективности напрямую влияет на доступность.
«Часть нашей миссии — обеспечить доступность ИИ для всех, особенно для тех, у кого нет доступа к интернету», — сказал он. «Мы не хотим, чтобы ИИ контролировался лишь парой крупных лабораторий».
Некоторые другие компании ищут аналогичные компромиссы в плане эффективности: последняя корпоративная модель Cohere, Command A, также работает всего на двух графических процессорах, а ее платформа ИИ-агентов North может работать только на одном графическом процессоре.
Именно такая доступность стимулирует растущую ориентацию Mistral на физический ИИ. Ранее в этом году компания начала работать над интеграцией своих небольших моделей в роботов, дроны и транспортные средства. Mistral сотрудничает с сингапурским Агентством по науке и технологиям (HTX) над специализированными моделями для роботов, систем кибербезопасности и пожарной безопасности; с немецким стартапом в сфере оборонных технологий Helsing — над моделями «зрение-язык-действие» для дронов; и с автопроизводителем Stellantis — над автомобильным помощником на основе ИИ.
Для Mistral надежность и независимость так же важны, как и производительность.
«Использование API наших конкурентов, который будет отключаться на полчаса каждые две недели, — если вы крупная компания, вы не можете себе этого позволить», — сказал Лэмпл.
Источник: techcrunch.com



![⚡️ 40 бесплатных курсов по нейросетям: русские и зарубежные [+видеоуроки]... 3 file_1214.jpg](https://ideipro.ru/wp-content/uploads/2025/12/file_1214.jpg)



















