Image

Mistral приближается к крупным конкурентам на базе искусственного интеллекта с новым рубежом в открытом весе и малыми моделями

Логотип Mistral на экране ноутбука
Авторы изображений: Рафаэль Энрике/SOPA Images/LightRocket / Getty Images

Французский стартап Mistral в области ИИ во вторник представил новое семейство моделей Mistral 3 с открытым весом. Цель этого запуска — доказать, что он может стать лидером в области общедоступности ИИ и обслуживания корпоративных клиентов лучше, чем конкуренты из числа крупных технологических компаний.

Выпуск из 10 моделей включает крупную модель Frontier с многомодальными и многоязычными возможностями, а также девять меньших моделей с возможностью автономной работы и полной настройкой.

Запуск совпал с тем, что компания Mistral, разрабатывающая языковые модели с открытыми весами и ориентированный на Европу чат-бот ИИ Le Chat, похоже, пытается догнать некоторые из передовых моделей Кремниевой долины с закрытым исходным кодом. Модели с открытыми весами публикуют свои весовые коэффициенты в открытом доступе, чтобы любой желающий мог их скачать и запустить. В то же время модели с закрытым исходным кодом, такие как ChatGPT от OpenAI, сохраняют свои весовые коэффициенты в своей собственности и предоставляют доступ только через API или контролируемые интерфейсы.

Двухлетний стартап, основанный бывшими исследователями DeepMind и Meta, на сегодняшний день привлек около 2,7 млрд долларов США при оценке в 13,7 млрд долларов США — это мелочь по сравнению с цифрами, которые приводят такие конкуренты, как OpenAI (привлечено 57 млрд долларов США при оценке в 500 млрд долларов США) и Anthropic (привлечено 45 млрд долларов США при оценке в 350 млрд долларов США).

Однако Mistral пытается доказать, что больше не всегда значит лучше, особенно в корпоративных сценариях использования.

«Наши клиенты иногда рады начать с очень большой [закрытой] модели, которую не нужно настраивать… но при её развертывании они понимают, что это дорого и медленно», — рассказал TechCrunch Гийом Лампле, соучредитель и главный научный сотрудник Mistral. «Затем они обращаются к нам, чтобы мы доработали небольшие модели для более эффективной работы с данным вариантом использования».

«На практике подавляющее большинство случаев использования в корпоративной среде можно реализовать с помощью небольших моделей, особенно если их точно настроить», — продолжил Лэмпл.

По словам Лэмпла, первоначальные сравнения с эталонными моделями, которые значительно отстают от конкурентов с закрытым исходным кодом, могут быть обманчивы. Крупные модели с закрытым исходным кодом могут работать лучше сразу, но реальный прирост достигается при настройке.

«Во многих случаях вы действительно можете сравниться с моделями с закрытым исходным кодом или даже превзойти их», — сказал он.

Модель Mistral для крупных передовых систем, получившая название Mistral Large 3, догоняет по некоторым важным возможностям более крупные модели искусственного интеллекта с закрытым исходным кодом, такие как OpenAI GPT-4o и Google Gemini 2, но при этом конкурирует с несколькими конкурентами с открытым исходным кодом. Large 3 — одна из первых моделей с открытым передовым интерфейсом, сочетающая в себе мультимодальные и многоязыковые возможности, что ставит её в один ряд с Llama 3 от Meta и Qwen3-Omni от Alibaba. Многие другие компании в настоящее время объединяют впечатляющие модели для крупных языковых систем с отдельными мультимодальными моделями меньшего размера, как это уже делала Mistral с такими моделями, как Pixtral и Mistral Small 3.1.

Large 3 также имеет архитектуру «гранулированной смеси экспертов» с 41 млрд активных параметров и 675 млрд общих параметров, что обеспечивает эффективные рассуждения в окне контекста размером 256 тыс. параметров. Такая архитектура обеспечивает как скорость, так и функциональность, позволяя обрабатывать объёмные документы и выступать в качестве агентского помощника для решения сложных корпоративных задач. Mistral позиционирует Large 3 как подходящий инструмент для анализа документов, кодирования, создания контента, создания ИИ-помощников и автоматизации рабочих процессов.

С выпуском нового семейства малых моделей под названием Ministral 3 компания смело заявляет, что меньшие модели не просто достаточны — они превосходны.

Линейка включает девять отдельных высокопроизводительных плотных моделей трех размеров (параметры 14B, 8B и 3B) и трех вариантов: Base (предварительно обученная базовая модель), Instruct (оптимизированная для чата и рабочих процессов в стиле помощника) и Reasoning (оптимизированная для сложных логических и аналитических задач).

Mistral заявляет, что эта линейка предоставляет разработчикам и компаниям гибкость в подборе моделей под конкретные задачи, независимо от того, нужна ли им чистая производительность, экономическая эффективность или специализированные возможности. Компания утверждает, что Ministral 3 имеет показатели на уровне или выше, чем другие лидеры в открытом весе, при этом он более эффективен и генерирует меньше токенов для эквивалентных задач. Все варианты поддерживают машинное зрение, обрабатывают от 128 до 256 тысяч контекстных окон и работают на разных языках.

Важная часть предложения — практичность. Лэмпл подчёркивает, что Ministral 3 может работать на одном графическом процессоре, что делает его пригодным для развёртывания на доступном оборудовании — от локальных серверов до ноутбуков, роботов и других периферийных устройств с ограниченным подключением. Это важно не только для предприятий, хранящих данные внутри компании, но и для студентов, которым нужна обратная связь офлайн, или для групп робототехников, работающих удалённо. По мнению Лэмпла, повышение эффективности напрямую влияет на доступность.

«Часть нашей миссии — обеспечить доступность ИИ для всех, особенно для тех, у кого нет доступа к интернету», — сказал он. «Мы не хотим, чтобы ИИ контролировался лишь парой крупных лабораторий».

Некоторые другие компании ищут аналогичные компромиссы в плане эффективности: последняя корпоративная модель Cohere, Command A, также работает всего на двух графических процессорах, а ее платформа ИИ-агентов North может работать только на одном графическом процессоре.

Именно такая доступность стимулирует растущую ориентацию Mistral на физический ИИ. Ранее в этом году компания начала работать над интеграцией своих небольших моделей в роботов, дроны и транспортные средства. Mistral сотрудничает с сингапурским Агентством по науке и технологиям (HTX) над специализированными моделями для роботов, систем кибербезопасности и пожарной безопасности; с немецким стартапом в сфере оборонных технологий Helsing — над моделями «зрение-язык-действие» для дронов; и с автопроизводителем Stellantis — над автомобильным помощником на основе ИИ.

Для Mistral надежность и независимость так же важны, как и производительность.

«Использование API наших конкурентов, который будет отключаться на полчаса каждые две недели, — если вы крупная компания, вы не можете себе этого позволить», — сказал Лэмпл.

Источник: techcrunch.com

✅ Найденные теги: Mistral, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Современная лаборатория с учеными в белых халатах и высокотехнологичным оборудованием.
Цветные полосы на экране, символизирующие обработку данных или анализ ДНК.
Спикер с микрофоном на AI Impact Summit, цветы на столе, яркий фон.
Астероид пролетает рядом с планетой среди космических просторов.
Новое светоактивируемое покрытие способно убивать стойкие микробы
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.
ИИ-микрофон Echomic превращает речь в текст
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.
Agentic RAG против Classic RAG: от конвейера к контуру управления
Image Not Found
Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Добро пожаловать на темную сторону мечты о криптовалютах, где не требуется никаких разрешений.

Жан-Поль Торбьорнсен — лидер THORChain, блокчейна, который, как предполагалось, не должен иметь лидеров, и который сейчас переживает череду…

Мар 13, 2026
ИИ-микрофон Echomic превращает речь в текст

ИИ-микрофон Echomic превращает речь в текст

Смарт-микрофон Echomic с искусственным интеллектом — это удобный инструмент для записи голоса, преобразования его в текст и управления…

Мар 13, 2026
Методология облучения 1-гексаноловых растворов: этапы исследования и анализ.

Разработан подход к выявлению облученных пищевых продуктов

Этапы исследования© MoleculesУчёные НИИ ядерной физики, физического и химического факультетов МГУ изучили влияние ионизирующего излучения…

Мар 13, 2026
Agentic RAG против Classic RAG: от конвейера к контуру управления

Agentic RAG против Classic RAG: от конвейера к контуру управления

Практическое руководство по выбору между однопроходными конвейерами и адаптивными циклами извлечения данных в зависимости от сложности,…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых