Image

Google выпускает Gemini 3.1 Flash Lite по цене в 8 раз ниже, чем у версии Pro.

Карл Франзен

Обои с изображением светящегося ПК и логотипом G.

Источник: VentureBeat, создано с помощью Google Gemini 3.1 Pro.

Представляем новейшую модель искусственного интеллекта от Google: Gemini 3.1 Flash-Lite, и на этот раз основные улучшения касаются стоимости и скорости, особенно для предприятий и разработчиков, стремящихся использовать мощные возможности логического мышления и мультимодального анализа от американского поискового и облачного гиганта.

Позиционируя эту модель как наиболее экономичную и быстродействующую в серии Gemini 3, Google предлагает решение, специально разработанное для масштабируемых интеллектуальных систем.

Этот запуск состоялся всего через несколько недель после февральского дебюта его более мощного аналога, Gemini 3.1 Pro, завершая многоуровневую стратегию, которая позволяет предприятиям масштабировать интеллектуальные функции на каждом уровне своей инфраструктуры.

Технология: оптимизирована для показателя «время до получения первого токена».

В мире высокопроизводительного ИИ показатель, определяющий пользовательский опыт, часто сводится не только к точности, но и к задержке. Для поддержки клиентов в режиме реального времени, модерации контента в реальном времени или мгновенной генерации пользовательского интерфейса «время до первого ответа» является основным индикатором того, воспринимается ли приложение как инструмент или как коллега. Если модели требуется даже две секунды, чтобы начать ответ, иллюзия плавного взаимодействия разрушается.

Устройство Gemini 3.1 Flash-Lite разработано специально для мгновенного получения жетонов. Согласно внутренним тестам и оценкам сторонних экспертов, Flash-Lite превосходит своего предшественника, Gemini 2.5 Flash, демонстрируя в 2,5 раза более быстрое время получения первого жетона. Кроме того, оно может похвастаться увеличением общей скорости обработки на 45 процентов — 363 жетона в секунду по сравнению с 249.

Такая скорость достигается благодаря тому, что Корай Кавукчуоглу, вице-президент по исследованиям в Google DeepMind, описывает в своем посте на X как невероятно сложный инженерный процесс, позволяющий создать ощущение мгновенности работы ИИ.

Пожалуй, самым инновационным техническим нововведением является введение уровней мышления.

Эта функция, стандартизированная для вариантов Flash-Lite и Pro, позволяет разработчикам динамически регулировать интенсивность рассуждений модели. Для простой задачи классификации или анализа больших объемов тональности модели можно снизить интенсивность для достижения максимальной скорости и минимальных затрат.

И наоборот, при сложном анализе кода, создании панелей мониторинга или моделировании можно повысить уровень мышления, позволяя модели проводить более глубокие рассуждения и логические вычисления, прежде чем выдать свой первый ответ.

Продукт: сравнительный анализ лёгкого, но мощного ударного инструмента.

Хотя суффикс «Lite» часто подразумевает значительный компромисс в возможностях, данные о производительности указывают на то, что эта модель вполне может конкурировать с гораздо более крупными системами. Gemini 3.1 Flash-Lite набрала 1432 балла по шкале Эло в таблице лидеров Arena.ai, что ставит её в один ряд с моделями, значительно превосходящими её по количеству параметров.

Тесты Gemini 3.1 Flash-Lite

Результаты тестов Gemini 3.1 Flash-Lite. Источник: Google.

Ключевые результаты сравнительных тестов подчеркивают его сильные стороны в различных когнитивных областях:

  • Научные знания: 86,9% по шкале GPQA Diamond.

  • Мультимодальное понимание: 76,8 процента на MMMU-Pro.

  • Многоязычные вопросы и ответы: 88,9% пользователей MMMLU.

  • Знания в области параметрического анализа: 43,3% подтверждены SimpleQA.

  • Абстрактное мышление: 16,0 процентов на последнем экзамене человечества (полный комплект).

Эта модель особенно хорошо справляется с обеспечением соответствия структурированным выходным данным — критически важным требованием для корпоративных разработчиков, которым необходимо, чтобы ИИ генерировал корректный код в формате JSON, SQL или UI, который не нарушит работу последующих систем.

В таких тестах, как LiveCodeBench, Flash-Lite показал результат 72,0%, превзойдя нескольких конкурентов в своей весовой категории, включая GPT-5 mini, который набрал 80,4% в другом подмножестве тестов, но значительно отстал по скорости и экономичности.

Кроме того, его производительность в тестах CharXiv Reasoning (73,2%) и Video-MMMU (84,8%) демонстрирует, что его многомодальные возможности достаточно надежны для сложного синтеза диаграмм и извлечения знаний из видео.

Иерархия интеллекта: Flash-Lite против 3.1 Pro

Чтобы понять место Flash-Lite на рынке, необходимо рассматривать его в контексте Gemini 3.1 Pro, выпущенного Google в середине февраля 2026 года с целью вернуть себе лидерство в области искусственного интеллекта. Если Flash-Lite — это рефлексы системы Gemini, то 3.1 Pro, несомненно, является её «мозгом».

Главное отличие заключается в глубине когнитивной обработки. Gemini 3.1 Pro был разработан для того, чтобы вдвое повысить производительность в области рассуждений по сравнению с предыдущим поколением, достигнув подтвержденного результата в 77,1% в ARC-AGI-2 — бенчмарке, предназначенном для проверки способности модели решать совершенно новые логические задачи, с которыми она не сталкивалась во время обучения.

Хотя Flash-Lite демонстрирует неплохие результаты в научной сфере, достигая 86,9%, модель Pro поднимает этот показатель до впечатляющих 94,3%, что делает её лучшим выбором для глубоких исследований и анализа важных данных. В зависимости от этих различий в подходах к применению, область применения также значительно различается.

Gemini 3.1 Pro способен создавать «вайб-код» — анимированные SVG-изображения и сложные 3D-симуляции непосредственно из текстовых подсказок. Например, в одной из демонстраций Pro запрограммировал сложную 3D-модель стаи скворцов, которой пользователи могли управлять с помощью отслеживания движений рук. Он даже способен анализировать абстрактные литературные темы, например, переводить атмосферный тон романа Эмили Бронте «Грозовой перевал» в функциональный веб-дизайн.

Напротив, Gemini 3.1 Flash-Lite — это рабочая лошадка для выполнения больших объемов задач. Она справляется с миллионами ежедневных задач — переводом, разметкой и модерацией — которые требуют стабильных и воспроизводимых результатов без огромных вычислительных затрат, связанных с моделью, требующей сложных логических вычислений.

Как показали первые тестировщики, эта система мгновенно заполняет макет сотнями товаров или организует маршрутизацию намерений с точностью до 94 процентов.

В 8 раз дешевле флагманской модели Gemini 3.1 Pro (и дешевле, чем её предшественница, Flash-Lite 2.5)

Для руководителей предприятий, принимающих технические решения, наиболее убедительным преимуществом серии Gemini 3.1 является соотношение обоснованности и стоимости.

Компания Google установила цену на Gemini 3.1 Flash-Lite в размере 0,25 доллара за 1 миллион входных токенов и 1,50 доллара за 1 миллион выходных токенов.

Такая цена делает его значительно доступнее, чем конкуренты, такие как Claude 4.5 Haiku, цена которого составляет 1 доллар за 1 миллион входных и 5 долларов за 1 миллион выходных токенов.

Даже по сравнению с Gemini 2.5 Flash, стоимость которого составляет 0,30 доллара за 1 миллион входных данных, Flash-Lite предлагает снижение затрат наряду с повышением производительности.

В сравнении с Gemini 3.1 Pro, цена которого составляет 2 доллара за миллион входных токенов для запросов до 200 000, становится очевидным стратегическое преимущество подхода с использованием двух моделей. При использовании в условиях высокой контекстной нагрузки (более 200 000 токенов на взаимодействие) Flash-Lite фактически в 12-16 раз дешевле.

Мод эл

Вход

Выход

Общая стоимость

Источник

Qwen 3 Turbo

0,05 доллара

0,20 доллара

0,25 доллара

Alibaba Cloud

Qwen3.5-Flash

0,10 доллара

0,40 доллара

0,50 доллара

Alibaba Cloud

deepseek-chat (V3.2-Exp)

0,28 доллара

0,42 доллара

0,70 доллара

DeepSeek

deepseek-reasoner (V3.2-Exp)

0,28 доллара

0,42 доллара

0,70 доллара

DeepSeek

Grok 4.1 Быстро (рассуждение)

0,20 доллара

0,50 доллара

0,70 доллара

xAI

Grok 4.1 Быстрый (не логический)

0,20 доллара

0,50 доллара

0,70 доллара

xAI

Минимакс М2.5

0,15 доллара

1,20 доллара

1,35 доллара

МиниМакс

Фонарик Gemini 3.1

0,25 доллара

1,50 доллара

1,75 доллара

Google

MiniMax M2.5-Lightning

0,30 доллара

2,40 доллара

2,70 доллара

МиниМакс

Предварительный просмотр Gemini 3 Flash

0,50 доллара

3,00 доллара

3,50 доллара

Google

Kimi-k2.5

0,60 доллара

3,00 доллара

3,60 доллара

Лунный выстрел

ГЛМ-5

1,00 долл.

3,20 доллара

4,20 доллара

З.ай

Эрни 5.0

0,85 доллара

3,40 доллара

4,25 доллара

Байду

Клод Хайку 4.5

1,00 долл.

5,00 долларов

6,00 долларов

Антропический

Qwen3-Max (2026-01-23)

1,20 доллара

6,00 долларов

7,20 долларов

Alibaba Cloud

Gemini 3 Pro (≤200K)

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.2

1,75 доллара

14,00 долларов

15,75 долларов

OpenAI

Клод Сонет 4.5

3,00 доллара

15,00 долларов

18,00 долларов

Антропический

Gemini 3 Pro (>200K)

4,00 доллара

18,00 долларов

22,00 долларов

Google

Клод Опус 4.6

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

GPT-5.2 Pro

21,00 долл.

168,00 долларов США

189,00 долларов США

OpenAI

Используя каскадную архитектуру, предприятие может применять 3.1 Pro для первоначального сложного планирования, архитектурного проектирования и глубокой логики, а затем передать высокочастотное, повторяющееся выполнение Flash-Lite, что обойдется в одну восьмую часть стоимости.

Этот сдвиг фактически превращает ИИ из дорогостоящего экспериментального центра затрат в ресурс коммунального класса, который можно запускать для обработки каждого файла журнала, электронного письма и чата с клиентом, не исчерпывая при этом бюджет облачных сервисов.

Реакции сообщества и разработчиков

Первые отзывы от партнеров Google свидетельствуют о том, что серия 3.1 успешно заполняет важную нишу на рынке надежной автономной работы.

Эндрю Карр, главный научный сотрудник Cartwheel, протестировал обе модели и отметил их уникальные преимущества. Что касается версии 3.1 Pro, он особо выделил существенно улучшенное понимание 3D-преобразований, что устранило давние ошибки в порядке вращения в конвейерах анимации.

Однако он обнаружил, что Flash-Lite открывает для бизнеса совершенно иные возможности: «3.1 Flash-Lite — это удивительно компетентная модель. Она работает молниеносно, но при этом каким-то образом умудряется выполнять все инструкции… Соотношение интеллекта и скорости не имеет себе равных среди других моделей».

Для приложений, ориентированных на конечного пользователя, низкая задержка Flash-Lite стала ключом к расширению рынка.

Колби Ноттингем, руководитель отдела искусственного интеллекта в Latitude, сообщил, что новая модель показала на 20 процентов более высокий процент успеха и на 60 процентов более быстрое время вывода по сравнению с предыдущей моделью, что позволяет создавать сложные истории для гораздо более широкой аудитории, чем это было бы возможно в противном случае.

Надежность разметки данных также стала одной из важнейших особенностей. Бьянка Рангекрофт, генеральный директор Whering, сообщила, что благодаря интеграции Flash-Lite 3.1 в их конвейер классификации, они достигли 100-процентной согласованности в разметке элементов, что обеспечило высоконадежную основу для присвоения меток и повысило уверенность в структурированных результатах.

Каан Ортабас, соучредитель HubX, отметил, что Flash-Lite, как корневой механизм оркестровки, обеспечивает завершение запросов менее чем за 10 секунд, практически мгновенную потоковую передачу и соответствие структурированным выходным данным на 97 процентов.

Что касается флагманской модели, Владислав Танков, директор по искусственному интеллекту в JetBrains, отметил 15-процентное улучшение качества модели Pro, подчеркнув, что она стала сильнее, быстрее и эффективнее, требуя меньшего количества выходных токенов для достижения своих целей.

Лицензирование и доступность для предприятий

И Gemini 3.1 Flash-Lite, и Pro предлагаются через Google AI Studio и Vertex AI. Будучи проприетарными моделями, они используют стандартную коммерческую модель «программное обеспечение как услуга», а не лицензию с открытым исходным кодом.

Использование Vertex AI обеспечивает обоснованное логическое мышление в защищенном периметре, гарантируя, что большие объемы данных — такие как те, которые обрабатывает Databricks для достижения лучших в своем классе результатов в бенчмарке OfficeQA — остаются защищенными гарантиями безопасности корпоративного уровня и соблюдения сроков хранения данных.

Однако они также ограничены в плане возможностей настройки и требуют постоянного подключения к интернету, в отличие от чисто открытых аналогов, таких как мощная новая серия Qwen3.5, выпущенная Alibaba за последние несколько недель.

Текущий статус предварительного тестирования Flash-Lite позволяет Google улучшить безопасность и производительность на основе реальных отзывов разработчиков перед его выпуском в общий доступ.

Для разработчиков, уже использующих API Gemini, переход на версию 3.1 Pro и Flash-Lite представляет собой прямое повышение производительности по той же или более низкой цене, что фактически снижает порог входа для сложных агентских рабочих процессов.

Вердикт: новый стандарт для ИИ в сфере коммунальных услуг.

Выпуск Gemini 3.1 Flash-Lite представляет собой завершающий этап стратегического поворота Google. В то время как индустрия была одержима передовыми методами решения самых сложных проблем, подавляющее большинство корпоративной работы состоит из большого объема повторяющихся, но высокоточных задач.

Предоставляя Gemini 3.1 Pro как «мозг», так и «рефлексы» в Gemini 3.1 Flash-Lite, Google сигнализирует о том, что следующий этап гонки за искусственный интеллект выиграют модели, способные не только анализировать проблему, но и реализовывать это решение в масштабах.

Для технического директора или руководителя технической группы, решающего, какую модель включить в план развития продукта на 2026 год, серия Gemini 3.1 предлагает убедительный аргумент: вам больше не нужно платить налог на логическое мышление, чтобы получить надежные и мгновенные результаты. Сегодня, когда Flash-Lite выходит в режиме предварительного просмотра, сообщение для сообщества разработчиков ясно: барьер для масштабируемого интеллекта не просто снижен — он полностью устранен.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Flash Lite, Gemini, Google, Версия Pro, новости, Цена

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фасад здания с логотипом Merck, стеклянные окна, голубое небо.
ideipro logotyp
Смартфон с разноцветными иконками приложений на экране, лежащий на ноутбуке.
Маску не удалось заблокировать закон Калифорнии о раскрытии данных, который, как он опасается, погубит xAI.
Код JavaScript и комментарии об аутентификации и безопасности сессии.
ideipro logotyp
Три портативных SSD в черных корпусах с красными акцентами.
Изображение человека в наушниках в футуристической обстановке.
Люди в музее динозавров, крупный план мешка с деньгами в стеклянной витрине.
Image Not Found
Фасад здания с логотипом Merck, стеклянные окна, голубое небо.

Влияние пациентов клиники Майо на обучение ИИ Merck: как технологии могут изменить здравоохранение

Вы читаете веб-версию информационного бюллетеня STAT об искусственном интеллекте в прогнозировании. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Adobe/STAT Вы читаете веб-версию информационного бюллетеня STAT о технологиях в здравоохранении —…

Мар 10, 2026
ideipro logotyp

Разграничение климатических опасностей и демографических изменений в прогнозах взаимосвязи климата и здоровья

Доступ через ваше учебное заведение. Купить или оформить подписку. Прогнозы будущих последствий изменения климата предупреждают о быстро растущей нагрузке на общественное здравоохранение в предстоящем столетии1,2,3. Однако многие из этих оценок объединяют три ожидаемых, но различных фактора, определяющих…

Мар 10, 2026
Смартфон с разноцветными иконками приложений на экране, лежащий на ноутбуке.

Федеральные власти обратили внимание на уязвимости iOS, используемые при загадочных обстоятельствах.

Долгий и странный путь, пройденный с помощью большого количества сложных эксплойтов для iOS. Источник: Getty Images Источник: Getty Images Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для…

Мар 10, 2026
Маску не удалось заблокировать закон Калифорнии о раскрытии данных, который, как он опасается, погубит xAI.

Маску не удалось заблокировать закон Калифорнии о раскрытии данных, который, как он опасается, погубит xAI.

Маск не может убедить судью в том, что общественности безразлично, откуда берутся данные для обучения ИИ. Источник: Icon Sportswire / Участник | Icon Sportswire Источник: Icon Sportswire / Участник | Icon Sportswire Настройки текста Текст рассказа Размер…

Мар 10, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых