Google выпустила в четверг Gemini 3.1 Pro — первое инкрементальное обновление версии .1 в линейке Gemini, которое обеспечивает значительный скачок в производительности рассуждений и, по словам компании, более чем удваивает возможности предшественника в ключевых бенчмарках.
Новая модель достигла подтверждённого результата 77,1% в тесте ARC-AGI-2, бенчмарке, оценивающем способность модели решать новые логические паттерны, по сравнению с 31,1% у Gemini 3 Pro. Независимое тестирование от Artificial Analysis показало, что Gemini 3.1 Pro теперь лидирует в шести из десяти тестов в их индексе интеллекта, включая Terminal-Bench Hard для агентного программирования, Humanity’s Last Exam для рассуждений и GPQA-Diamond для научных рассуждений.
Этот релиз позволяет Google восстановить позиции в гонке ИИ против OpenAI и Anthropic. Согласно Artificial Analysis, запуск комплексных бенчмарк-тестов на Gemini 3.1 Pro стоит более чем в два раза дешевле, чем на конкурирующих передовых моделях этих соперников, при этом цены остались на уровне предшественника — $2 за миллион входных токенов и $12 за миллион выходных токенов.
«3.1 Pro — это более умная и производительная базовая модель для решения сложных задач», — заявила Google в своем объявлении. Модель интегрирует ключевые улучшения логических способностей из Gemini 3 Deep Think, которую Google обновила на прошлой неделе, в более доступный пакет для разработчиков и пользователей.
Генеральный директор Google Сундар Пичаи и генеральный директор DeepMind Демис Хассабис оба поделились результатами Artificial Analysis в социальных сетях.
Gemini 3.1 Pro запускается в режиме предварительного просмотра в экосистеме Google начиная с четверга. Разработчики могут получить доступ к модели через Gemini API в Google AI Studio, Gemini CLI, платформу для разработки агентов Google Antigravity и Android Studio. Корпоративные клиенты получают доступ через Vertex AI и Gemini Enterprise.
Пользователи с подписками Google AI Pro и Ultra могут использовать модель через приложение Gemini с более высокими лимитами использования, при этом доступ к NotebookLM предоставляется исключительно подписчикам Pro и Ultra.
Google выделила практические применения, включая «синтез сложных систем», где модель может связывать сложные API с удобным пользовательским интерфейсом. Одна из демонстраций включала создание интерактивной панели для аэрокосмической отрасли, визуализирующей орбиту Международной космической станции. Модель также превосходно справляется с созданием анимированной SVG-графики на основе текстовых запросов, генерируя визуализации на основе кода, а не растровые изображения.
Компания отметила, что этот предварительный релиз поможет проверить обновления перед более широким распространением, при этом планируются дальнейшие улучшения для агентных рабочих процессов.
























