
В четверг компания Google выпустила «переосмысленную» версию своего исследовательского агента Gemini Deep Research, основанную на широко разрекламированной передовой базовой модели Gemini 3 Pro.
Этот новый агент предназначен не только для создания исследовательских отчетов — хотя он по-прежнему может это делать. Теперь он позволяет разработчикам встраивать возможности исследования на основе модели SATA от Google в свои собственные приложения. Эта возможность стала доступна благодаря новому API взаимодействий Google, который призван предоставить разработчикам больше контроля в грядущую эру агентного ИИ.
Новый инструмент Gemini Deep Research — это агент, способный синтезировать огромные массивы информации и обрабатывать большой объем контекстной информации в подсказке. Google заявляет, что клиенты используют его для задач, начиная от комплексной проверки и заканчивая исследованиями токсичности и безопасности лекарственных препаратов.
Google также заявляет, что вскоре интегрирует этого нового агента глубокого анализа в свои сервисы, включая Google Поиск, Google Финансы, приложение Gemini и популярный NotebookLM. Это еще один шаг к подготовке к миру, где люди больше не будут ничего искать в Google — это будут делать их агенты искусственного интеллекта.
Технологический гигант утверждает, что Deep Research выигрывает от статуса Gemini 3 Pro как своей «наиболее достоверной» модели, обученной минимизировать галлюцинации во время выполнения сложных задач.
Галлюцинации ИИ — когда логическая модель просто выдумывает что-то — являются особенно важной проблемой для длительных задач, требующих глубокого логического мышления, в которых множество автономных решений принимается в течение минут, часов или более длительного времени. Чем больше вариантов выбора приходится делать логической модели, тем выше вероятность того, что даже один галлюцинаторный выбор сделает недействительным весь результат.
Чтобы подтвердить свои заявления о прогрессе, Google также создала еще один бенчмарк (как будто миру ИИ нужен еще один). Новый бенчмарк получил незамысловатое название DeepSearchQA и предназначен для проверки работы агентов в сложных, многоэтапных задачах поиска информации. Google открыла исходный код этого бенчмарка.
Также были протестированы Deep Research on Humanity's Last Exam, гораздо более интересно названный независимый тест на общие знания, наполненный невероятно узкоспециализированными задачами; и BrowserComp, тест для задач, выполняемых агентами в браузере.
Как и следовало ожидать, новый агент Google превзошел конкурентов как в собственном бенчмарке, так и в бенчмарке Humanity. Однако ChatGPT 5 Pro от OpenAI неожиданно занял второе место по всем показателям и немного превзошел Google в BrowserComp.
Но эти сравнительные тесты устарели практически сразу после того, как Google их опубликовал. Потому что в тот же день OpenAI выпустила свою долгожданную GPT 5.2 — под кодовым названием Garlic. OpenAI утверждает, что ее новейшая модель превосходит конкурентов — особенно Google — по целому ряду типичных тестов, включая собственный тест OpenAI.
Пожалуй, одним из самых интересных моментов этого объявления стало время его публикации. Зная, что мир ждет выхода Garlic, Google сам поделился новостями об искусственном интеллекте.
Источник: techcrunch.com


























