• Главная
  • Архив рубрики ~Лента новостей~
  • Google запустила своего самого продвинутого на сегодняшний день агента для исследований в области искусственного интеллекта — в тот же день, когда OpenAI выпустила GPT-5.2.
Мужчина в очках говорит на сцене, улыбаясь и жестом указывая в сторону.

Google запустила своего самого продвинутого на сегодняшний день агента для исследований в области искусственного интеллекта — в тот же день, когда OpenAI выпустила GPT-5.2.

Генеральный директор Google Сундар Пичаи
Источник изображения: Джастин Салливан / Getty Images

В четверг компания Google выпустила «переосмысленную» версию своего исследовательского агента Gemini Deep Research, основанную на широко разрекламированной передовой базовой модели Gemini 3 Pro.

Этот новый агент предназначен не только для создания исследовательских отчетов — хотя он по-прежнему может это делать. Теперь он позволяет разработчикам встраивать возможности исследования на основе модели SATA от Google в свои собственные приложения. Эта возможность стала доступна благодаря новому API взаимодействий Google, который призван предоставить разработчикам больше контроля в грядущую эру агентного ИИ.

Новый инструмент Gemini Deep Research — это агент, способный синтезировать огромные массивы информации и обрабатывать большой объем контекстной информации в подсказке. Google заявляет, что клиенты используют его для задач, начиная от комплексной проверки и заканчивая исследованиями токсичности и безопасности лекарственных препаратов.

Google также заявляет, что вскоре интегрирует этого нового агента глубокого анализа в свои сервисы, включая Google Поиск, Google Финансы, приложение Gemini и популярный NotebookLM. Это еще один шаг к подготовке к миру, где люди больше не будут ничего искать в Google — это будут делать их агенты искусственного интеллекта.

Технологический гигант утверждает, что Deep Research выигрывает от статуса Gemini 3 Pro как своей «наиболее достоверной» модели, обученной минимизировать галлюцинации во время выполнения сложных задач.

Галлюцинации ИИ — когда логическая модель просто выдумывает что-то — являются особенно важной проблемой для длительных задач, требующих глубокого логического мышления, в которых множество автономных решений принимается в течение минут, часов или более длительного времени. Чем больше вариантов выбора приходится делать логической модели, тем выше вероятность того, что даже один галлюцинаторный выбор сделает недействительным весь результат.

Чтобы подтвердить свои заявления о прогрессе, Google также создала еще один бенчмарк (как будто миру ИИ нужен еще один). Новый бенчмарк получил незамысловатое название DeepSearchQA и предназначен для проверки работы агентов в сложных, многоэтапных задачах поиска информации. Google открыла исходный код этого бенчмарка.

Также были протестированы Deep Research on Humanity's Last Exam, гораздо более интересно названный независимый тест на общие знания, наполненный невероятно узкоспециализированными задачами; и BrowserComp, тест для задач, выполняемых агентами в браузере.

Как и следовало ожидать, новый агент Google превзошел конкурентов как в собственном бенчмарке, так и в бенчмарке Humanity. Однако ChatGPT 5 Pro от OpenAI неожиданно занял второе место по всем показателям и немного превзошел Google в BrowserComp.

Но эти сравнительные тесты устарели практически сразу после того, как Google их опубликовал. Потому что в тот же день OpenAI выпустила свою долгожданную GPT 5.2 — под кодовым названием Garlic. OpenAI утверждает, что ее новейшая модель превосходит конкурентов — особенно Google — по целому ряду типичных тестов, включая собственный тест OpenAI.

Пожалуй, одним из самых интересных моментов этого объявления стало время его публикации. Зная, что мир ждет выхода Garlic, Google сам поделился новостями об искусственном интеллекте.

Источник: techcrunch.com

✅ Найденные теги: Google, GPT-5.2, OpenAI, Агент, искусственный интеллект, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Мультяшный мальчик в красной рубашке и голубой шапке, сидит среди других детей.
Молот перед логотипом технологической компании с цветными квадратами.
Четыре символа: золото, стилизованная эмблема, каменное кольцо и змей, кусающий свой хвост.
Человек играет на скрипке на улице перед кирпичной стеной.
Протест против дата-центров, плакаты: "Вы не можете пить данные", "Вода — это жизнь".
dummy-img
Силуэт лица с диаграммой связи на голове, символизирующий думы и идеи.
ideipro logotyp
Руки режут свежий хлеб на деревянной доске.
Image Not Found
Мультяшный мальчик в красной рубашке и голубой шапке, сидит среди других детей.

Ожирение назвали главным фактором риска развития диабета у американских подростков. Повлияли также мужской пол и более молодой возраст

Повлияли также мужской пол и более молодой возраст Когортный анализ данных почти двух тысяч американских подростков в возрасте от 10 до 19 лет показал, что наиболее значимым предиктором преддиабета или сахарного диабета второго типа выступает центральное ожирение, оцениваемое по отношению обхвата талии к росту.…

Мар 5, 2026
Молот перед логотипом технологической компании с цветными квадратами.

Microsoft заблокировала слово «Микрослоп» на своём Discord-сервере и ввела ограничения

Изображение, созданное нейросетью Похоже, Microsoft не очень нравится, когда её инвестиции в искусственный интеллект и активное использование нейросетей называют «слопом» — это стало понятно из-за одного запрета, введённого в официальном Discord-сервере сервиса Copilot. Участники указанного сервера обратили…

Мар 5, 2026
Четыре символа: золото, стилизованная эмблема, каменное кольцо и змей, кусающий свой хвост.

Есть здесь люди, которые искренне считают, что установив макс, они увеличили суверенитет страны?

«В виртуальных дискуссиях уже давно затрагивают тему мессенджера MAX, представляя его как просто еще одну платформу для коммуникации. Однако, как нам кажется, мало кто уделил должное внимание его корням, уровню безопасности и непонятным причинам, по которым он…

Мар 5, 2026
dummy-img

Спрос на хранилища для ИИ привёл к 24% росту прибыли производителей памяти NAND

Умные люди из аналитического агентства TrendForce провели анализ текущей ситуации производителей микросхем памяти NAND и пришли к выводу, что за последний квартал 2025 года их выручка прилично увеличилась, а показатели некоторых компаний прилично выделяются на фоне остальных.…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых