Google научила ИИ работать прямо в браузере
Google показала Gemini 2.5 Computer Use: агента, который управляет интерфейсами сайтов и приложений. Он получает скриншот, анализирует задачу, вводит текст, кликает по кнопкам и повторяет цикл, пока цель не достигнута. Новый инструмент уже доступен разработчикам через Gemini API и Vertex AI, а все желающие могут протестировать его на Browserbase
ИИ способен заполнять формы, авторизоваться на сайтах и переносить данные между сервисами. Google подчёркивает, что агент работает с реальными страницами, включая те, что требуют входа в аккаунт. Пока функция в публичном превью. Каждое действие проверяется, а опасные сценарии вроде обхода капчи блокируются























