Image

ИИ Google теперь может сам ходить по сайтам, нажимать кнопки и заполнять формы

16fda3e5383ba917b89a0800cfb46921

Google представила новую версию своего искусственного интеллекта Gemini 2.5 Pro с функцией Computer Use, позволяющую системе самостоятельно просматривать сайты, нажимать кнопки, прокручивать страницы и заполнять формы. Разработанная подразделением DeepMind, эта функция превращает ИИ-модель в универсального цифрового агента, способного выполнять действия в браузере практически так же, как человек.

По сути, Gemini 2.5 Computer Use — это шаг от чат-бота к «исполнителю». Если ранние версии ИИ могли только отвечать на вопросы или генерировать тексты, то теперь он может действовать в реальном интерфейсе: искать билеты, авторизовываться на сайтах, оформлять покупки или тестировать пользовательские формы. «Это только начало, но способность модели взаимодействовать с вебом — например, прокручивать, заполнять формы и перемещаться по меню, — станет важным шагом в создании универсальных ИИ-агентов», — заявил глава Google Сундар Пичаи.

Для реализации этой функции Google сотрудничает со стартапом Browserbase, созданным бывшим инженером Twilio Полом Кляйном. Browserbase предлагает браузер как виртуальную среду без графического интерфейса, в которой ИИ может работать с веб-страницами напрямую через API. Такой подход делает возможным обучение и тестирование моделей в контролируемых условиях, без реального вмешательства пользователя.

Пользователи могут попробовать Gemini 2.5 Computer Use прямо на Browserbase, где создана «Browser Arena» — площадка для сравнения моделей Google, OpenAI и Anthropic.

Меры безопасности

Так как модель имеет прямой доступ к веб-интерфейсам, Google ввела многоуровневую систему контроля. Каждый шаг агента проверяется службой безопасности, а разработчики могут задавать собственные правила — например, блокировать покупки или требовать ручного подтверждения при работе с личными данными.

Gemini не может выполнять действия, нарушающие политику Google, а при обнаружении CAPTCHA требует подтверждения пользователя, предотвращая полностью автономное поведение без контроля человека.

Для сложных операций, вроде оплаты или ввода персональных данных, система может запросить подтверждение пользователя, чтобы избежать ошибок или нарушений политики безопасности.

Модель принимает изображения и текст, возвращая либо текстовый ответ, либо вызов функции — фактически, готовый «код действия» для браузера.

Цена и лицензирование

Стоимость использования почти идентична базовой модели Gemini 2.5 Pro:

  • Входные токены — от $1,25 за миллион (до 200 000 токенов),
  • Выходные — от $10 за миллион.
  • Однако ключевое отличие — отсутствие бесплатного уровня. В то время как Gemini 2.5 Pro можно тестировать бесплатно в Google AI Studio, версия Computer Use с самого начала тарифицируется. При этом, как уточняет компания, данные платных пользователей не используются для дообучения моделей — это может стать важным аргументом для корпоративных клиентов.

    От чат-ботов к цифровым агентам

    С появлением Computer Use Google вступила в новую фазу конкуренции с OpenAI и Anthropic. Если ChatGPT Agent и Claude Sonnet уже умеют создавать файлы и работать с локальными данными, то Gemini делает ставку на визуальное взаимодействие с реальными интерфейсами — от браузеров до мобильных приложений.

    Фактически речь идёт о начале эры ИИ-исполнителей — автономных систем, которые смогут не только анализировать запросы, но и реализовывать их действиями в цифровой среде. «Мы движемся к тому, чтобы компьютеры не просто отвечали на вопросы, а делали работу», — говорит один из инженеров DeepMind, участвовавший в тестировании модели.

    Эксперты отмечают, что такие агенты станут ключевыми инструментами будущей офисной и потребительской автоматизации. Они смогут самостоятельно бронировать билеты, подавать заявки, проходить регистрации на сайтах, управлять аккаунтами и даже вести переговоры в онлайне в рамках поставленных целей и заданных полномочий.

    Источник: hightech.plus

    Источник: ai-news.ru

    ✅ Найденные теги: ИИ, новости

    ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

    галерея

    Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
    Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
    Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
    Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
    ‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
    Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
    Структура эффективного запроса Claude с элементами задачи, контекста и референса.
    Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
    ideipro logotyp
    Image Not Found
    Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

    Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

    Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

    Мар 2, 2026
    Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

    Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

    Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

    Мар 2, 2026
    Черный углеродное волокно с текстурой плетения, отражающий свет.

    Материал будущего: как работает «бессмертный» композит

    Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

    Мар 2, 2026
    Круглый экран с изображением замка и горы, рядом электронная плата.

    Круглый дисплей Waveshare для креативных проектов

    Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

    Мар 2, 2026

    Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых