Google представила новую функцию Agentic Vision для модели Gemini 3 Flash, которая превращает анализ изображений из статического восприятия в активный исследовательский процесс. Используя цикл «думай, действуй, наблюдай», модель теперь может самостоятельно писать и выполнять код на Python для манипуляций с картинкой — например, приближать мелкие детали, поворачивать изображение или наносить разметку для подсчета объектов, что повышает точность ответов на 5–10%. Эта возможность, позволяющая модели динамически взаимодействовать с визуальными данными, уже доступна разработчикам через API в Google AI Studio и Vertex AI, а также начинает внедряться в приложении Gemini👌
http://blog.google/innovation-and-ai/technology/developers-tools/agentic-vision-gemini-3-flash/





















