Схема Earth AI: геопространственные данные, инструменты и модели для анализа окружающей среды.

Google Earth AI: раскрытие геопространственных возможностей с помощью базовых моделей и межмодального анализа.

61fbff29f71386c61ce9d06f36de7eb7

Google Earth AI — это наше семейство геопространственных моделей искусственного интеллекта и агентов рассуждений, предоставляющих пользователям полезную информацию, основанную на понимании реального мира. Сегодня мы делимся нашими последними инновациями в области Earth AI и расширяем доступ к этим новым возможностям в Google Earth и Google Cloud.

Быстрые ссылки

На протяжении многих лет Google разрабатывает модели искусственного интеллекта, которые расширяют наше понимание планеты. Эти модели помогают поддерживать актуальность продуктов Google, например, обеспечивая точность Картов за счет анализа спутниковых снимков и предоставляя пользователям Поиска самые свежие оповещения о погоде и стихийных бедствиях.

По мере того как отдельные модели становятся все более мощными, мы понимаем, что многие реальные вопросы требуют объединения знаний из разных областей. Ответы на сложные вопросы, такие как: «Где, скорее всего, обрушится ураган? Какие сообщества наиболее уязвимы и как им следует подготовиться?», требуют анализа изображений, численности населения и окружающей среды.

В начале этого года мы представили Google Earth AI для решения этой ключевой задачи. Сочетая наше семейство мощных базовых моделей с геопространственным агентом, использующим наши новейшие модели Gemini, становится возможным выполнять сложные, реальные рассуждения в планетарном масштабе. Модели обеспечивают детальное понимание нашей планеты, основанное на реальных данных. Агент, в свою очередь, выступает в роли интеллектуального координатора. Он деконструирует сложный вопрос в многоэтапный план; выполняет план, обращаясь к этим базовым моделям, запрашивая обширные хранилища данных и используя геопространственные инструменты; и, наконец, объединяет результаты каждого этапа в целостный ответ.

Сегодня мы представляем новые инновации в области искусственного интеллекта для Земли:

  1. Новые модели обработки изображений и анализа населения, а также технические характеристики и оценки, демонстрирующие самые современные показатели.
  2. Демонстрация работы нашего агента, использующего геопространственные модели для решения сложных многоэтапных геопространственных запросов.

Чтобы узнать больше, приглашаем вас ознакомиться с нашей полной технической статьей «Google Earth AI: раскрытие геопространственных возможностей с помощью базовых моделей и кросс-модального анализа». Вы также можете принять участие в расширении доступа к этим новым возможностям для разработчиков и предприятий, выразив заинтересованность.

Блок-схема Earth AI

Earth AI объединяет передовые модели с агентами, способными к пространственному мышлению, для решения важнейших глобальных задач.

Основные элементы искусственного интеллекта Земли: современные базовые модели.

Образность

Наши новые модели Remote Sensing Foundations упрощают и ускоряют анализ спутниковых снимков, используя три основные возможности: модели визуально-языкового анализа, обнаружение объектов с открытым словарем и адаптируемые графические архитектуры. Пользователи могут задавать запросы на естественном языке, например, «найти все затопленные дороги» на изображении, полученном после шторма, и получать быстрые и точные ответы. Наши модели обучаются на большом корпусе аэрофотоснимков высокого разрешения в сочетании с текстовыми описаниями. Они демонстрируют самые современные результаты на нескольких общедоступных эталонных наборах данных дистанционного зондирования Земли. Например, мы достигаем среднего улучшения более чем на 16% в задачах поиска по тексту на изображениях, а наша модель с нулевым количеством примеров для обнаружения новых объектов более чем вдвое повышает точность по сравнению с базовой моделью.

EarthAI-2-RemoteSensingEvalFinal

Оценка модели показывает значительное улучшение средней точности (AP50) нашей оптимизированной для дистанционного зондирования модели RS-OWL-ViT-v2 («Наша») по сравнению с моделью обнаружения открытого словаря OWL-ViT-v2 в условиях нулевого обучения и демонстрирует преимущество комбинированного подхода FLAME + RS-OWL-ViT-v2 («Наша») по сравнению с SIoU для обнаружения новых классов в условиях малого количества примеров.

Население

Эта область исследований, включающая ИИ в сфере мобильности и основы динамики населения, направлена на понимание сложного взаимодействия между людьми и местами. Наши последние исследования в области основ динамики населения представляют две ключевые инновации: глобально согласованные эмбеддинги для 17 стран и ежемесячно обновляемые эмбеддинги, отражающие меняющуюся динамику человеческой деятельности, что имеет решающее значение для прогнозирования с учетом временных факторов. Основы динамики населения продемонстрировали замечательную эффективность в независимых исследованиях; например, исследователи из Оксфордского университета обнаружили, что включение этих эмбеддингов в модель прогнозирования лихорадки Денге в Бразилии улучшило долгосрочный коэффициент детерминации R² (показатель, измеряющий, насколько хорошо модель объясняет фактические показатели заболеваемости) с 0,456 до 0,656 для 12-месячных прогнозов.

График динамики популяции ИИ на Земле

Оценка эффективности наших методов анализа динамики населения в 17 странах; показатель R2 (диапазон 0–1, чем выше, тем лучше) по странам для прогнозирования плотности населения, лесного покрова, ночного освещения и высоты над уровнем моря. Глобальная тенденция соответствует высоким результатам, которые мы первоначально продемонстрировали только в США.

воспроизведение видео без звука зацикливание пауза видео без звука зацикливание включение звука видео выключение звука

Сходство по измерениям эмбеддингов Population Dynamics Foundations, визуализированное по почтовым индексам США. Закономерности по измерениям отражают разнообразные характеристики населения США.

Среда

Наши ранее опубликованные исследования демонстрируют передовые прогнозы погоды на среднесрочную перспективу, начала муссонов, качества воздуха и речных наводнений. Недавно мы расширили эти модели окружающей среды, чтобы создавать прогнозы осадков на всю планету, и теперь мы охватываем 2 миллиарда человек прогнозами наиболее значительных речных наводнений.

Повышение прогностической способности за счет объединения моделей.

Хотя каждая из базовых моделей предоставляет ценные аналитические данные, наши результаты подтверждают, что объединение моделей обеспечивает еще большую прогностическую мощность. Такой синергетический подход позволяет получить более полное и точное понимание явлений реального мира и значительно улучшить прогнозы в критически важных областях применения.

Например, Национальный индекс риска FEMA показывает, какие сообщества наиболее подвержены риску стихийных бедствий, таких как наводнения и штормы, на основе различных факторов, включая экономическую и социальную уязвимость, а также физические и экологические риски. Объединив данные, отражающие социально-экономические характеристики из наших баз данных Population Dynamics Foundations, и характеристики ландшафта из баз данных AlphaEarth Foundations, мы улучшили прогнозирование Национального индекса риска FEMA в среднем на 11% по показателю R² для 20 различных видов опасностей по сравнению с использованием любого из источников данных по отдельности, при этом наиболее значительные улучшения были отмечены в прогнозировании риска торнадо (+25% R²) и речных наводнений (+17% R²).

Решение сложных задач с помощью геопространственного анализа

Приведенный выше пример иллюстрирует, что решение реальных задач требует использования данных из множества моделей с различными возможностями. Управление этими данными, полученными с помощью Earth AI, упрощается благодаря нашему новому агенту геопространственного анализа на базе Gemini. Агент деконструирует сложные запросы на естественном языке и планирует динамический многоэтапный путь к ответу. Для выполнения каждого шага агент может обращаться к «экспертным» субагентам, оснащенным описанными выше моделями Earth AI, а также к обширным данным из реального мира, хранящимся в Data Commons, Earth Engine и специализированных геопространственных инструментах. Эта модульная сеть агентов обеспечивает расширяемость и возможность индивидуальной настройки.

Чтобы понять, как это работает, рассмотрим пользователя, который хочет определить конкретные группы населения, уязвимые к риску приближающегося шторма. Агент выполняет прозрачную последовательность логических шагов:

  1. Используйте модель оценки воздействия на окружающую среду, чтобы определить конкретные географические районы, которые, согласно прогнозам, подвержены риску ураганных ветров.
  2. Для получения демографических данных и выявления округов с наибольшей численностью населения в районе прогнозируемого выхода урагана на сушу воспользуйтесь сервисом Query Data Commons.
  3. Получите официальные границы интересующих вас округов из общедоступных наборов данных BigQuery.
  4. Выполните пространственное пересечение между зонами действия ветра и официальными границами округов.
  5. Выявите наиболее уязвимые почтовые индексы, обучив модель в режиме реального времени, используя наши основы динамики населения и статистику на уровне округов.
  6. Используйте модель обнаружения объектов от Remote Sensing Foundations для идентификации объектов критической инфраструктуры на спутниковых снимках, полученных над одним из наиболее уязвимых почтовых районов.

воспроизведение видео без звука зацикливание пауза видео без звука зацикливание включение звука видео выключение звука

Чтобы помочь пользователю понять уязвимость перед приближающимся штормом, наш агент геопространственного анализа на базе Gemini использует нашу модель окружающей среды для определения вероятной траектории ураганных ветров, сопоставляет эти данные с границами стран и плотностью населения из Big Query и Data Commons, а затем, опираясь на все эти данные, определяет наиболее критически важные места. Он также обучает модель в режиме реального времени для генерации данных об уязвимости с более высоким разрешением, используя основы динамики населения, и идентифицирует критическую инфраструктуру на спутниковых снимках, используя основы дистанционного зондирования.

Для оценки эффективности агента мы разработали два новых метода: сравнительный тест в формате вопросов и ответов для сбора и анализа фактов с проверяемыми ответами, основанными на общедоступных данных, и тематические исследования по реагированию на кризисные ситуации для сложных, прогнозируемых сценариев (например, решение всей описанной выше задачи).

В тесте вопросов и ответов наш агент геопространственного анализа показал общую точность 0,82, значительно превзойдя базовые агенты Gemini 2.5 Pro (0,50) и Gemini 2.5 Flash (0,39) (оценки получены на основе ROUGE-L F1 и процентной ошибки, чем выше значение, тем лучше). Это подчеркивает важность предоставления агентам доступа к специализированным геопространственным моделям и инструментам для подобных запросов.

Производительность Earth AI в тестировании качества

Визуализация производительности агентов в тесте вопросов и ответов. Агент Geospatial Reasoning превзошел базовый агент Gemini 2.5 Pro на 37% в категории «Описательное и поисковое мышление» и на 124% в более сложной категории «Аналитическое и реляционное мышление», показав в целом на 64% более высокий результат (оценки получены на основе ROUGE-L F1 и процентной ошибки).

В более сложных сценариях реагирования на кризисные ситуации наша статья демонстрирует преимущества координации разнообразных данных из области экологии, дистанционного зондирования и динамики населения на основе тематических исследований. Используя специализированных субагентов для геопространственного и демографического анализа, мы можем решать задачи анализа в реальных условиях.

Вместе мы раскрываем потенциал нашей планеты.

Искусственный интеллект для изучения Земли представляет собой фундаментальный прорыв в понимании планеты. Наши результаты показывают, что многомодальный, основанный на рассуждениях подход, построенный на фундаменте современных геопространственных моделей ИИ, может раскрыть идеи, недоступные при использовании только изолированного анализа.

Мы только начинаем исследовать весь потенциал искусственного интеллекта Земли и стремимся расширить доступ к нему, чтобы помочь мировому сообществу решить самые насущные проблемы планеты. Например:

  • Bellwether, амбициозный проект Google X, использует наши прогнозы погоды, данные Population Dynamics Foundations, анализ спутниковых снимков и базы данных недвижимости для прогнозирования повреждений зданий до начала шторма. Это помогает их страховым клиентам быстрее выплачивать компенсации, чтобы домовладельцы могли раньше начать восстановление, экономя им время, деньги и нервы.
  • В рамках проекта United Nations Global Pulse используются модели изображений Земли, полученные с помощью искусственного интеллекта, для оценки ущерба после стихийных бедствий, что позволяет правительствам и международным организациям оперативно реагировать на кризисы.
  • GiveDirectly использует геопространственные методы анализа в своих прогнозах наводнений для выявления населенных пунктов, подверженных риску, и направления денежной помощи домохозяйствам, чтобы помочь им подготовиться к стихийным бедствиям и смягчить их последствия.

Помимо поддержки UN Global Pulse, GiveDirectly и других организаций, использующих Earth AI, Google.org предоставляет средства таким партнерам, как Khushi Baby, Cooper/Smith, Direct Relief и Froncort.ai, которые используют Population Dynamics Foundations для моделирования инфекционных заболеваний и улучшения мер в области общественного здравоохранения во всем мире. Среди новых корпоративных пользователей Earth AI — Public Storage, CARTO и Visiona Space Technology (подразделение Embraer).

Мы хотим узнать, как Earth AI может быть вам полезен. Мы призываем организации выразить заинтересованность в получении раннего доступа к основам дистанционного зондирования (доступны в виде моделей изображений в Vertex AI), основам динамики популяций и геопространственному анализу.

    Источник: research.google

    ✅ Найденные теги: AI, Earth, Google, Геопространственные, Модели, новости

    ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

    Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

    галерея

    Умные часы с прозрачным корпусом на руке человека, экран с красным интерфейсом.
    Чертеж инженерной системы с деталями и таблицей ревизий.
    Чертеж электрического соединителя с таблицей ревизий и блоком заголовка. Элементы уточняются.
    Технология автономного кодирования увеличила выручку Mercyhealth на 5,1%.
    Повышение температуры океана приводит к «сдвигу режима» морского льда в Антарктиде.
    Прорыв в области искусственного интеллекта позволяет сократить потребление энергии в 100 раз, одновременно повышая точность.
    ideipro logotyp
    Логотип FDA на текстурированной бумаге, черно-белый дизайн с объемными буквами.
    Диаграмма процесса клинических испытаний с этапами, сбора данных и результатами.
    Image Not Found
    Умные часы с прозрачным корпусом на руке человека, экран с красным интерфейсом.

    От космоса к коду: «умные» часы по мотивам миссии Artemis II

    На фоне возросшего интереса к космическим миссиям, особенно после запуска Artemis II mission, компания CircuitMess представила смарт-часы Artemis Watch 2.0 — устройство, вдохновлённое возвращением человека на Луну.  Внутри находится двухъядерный микроконтроллер ESP32, цветной дисплей, а также набор…

    Апр 12, 2026
    Чертеж электрического соединителя с таблицей ревизий и блоком заголовка. Элементы уточняются.

    От 4 недель до 45 минут: разработка системы извлечения данных из более чем 4700 PDF-файлов.

    Как гибридный конвейер обработки изображений PyMuPDF + GPT-4 Vision позволил сократить трудозатраты на ручную разработку на 8000 фунтов стерлингов, и почему новейшие модели оказались неподходящим решением. Делиться Изображение создано автором. В мой кабинет зашёл человек и спросил,…

    Апр 12, 2026
    Чертеж инженерной системы с деталями и таблицей ревизий.

    От 4 недель до 45 минут: разработка системы извлечения данных из более чем 4700 PDF-файлов.

    Как гибридный конвейер обработки изображений PyMuPDF + GPT-4 Vision позволил сократить трудозатраты на ручную разработку на 8000 фунтов стерлингов, и почему новейшие модели оказались неподходящим решением. Делиться Изображение создано автором. В мой кабинет зашёл человек и спросил,…

    Апр 12, 2026
    Технология автономного кодирования увеличила выручку Mercyhealth на 5,1%.

    Технология автономного кодирования увеличила выручку Mercyhealth на 5,1%.

    Для системы здравоохранения Среднего Запада изменение процесса кодирования вышло за рамки повышения точности — оно укрепило работу персонала на протяжении всего цикла получения доходов, от документирования до обработки отказов. Глобальная система ICD-10 и кодирование Келли Пирсон, директор…

    Апр 12, 2026

    Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых