Содействие научному прогрессу посредством глобального партнерства и открытых ресурсов.
Наш подход к открытой науке основан на принципах ответственных, инклюзивных и строгих исследований, позволяющих глобальному сообществу совершать значимые открытия в различных дисциплинах и ускорять прогресс для всех.
Быстрые ссылки
- Делиться
Научный прорыв достигает своего полного потенциала только тогда, когда он дает возможность другим воспроизводить и расширять полученные результаты, еще больше расширяя границы науки. В Google Research мы понимаем, что программное обеспечение с открытым исходным кодом и общедоступные наборы данных являются движущей силой современной науки. Мы считаем, что ответственное создание этих ресурсов и их поддержание посредством партнерства с мировым научным сообществом воплощает дух сотрудничества. Таким образом, мы поддерживаем принципы открытой науки, гарантируя, что инновации не являются изолированным явлением, а катализатором глобального прогресса.
Будь то архитектура Transformer, изменившая автоматизированную обработку естественного языка, или наши специализированные модели, преобразующие медицину, геномику, нейробиологию, климатологию, энергетику и множество других направлений в физических, биологических и социальных науках, мы гордимся проделанной нами работой и тем, как она используется исследователями по всему миру для совершения собственных новаторских открытий. Этот открытый подход дополняет широкий спектр инициатив Google по вовлечению и укреплению научно-исследовательской экосистемы, включая API, публикации, конференции, программы доверенного тестирования и частные партнерства.
Партнерства и сотрудничество в рамках экосистемы
Мы сотрудничаем со многими специализированными организациями в различных научных дисциплинах и регионах мира, такими как Институт геномики Калифорнийского университета в Санта-Крузе (UCSC), исследовательский кампус Janelia, Австрийский институт науки и технологий (ISTA), Центр популяционной геномики, CSIRO — национальное научное агентство Австралии, и Всеиндийский институт медицинских наук (AIIMS).
Помимо отдельных организаций, мы активно поддерживаем масштабные научные консорциумы, занимающиеся решением монументальных глобальных задач, включая Исследовательский консорциум «Пангеном человека», Проект «Биогеном Земли» и Инициативу NIH BRAIN.
В конечном счете, наша философия открытой науки распространяется на более широкую экосистему, и мы инвестируем в создание сообществ практиков для отдельных разработчиков научных разработок, начиная с Индии, Кореи, Японии и Австралии.
Наши инструменты с открытым исходным кодом и данные
За последнее десятилетие мы разработали, выпустили, поддерживали и развивали ряд ключевых технологий с открытым исходным кодом и общедоступных наборов данных. На сегодняшний день это позволило создать активную экосистему, насчитывающую более 250 000 исследователей и разработчиков по всему миру.
- Геномика : Наш набор инструментов глубокого обучения, включая DeepVariant, DeepConsensus и DeepPolisher, улучшает анализ ДНК от исходного секвенирования до окончательной сборки. В совокупности эти методы позволили мировому сообществу обработать экзомы и полные геномы 2,5 миллионов человек.
- Нейробиология : Наши методы и инструменты для автоматической реконструкции, анализа и визуализации коннектомных данных включают сети с заполнением пробелов, Neuroglancer и TensorStore. Эти технологии позволяют ученым беспрепятственно сегментировать, перемещаться и анализировать реконструкцию тканей головного мозга петамасштаба с высоким разрешением. Это включает два ключевых общедоступных набора данных: H01, образец ткани головного мозга человека объемом 1,4 петабайта, к которому обращались более 200 тысяч раз, и MICrONS, крупнейшая схема связей и функциональная карта зрительной коры головного мозга мыши.
- Моделирование Земли и атмосферы : Мы выпустили Open Buildings, содержащий 1,8 миллиарда обнаруженных зданий на территории площадью 58 млн км², охватывающей Африку, Южную Азию, Юго-Восточную Азию, Латинскую Америку и Карибский бассейн; Caravan, набор данных, созданный сообществом для анализа больших объемов гидрологических данных, в рамках нашей работы по прогнозированию наводнений, который теперь предоставляет прогнозы для 150 стран, охватывающих 2 миллиарда человек, для наиболее значительных наводнений; и набор данных Groundsource для городских внезапных наводнений, включающий 2,6 миллиона исторических событий наводнений, полученных с помощью Gemini на основе 20 лет общедоступных данных, охватывающих более 150 стран; а также NeuralGCM, полностью дифференцируемую гибридную атмосферную модель. Эти разработки также являются частью наших геопространственных проектов в рамках Google Earth AI. Мы также выпустили FireBench, синтетический набор данных высокого разрешения, предназначенный для развития исследований лесных пожаров, и набор данных об условиях ионосферы, измеренных с помощью телефонов, а также парную визуализацию набора данных во времени.
- Биологическое разнообразие : SpeciesNet — это глобальная модель, которая классифицирует 2498 категорий животных, включая млекопитающих, птиц и рептилий, на изображениях, полученных с помощью камер наблюдения за дикой природой.
- Здравоохранение : Наш пакет HAI-DEF (Health AI Developer Foundations) предоставляет набор базовых моделей с открытым исходным кодом, включая MedGemma, специализированных для обработки мультимодальных медицинских текстов, клинического мышления и понимания изображений. На сегодняшний день его скачали более 4,8 млн раз. Open Health Stack (OHS) — это набор инструментов с открытым исходным кодом, которые позволяют разработчикам быстрее и проще создавать безопасные, работающие в автономном режиме цифровые решения для здравоохранения нового поколения на основе современных стандартов цифрового здравоохранения. Приложения для здравоохранения, работающие на базе OHS, развернуты более чем в 10 странах и обслуживают более 65 миллионов пациентов.
Изображение фрагмента человеческого мозга, полученного в результате реконструкции, на котором один нейрон ( белый ) получает сигналы, определяющие, будет ли он активироваться или нет. На этом изображении показаны все аксоны, которые могут дать ему команду на активацию ( зеленый ), и все те, которые могут дать ему команду на отсутствие активации ( синий ). Источник: Google Research и лаборатория Лихтмана (Гарвардский университет). Визуализация: Д. Бергер (Гарвардский университет).
Реальное влияние открытой науки
Истинным мерилом нашей философии открытой науки является реальное влияние, достигаемое нашими партнерами и конечными пользователями. Ниже приведены несколько примеров, демонстрирующих, как наши открытые инструменты и наборы данных способствовали дальнейшим прорывам и использовались для оказания помощи сообществам по всему миру.
Содействие развитию глобальной науки
- В сотрудничестве с Институтом геномики Калифорнийского университета в Санта-Крузе мы разработали методы для улучшения эталонных данных пангенома и снижения количества ошибок при идентификации генетических вариантов на 50%. Эта работа вносит вклад в работу Исследовательского консорциума по изучению пангенома человека и его усилия по более точному представлению человеческого разнообразия в эталонных данных и рабочих процессах геномики.
- В рамках инициативы по прогнозированию погоды, ориентированной на человека, Чикагского университета использовались системы NeuralGCM и Европейского центра среднесрочных прогнозов погоды (ECMWF) для прогнозирования начала индийского муссона на срок до месяца вперед, включая даже необычно засушливый период в ходе муссона. В партнерстве с Министерством сельского хозяйства и благосостояния фермеров Индии эти предварительные прогнозы были успешно доставлены по SMS 38 миллионам фермеров в Индии, что позволило им оптимизировать решения по посеву сельскохозяйственных культур.
- Глобальные организации, включая Управление ООН по делам беженцев (УВКБ ООН), оптимизировали выборку для обследования перемещенных лиц в рамках мер реагирования на стихийные бедствия, используя набор данных Open Buildings. Этот набор данных также позволил проводить дополнительные научные исследования, в том числе оценивать риски для зданий, связанные с повышением уровня моря в странах Глобального Юга.

Посмотрите фильм
Ссылка на видео на YouTube
Африканская некоммерческая организация Sunbird AI использует набор данных Google Open Buildings, чтобы лучше понимать энергетические потребности сообществ в городских и сельских районах.
Содействие прогрессу в здравоохранении
- Исследователи из Университета Джонса Хопкинса использовали набор данных H01, полученный в результате реконструкции человеческого мозга, чтобы выявить новую форму нейронной коммуникации. Это открытие предполагает, что нынешнее понимание организации мозга может быть неполным, упуская из виду скрытый слой связей, что имеет значение для таких заболеваний, как болезнь Альцгеймера.
- Мы сотрудничали с Медицинской школой Стэнфордского университета и Калифорнийским университетом в Санта-Круз, чтобы адаптировать анализ генома для выявления причин генетических заболеваний в наиболее критических с точки зрения времени случаях. Программа позволила проводить жизненно важные вмешательства и установила новый мировой рекорд Гиннесса по достижению генетической диагностики с помощью полногеномного секвенирования менее чем за 8 часов.
- В сотрудничестве с Калифорнийским университетом в Санта-Круз и Национальным институтом рака при Национальных институтах здоровья мы совместно создали общедоступный набор последовательностей генома раковых клеток для разработки и оценки методов. Мы также совместно разработали DeepSomatic для более точного поиска вариантов раковых клеток, который Детская больница Children's Mercy Hospital использовала для обнаружения ранее пропущенных вариантов в случаях рака.
- HAI-DEF способствовала широкому глобальному вовлечению и ощутимому клиническому эффекту, предоставляя модели с открытыми весами, которые демократизируют разработку медицинского ИИ, особенно в странах с низким и средним уровнем дохода. Например, базирующаяся в Замбии компания Dawa Health использовала MedSigLP для создания многоязычного инструмента обучения и скрининга рака шейки матки на основе ИИ, который позволяет акушеркам загружать изображения кольпоскопии через WhatsApp для выявления аномалий в режиме реального времени.
- Open Health Stack позволил разработчикам по всему миру устранять пробелы в здравоохранении, особенно в условиях ограниченных ресурсов. Например, компания Ona создает приложения, которые позволяют медицинским работникам перейти от бумажных медицинских карт к цифровым решениям. OHS ускорил разработку приложения Ona и позволил внедрить совместимые стандарты данных, которые затем медицинские работники используют для оказания более качественной помощи в малообеспеченных сообществах.
- В Нью-Дели AIIMS использует MedGemma для разработки приложений для амбулаторной сортировки пациентов и дерматологического скрининга. В Малайзии MedGemma обеспечивает работу Ask CPG, разговорного интерфейса к более чем 150 клиническим рекомендациям страны, который, по словам Министерства здравоохранения Малайзии, упростил навигацию по клиническим рекомендациям для принятия повседневных решений. MedGemma также предоставляет отдельным разработчикам по всему миру возможность создавать приложения для клинической сортировки, понимания медицинских документов и поддержки принятия диагностических решений.

Посмотрите фильм
Ссылка на видео на YouTube
AIIMS использует MedGemma для разработки приложений для амбулаторной сортировки пациентов и дерматологического скрининга.
Содействие биоразнообразию и сохранению природы
- С 2010 года программа фотоловушек Snapshot Serengeti собрала более 11 миллионов изображений диких животных из африканской саванны. Используя SpeciesNet, исследователи из Университета Уэйк Форест теперь могут анализировать этот большой массив данных всего за несколько дней, а запуская модель с ноутбука, они могут использовать последние данные о наблюдениях за дикими животными для повторного размещения камер в режиме реального времени и сбора целевых данных.
- Исследователи из Университета Отаго работают над сохранением находящегося под угрозой исчезновения какапо — нелетающей птицы, имеющей важное культурное значение. Работая независимо от Google, исследователи переобучили DeepVariant, оптимизировав его для популяции какапо. Эта модель позволила им создать генетическую карту каждой живой птицы какапо, чтобы разработать стратегии разведения и планы ухода за больными птицами, что помогло увеличить популяцию с 51 до 252 особей.
- Исследователи из CSIRO совместно с Google поддерживают усилия по восстановлению популяции находящихся под угрозой исчезновения гигантских водорослей австралийской и тасманской фауны. Используя модели Google Earth и спутниковые снимки для выявления сохранившихся участков, а также открытые геномные инструменты Google для создания эталонных геномов, исследователи связывают генетические варианты с данными о термостойкости. Это позволяет им селективно выводить штаммы водорослей, устойчивые к повышению температуры океана.
- Проекты «Геномы позвоночных» и «Биогеном Земли» используют наши инструменты геномики с открытым исходным кодом для продвижения к своей монументальной цели — секвенированию генома каждого небактериального вида на Земле. Благодаря финансированию, предоставленному Google.org Рокфеллеровскому университету, исследователи уже предоставили полные геномы для 13 знаковых видов, находящихся под угрозой исчезновения, и продолжают работу над секвенированием еще 150 видов.
Изображения слона, зебры и птицы-секретаря были получены в рамках программы Snapshot Serengeti в национальном парке Серенгети в Танзании. Источник: Snapshot Serengeti / TM Anderson. Изображение оцелота было получено в Колумбии в рамках проекта Lucitania в Университете Анд. Источник: Project Lucitania/Universidad de los Andes/Red Otus. Изображение оленя-мула было получено Департаментом рыболовства и охоты штата Айдахо (IDFG). Источник: IDFG. SpeciesNet может помочь в идентификации этих животных.
Взгляд в будущее
Наше партнерство с сообществом открытой науки — это стремительно развивающаяся миссия. По мере того, как мы все глубже погружаемся в эру науки, основанной на искусственном интеллекте, нас вдохновляет то, как генеративный ИИ коренным образом меняет методы работы и сотрудничества исследователей. Мы считаем, что агентные рабочие процессы позволят ученым кодировать свои знания в специализированные навыки и преобразовывать свои методы в доступные, масштабируемые инструменты. Этот сдвиг позволит мировому сообществу быстро воспроизводить результаты, расширять сложные методологии и делиться своими работами по всему миру.
В этой новой, стремительно развивающейся парадигме коммуникация и сотрудничество важны как никогда. Программное обеспечение с открытым исходным кодом и открытые наборы данных служат важнейшей основой для этой экосистемы. Прорывы, которые мы сегодня отмечаем, — это лишь первоначальные планы для мира с более быстрыми инновациями и всеобщим обменом научными знаниями.
В Google Research мы продолжим создавать инструменты и инфраструктуру, поддерживающие эту новую эру открытий. Мы с нетерпением ждём, чего добьётся мировое научное сообщество в будущем.
Благодарности
Мы выражаем особую благодарность нашим многочисленным глобальным партнерам по исследованиям, а также широкому научному сообществу пользователей, которое использует наши открытые модели, инфраструктуру, наборы данных и другие инструменты для совершения открытий, а также для внедрения, пилотирования и реализации инноваций, оказывающих позитивное глобальное воздействие на общество.
Источник: research.google

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.