ideipro logotyp

Открытые графы биомедицинских знаний в масштабе предприятия: построение, объединение и доступ агентов ИИ с помощью графовой базы данных Samyama.

arXiv:2603.15080v3 Тип объявления: замена-перекрестное аннотирование: Биомедицинские знания фрагментированы по разрозненным базам данных — Reactome для метаболических путей, STRING для белковых взаимодействий, ClinicalTrials.gov для реестров исследований, DrugBank для словарей лекарственных препаратов, DGIdb для взаимодействий лекарств и генов, SIDER для побочных эффектов. Мы представляем три графа биомедицинских знаний с открытым исходным кодом — Pathways KG (118 686 узлов, 834 785 ребер из 5 источников), Clinical Trials KG (7 774 446 узлов, 26 973 997 ребер из 5 источников) и Drug Interactions KG (32 726 узлов, 191 970 ребер из 3 источников) — построенные на основе Samyama, высокопроизводительной графовой базы данных, написанной на Rust. Наш вклад состоит из трех частей. Во-первых, мы описываем воспроизводимый шаблон ETL для построения крупномасштабных графов знаний из разнородных общедоступных источников данных, включающий дедупликацию данных между источниками, пакетную загрузку (с использованием Python Cypher и Rust) и переносимый экспорт снимков. Во-вторых, мы демонстрируем федерацию между графами знаний: загрузка всех трех снимков в один экземпляр графа позволяет выполнять объединения на основе свойств между наборами данных. В-третьих, мы представляем генерацию MCP-сервера на основе схемы для доступа к агентам LLM, оцененную на новом бенчмарке BiomedQA (40 вопросов по фармакологии): специализированные MCP-инструменты достигают точности 98% по сравнению с 85% для текстового преобразования в Cypher с учетом схемы и 75% для автономного GPT-4o, без ошибок схемы. Все источники данных имеют открытую лицензию. Объединенный федеративный граф (7,9 млн узлов, 28 млн ребер) загружается примерно за 3 минуты на стандартном облачном оборудовании, при этом запросы к одному графу выполняются за 80-100 мс, а объединения между графами — за 1-4 секунды.

Источник: arxiv.org

✅ Найденные теги: Samyama, Биомедицинские, Графы, Знания, ИИ, новости, Открытые

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Изображение смартфона с символом руки на фоне логотипов с замками и яблоками.
ideipro logotyp
Медицинский центр Голд-Кост расширит возможности оказания виртуальной медицинской помощи пациентам на дому.
5 полезных скриптов на Python для генерации синтетических данных
Диаграммы и робот, объясняющие процессы машинного обучения и распознавания изображений.
Человек спит под белым одеялом в солнечных лучах.
Горный пейзаж с айсбергами на фоне голубого неба, отражение в спокойной воде.
Организация Enterprise Ireland сотрудничает с Northwell Health для содействия росту ирландских компаний на рынке США — Medical Device Network
ideipro logotyp
Image Not Found
Изображение смартфона с символом руки на фоне логотипов с замками и яблоками.

Apple выпустила первое обновление для «фоновой безопасности» для iPhone, iPad и Mac, исправляющее ошибку в Safari.

Вкратце Источник изображения: Брайс Дурбин / TechCrunch Компания Apple выпустила первое обновление, предназначенное для устранения уязвимости в веб-браузере Safari на iPhone, iPad и Mac. Согласно новому уведомлению о безопасности, опубликованному во вторник, Apple сообщила, что исследователь безопасности…

Мар 19, 2026
ideipro logotyp

В Массачусетском технологическом институте разработана биоразлагаемая «умная таблетка» для отслеживания соблюдения режима приема лекарств.

Автор: сотрудники Bio-IT World News 4 марта 2026 г. | Несоблюдение режима приема лекарств долгое время оставалось одной из самых сложных проблем здравоохранения. По данным Всемирной организации здравоохранения, примерно половина пациентов с хроническими заболеваниями не принимают лекарства…

Мар 19, 2026
Медицинский центр Голд-Кост расширит возможности оказания виртуальной медицинской помощи пациентам на дому.

Медицинский центр Голд-Кост расширит возможности оказания виртуальной медицинской помощи пациентам на дому.

Государственная система здравоохранения Квинсленда внедряет возможности дистанционного мониторинга и поддержки принятия клинических решений, первоначально предназначенные для послеоперационного ухода и управления хроническими заболеваниями. «Взаимосвязанное здравоохранение» Фото: Абель Митджа Варела/Morsa Images через Getty Images Gold Coast Health, государственная служба…

Мар 19, 2026
5 полезных скриптов на Python для генерации синтетических данных

5 полезных скриптов на Python для генерации синтетических данных

Прежде чем доверить библиотеке генерацию данных, научитесь делать это самостоятельно и поймите, где на самом деле возникают предвзятость и ошибки. Изображение предоставлено редактором. # Введение Синтетические данные, как следует из названия, создаются искусственно, а не собираются из…

Мар 19, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых