ideipro logotyp

Открытые графы биомедицинских знаний в масштабе предприятия: построение, объединение и доступ агентов ИИ с помощью графовой базы данных Samyama.

arXiv:2603.15080v3 Тип объявления: замена-перекрестное аннотирование: Биомедицинские знания фрагментированы по разрозненным базам данных — Reactome для метаболических путей, STRING для белковых взаимодействий, ClinicalTrials.gov для реестров исследований, DrugBank для словарей лекарственных препаратов, DGIdb для взаимодействий лекарств и генов, SIDER для побочных эффектов. Мы представляем три графа биомедицинских знаний с открытым исходным кодом — Pathways KG (118 686 узлов, 834 785 ребер из 5 источников), Clinical Trials KG (7 774 446 узлов, 26 973 997 ребер из 5 источников) и Drug Interactions KG (32 726 узлов, 191 970 ребер из 3 источников) — построенные на основе Samyama, высокопроизводительной графовой базы данных, написанной на Rust. Наш вклад состоит из трех частей. Во-первых, мы описываем воспроизводимый шаблон ETL для построения крупномасштабных графов знаний из разнородных общедоступных источников данных, включающий дедупликацию данных между источниками, пакетную загрузку (с использованием Python Cypher и Rust) и переносимый экспорт снимков. Во-вторых, мы демонстрируем федерацию между графами знаний: загрузка всех трех снимков в один экземпляр графа позволяет выполнять объединения на основе свойств между наборами данных. В-третьих, мы представляем генерацию MCP-сервера на основе схемы для доступа к агентам LLM, оцененную на новом бенчмарке BiomedQA (40 вопросов по фармакологии): специализированные MCP-инструменты достигают точности 98% по сравнению с 85% для текстового преобразования в Cypher с учетом схемы и 75% для автономного GPT-4o, без ошибок схемы. Все источники данных имеют открытую лицензию. Объединенный федеративный граф (7,9 млн узлов, 28 млн ребер) загружается примерно за 3 минуты на стандартном облачном оборудовании, при этом запросы к одному графу выполняются за 80-100 мс, а объединения между графами — за 1-4 секунды.

Источник: arxiv.org

✅ Найденные теги: Samyama, Биомедицинские, Графы, Знания, ИИ, новости, Открытые

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Проведение компьютерной томографии грудной клетки у постели больного без облучения? | MobiHealthNews
Цифровой код двоичного формата на чёрном фоне, показывает потоки данных и сети.
Сравнение DLSS 5: слева без технологии, справа с улучшенной графикой.
Оранжевое промышленное оборудование в производственном цехе с надписью "NTH Cycle".
ideipro logotyp
Человек работает с промышленным роботом на производстве, проверяя оборудование.
Молекулы под микроскопом, научная иллюстрация с синими и оранжевыми сферами.
Диаграмма процесса обучения модели ResNet с использованием данных FMCW и UWB.
Переосмысление AEO в контексте работы программных агентов, осуществляющих навигацию по сети от имени пользователей.
Image Not Found
Проведение компьютерной томографии грудной клетки у постели больного без облучения? | MobiHealthNews

Проведение компьютерной томографии грудной клетки у постели больного без облучения? | MobiHealthNews

Инженеры из Гонконга разработали ультразвуковую линзу на основе метаматериалов с поддержкой искусственного интеллекта, которая позволяет визуализировать структуры сердечных клапанов в непосредственной близости от реберной клетки. Медицинские устройства. Фото: Ёсиёси Хирокава/Getty Images Инженеры из Гонконгского университета разработали ультразвуковой…

Мар 19, 2026
Цифровой код двоичного формата на чёрном фоне, показывает потоки данных и сети.

STAT+: Данные о здоровье пациентов как общественная услуга: объяснение бывшего руководителя отдела данных ARPA-H.

Аластер Томсон утверждает, что сначала необходимо установить прозрачность и доверие. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Adobe В прошлом году Министерство здравоохранения и социальных служб опубликовало обширный документ, описывающий…

Мар 19, 2026
Сравнение DLSS 5: слева без технологии, справа с улучшенной графикой.

Геймеры реагируют с огромным отвращением на усовершенствования генеративного ИИ в DLSS 5.

Технология генерации кадров следующего поколения от Nvidia выходит далеко за рамки простого масштабирования, и это не в лучшую сторону. Кайл Орланд – | 475 Сравнительный анализ, демонстрирующий, что DLSS 5 делает гораздо больше, чем просто масштабирование в…

Мар 19, 2026
Оранжевое промышленное оборудование в производственном цехе с надписью "NTH Cycle".

Подробности сделки на сумму 1,1 млрд долларов по возвращению нефтеперерабатывающих предприятий, занимающихся добычей критически важных полезных ископаемых, на территорию США.

Источник изображения: Nth Cycle США и Европа сталкиваются с проблемой нехватки никеля. Этот важнейший минерал используется во всем: от батарей и ракет до электроники и стали. И тем не менее, добыча и переработка никеля в этих двух…

Мар 19, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых