arXiv:2603.17380v2 Тип объявления: замена-кросс Аннотация: Виртуальные модели клеток призваны обеспечить возможность проведения экспериментов in silico путем прогнозирования реакции клеток на генетические, химические или цитокиновые возмущения на основе измерений отдельных клеток. Однако на практике крупномасштабное прогнозирование возмущений по-прежнему ограничено тремя взаимосвязанными проблемами: неэффективными конвейерами обучения и вывода, нестабильным моделированием в многомерном разреженном пространстве экспрессии и протоколами оценки, которые чрезмерно акцентируют внимание на точности, подобной реконструкции, недооценивая при этом биологическую точность. В этой работе мы представляем специализированную крупномасштабную базовую модель SCALE для виртуального прогнозирования возмущений клеток, которая одновременно решает вышеуказанные проблемы. Во-первых, мы создаем структуру обучения и вывода на основе BioNeMo, которая существенно повышает пропускную способность данных, распределенную масштабируемость и эффективность развертывания, обеспечивая ускорение в 12,51* при предварительном обучении и в 1,29* при выводе по сравнению с предыдущим передовым конвейером при аналогичных системных настройках. Во-вторых, мы формулируем предсказание возмущений как условный перенос и реализуем его с помощью архитектуры потока, учитывающей множества, которая связывает клеточное кодирование на основе LLaMA с ориентированным на конечные точки контролем. Такая конструкция обеспечивает более стабильное обучение и более эффективное восстановление эффектов возмущений. В-третьих, мы оцениваем модель на Tahoe-100M, используя строгий протокол на клеточном уровне, основанный на биологически значимых метриках, а не только на реконструкции. На этом эталонном наборе данных наша модель улучшает PDCorr на 12,02% и DE Overlap на 10,66% по сравнению со STATE. В совокупности эти результаты показывают, что для развития виртуальных клеток необходимы не только лучшие генеративные цели, но и совместное проектирование масштабируемой инфраструктуры, стабильное моделирование переноса и биологически достоверная оценка.
Источник: arxiv.org






















