arXiv:2603.01752v2 Тип объявления: замена-кросс-аннотация: Мотивация: Разреженные автокодировщики (SAE) разлагают активации базовой модели на интерпретируемые признаки, но причинно-следственные взаимодействия между признаками в зависимости от глубины сети остаются неизвестными для биологических базовых моделей. Результаты: Мы представляем метод трассировки причинно-следственных цепей путем удаления признаков SAE и измерения последующих ответов, и применяем его к Geneformer V2-316M и scGPT для всего человеческого организма в четырех условиях (96 892 ребра, 80 191 прямой проход). Обе модели демонстрируют приблизительно 53% биологической когерентности и от 65 до 89% ингибиторного доминирования, инвариантного к архитектуре и типу клеток. scGPT дает более сильные эффекты (среднее абсолютное значение d = 1,40 против 1,05) с более сбалансированной динамикой. В результате анализа согласованности между моделями было выявлено 1142 пары консервативных доменов (10,6-кратное обогащение, p < 0,001). Вероятность того, что домены, связанные с заболеваниями, являются консенсусными, в 3,59 раза выше. Валидация CRISPRi на уровне генов показала 56,4-процентную точность определения направления, подтверждая скорее коэкспрессию, чем причинно-следственное кодирование.
Источник: arxiv.org





















