Цветные полосы на экране, символизирующие обработку данных или анализ ДНК.

Обмен данными о генетическом риске может непреднамеренно раскрыть секреты.

Статистические данные, количественно определяющие предрасположенность человека к таким заболеваниям, как диабет и рак, могут быть подвергнуты обратному инжинирингу для выявления лежащих в их основе генетических данных, что вызывает опасения по поводу конфиденциальности.

6086821815aa010359d917b98cfb363f

Анализ генетических данных позволяет оценить риск развития определенных заболеваний.

Научная фотобиблиотека / Alamy

Генетические показатели риска, суммирующие вероятность развития у человека определенных заболеваний, могут быть использованы с помощью математических приемов для выявления скрытых деталей его ДНК.

Теоретически этот метод может быть использован страховыми компаниями для восстановления генетических данных из сводного геномного отчета, что позволит выявить риски для здоровья, не раскрытые пациентом. В качестве альтернативы, людей, анонимно делящихся своими результатами, можно будет идентифицировать путем извлечения генетических данных и запроса к общедоступным генеалогическим базам данных.

Полигенные показатели риска измеряют влияние десятков или тысяч отдельных буквенных вариаций в геноме, известных как однонуклеотидные полиморфизмы (SNP). Используемые исследователями и компаниями, занимающимися ДНК-тестированием, для обобщения потенциальных рисков для здоровья, эти показатели иногда публикуются, например, людьми, обращающимися за советом по интерпретации полученных результатов.

Расшифровка полигенного показателя риска подобна попытке вычислить номер телефона, зная только, что сумма цифр равна 52. Это пример математической задачи о рюкзаке, известной своей вычислительной сложностью. Из-за этого такие показатели рассматриваются как представляющие низкий риск для конфиденциальности.

Однако каждое значение SNP, используемое в оценке риска, умножается на чрезвычайно точный вес — до 16 знаков после запятой — который отражает его вклад в общий риск заболевания. Это делает модели с малым риском уязвимыми для атак.

New Scientist. Научные новости и аналитические статьи от экспертов-журналистов, освещающие достижения в науке, технологиях, здравоохранении и охране окружающей среды, на сайте и в журнале.

«Поскольку окончательный полигенный показатель риска ограничен конечным числом способов его получения и статистически вероятным расположением лежащих в его основе однонуклеотидных полиморфизмов, его можно определить с высокой степенью точности», — говорит Гамзе Гюрсой из Колумбийского университета в Нью-Йорке.

Гюрсой и Кирилл Никитин, также из Колумбийского университета, провели 298 полигенных моделей риска, использующих не более 50 однонуклеотидных полиморфизмов (SNP), на генетических данных 2353 человек. Работая в обратном направлении, они рассчитали все возможные геномы, которые могли бы дать каждый заданный показатель, отфильтровав те, которые содержат много редких мутаций.

Поскольку один SNP может использоваться несколькими полигенными моделями риска, Гюрсой и Никитин смогли выстроить свою атаку в цепочку, используя SNP, выявленные в меньших моделях, для решения задач в более крупных моделях.

Им удалось восстановить генотип донора с точностью 94,6%, правильно предсказав 2450 SNP на каждого человека. Тесты показали, что 27 SNP достаточно для идентификации человека в пуле из полумиллиона образцов, а членов семьи можно было предсказать с точностью до 90%. Лица африканского и восточноазиатского происхождения были идентифицированы легче, поскольку они менее представлены в генетических базах данных.

По словам Гюрсоя, 447 небольших высокоточных моделей в общедоступной базе данных полигенных оценок уязвимы для этой атаки.

«Мы хотели подчеркнуть, что риск низок, но при [некоторых условиях] утечка все же может иметь место», — говорит Гюрсой. «Мы должны учитывать это при разработке исследовательских проектов, особенно если мы работаем с уязвимыми группами населения».

Ин Ван из Массачусетской больницы общего профиля говорит, что существующие меры защиты данных и вычислительные узкие места ограничивают риск использования полигенных показателей риска таким образом. «Результаты могут служить предостережением о том, что небольшие модели следует рассматривать как потенциально конфиденциальные данные при составлении клинических отчетов и обсуждении информированного согласия», — говорит она.

bioRxiv DOI: 10.64898/2026.02.16.706191

Источник: www.newscientist.com

✅ Найденные теги: Генетический, Данные, новости, Обмен, Риск, Секреты

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

dummy-img
Кто, что и почему произошло в результате атаки, которая парализовала сеть Windows компании Stryker.
ideipro logotyp
По данным iFixit, MacBook Neo — «самый ремонтопригодный MacBook за последние годы».
ideipro logotyp
Лобстер в сине-зеленом тоне, прицепленный на поводок, на ярко-зеленом фоне.
Карта аномалий температуры в Северной Америке: контрастные зоны тепла и холода.
Группа людей на фоне баннера MIT Stone Center на конференции о неравенстве.
Чат-бот предлагает пользователю купить ручку, приобрeтённую из переработанных бутылок.
Image Not Found
Символ числа Пи на чертеже, окружённый математическими формулами.

Вы можете приблизительно вычислить число Пи, уронив иглы на пол.

Зачем нужен суперкомпьютер, если число пи можно вычислить с помощью коробки швейных иголок? Фотография: Narvo Vexar/Getty Images Сохранить историю Сохранить эту историю Сохранить историю Сохранить эту историю С Днём числа Пи! 14 марта — это дата, когда…

Мар 15, 2026
Центр управления полетами, сотрудники за компьютерами, карты на экранах.

Роскосмос создает новую инфраструктуру для управления Роскосмосом

РКС приступили к созданию инфраструктуры для Российской орбитальной станции К созданию наземной инфраструктуры для строительства, управления и обслуживания будущей Российской орбитальной станции (РОС) приступили в холдинге «Российские космические системы» (входит в Госкорпорацию «Роскосмос»). тестовый баннер под заглавное…

Мар 15, 2026
Научная полиция в бронежилете, вид со спины.

Идентичные близнецы на испытании: может ли анализ ДНК отличить их друг от друга?

В ходе уголовного процесса во Франции обычный анализ ДНК не смог отличить братьев-близнецов, но новые научные методы могут помочь в таких случаях Рэйчел Филдхаус и журнал Nature Идентичный близнец совершает преступление и оставляет свою ДНК на месте…

Мар 15, 2026
Спутники на орбите Земли под солнечным светом.

Почему вооруженные силы всего мира стремятся создать собственную сеть Starlink?

Надежное интернет-соединение, обеспечиваемое Starlink, дает огромное преимущество на поле боя. Но поскольку доступ зависит от прихотей скандально известного миллиардера Илона Маска, военные стремятся создать собственную версию этой сети. Иллюстрация, демонстрирующая некоторые из 10 000 спутников Starlink. xnk/Shutterstock…

Мар 15, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых