Новое исследование ставит под сомнение одну из самых известных и противоречивых идей в сетевой науке. Комментарий Сохранить статью Прочитать позже

Введение
Опубликованная в интернете в прошлом месяце статья вновь разожгла дискуссию об одном из старейших и наиболее поразительных утверждений современной сетевой науки: о том, что большинство сложных сетей в реальном мире — от Всемирной паутины до взаимодействующих белков в клетке — являются «безмасштабными». Грубо говоря, это означает, что некоторые из их узлов должны иметь гораздо больше связей, чем другие, подчиняясь математической формуле, называемой степенным законом, так что не существует единого масштаба, характеризующего сеть.
Чисто случайные сети не подчиняются степенным законам, поэтому, когда первые сторонники безмасштабной парадигмы начали наблюдать степенные законы в реальных сетях в конце 1990-х годов, они рассматривали их как свидетельство универсального организующего принципа, лежащего в основе формирования этих разнообразных сетей. Исследователи утверждали, что архитектура безмасштабности может дать представление о фундаментальных вопросах, таких как вероятность того, что вирус вызовет эпидемию, или насколько легко хакеры могут вывести сеть из строя.
За последние два десятилетия появилось множество научных работ, подтверждающих безмасштабность сотен реальных сетей. В 2002 году Альберт-Ласло Барабаши — физик, ставший специалистом по сетям и пионер парадигмы безмасштабных сетей, — написал книгу для широкой аудитории под названием «Linked», в которой утверждал, что степенные законы повсеместно распространены в сложных сетях.
«Удивительно простые и далеко идущие законы природы управляют структурой и эволюцией всех сложных сетей, которые нас окружают», — написал Барабаши (сейчас работающий в Северо-восточном университете в Бостоне) в LinkedIn. Позже он добавил: «Раскрытие и объяснение этих законов стало захватывающим путешествием, в ходе которого мы узнали о нашем сложном, взаимосвязанном мире больше, чем было известно за последние сто лет».
Однако на протяжении многих лет другие исследователи ставили под сомнение как повсеместность концепции безмасштабности, так и то, насколько эта парадигма проливает свет на структуру конкретных сетей. Теперь же в новой статье сообщается, что лишь немногие реальные сети демонстрируют убедительные доказательства безмасштабности.
В ходе статистического анализа почти 1000 сетей, взятых из биологии, социальных наук, технологий и других областей, исследователи обнаружили, что только около 4 процентов сетей (например, некоторые метаболические сети в клетках) прошли самые строгие тесты, описанные в статье. А для 67 процентов сетей, включая сети дружбы в Facebook, пищевые цепи и сети распределения воды, статистические тесты отвергли степенной закон как правдоподобное описание структуры сети.
«Эти результаты подрывают универсальность безмасштабных сетей и показывают, что реальные сети демонстрируют богатое структурное разнообразие, для объяснения которого, вероятно, потребуются новые идеи и механизмы», — написали авторы исследования Анна Бройдо и Аарон Клаузет из Университета Колорадо в Боулдере.
В целом, специалисты по сетевым технологиям сходятся во мнении, что анализ, представленный в статье, статистически обоснован. Однако, когда дело доходит до интерпретации полученных результатов, статья, похоже, функционирует как тест Роршаха, в котором как сторонники, так и критики безмасштабной парадигмы видят то, во что они и так верили. Большая часть дискуссии развернулась в оживленных дебатах в Твиттере.
Сторонники безмасштабной модели, многие из которых пришли в сетевую науку из физики, утверждают, что безмасштабность задумана как идеализированная модель, а не как нечто, точно описывающее поведение реальных сетей. Многие из наиболее важных свойств безмасштабных сетей, по их словам, также справедливы для более широкого класса, называемого «сетями с тяжелыми хвостами», к которому могут принадлежать многие реальные сети (это сети, которые имеют значительно больше узлов с высокой степенью связности, чем случайная сеть, но не обязательно подчиняются строгому степенному закону).
Критики возражают, что такие термины, как «безмасштабная сеть» и «сеть с тяжелым хвостом», используются в литературе по сетевой науке настолько расплывчато и противоречиво, что делают основные утверждения этой области неопровержимыми.
«Новая статья представляла собой попытку применить подход, основанный на данных, чтобы, так сказать, прояснить этот вопрос», — сказал Клаузет.
Наука о сетях — молодая дисциплина: большинство статей по этой теме опубликованы за последние 20 лет, и споры вокруг этой статьи и самого термина «масштабно-инвариантная модель» проистекают из незрелости этой области, считает Мейсон Портер, математик и специалист по сетям из Калифорнийского университета в Лос-Анджелесе. По его словам, наука о сетях «все еще находится в некотором роде на Диком Западе».
Вселенский закон?
Многие сети, от идеально упорядоченных решеток до чисто случайных сетей, обладают характерным масштабом. Например, в двумерной квадратной решетке каждый узел соединен ровно с четырьмя другими узлами (поэтому математики говорят, что «степень» узла равна четырем). В случайной сети, в которой каждая пара узлов имеет некоторую постоянную вероятность быть соединенной друг с другом, разные узлы могут иметь разные степени, но эти степени, тем не менее, группируются довольно близко к среднему значению. Распределение степеней имеет приблизительно колоколообразную форму, и узлы с непропорционально большим числом связей практически никогда не встречаются, подобно тому как распределение роста людей сосредоточено в диапазоне от 5 до 6 футов, и никто не бывает ростом в миллион (или даже 10) футов.
Но когда в 1998 году группа исследователей под руководством Барабаши изучила выборку Всемирной паутины, они обнаружили нечто совершенно иное: на некоторые веб-страницы, такие как главные страницы Google и Yahoo, ссылались гораздо чаще, чем на другие. Когда исследователи построили гистограмму степеней узлов, оказалось, что она следует степенному закону, то есть вероятность того, что данный узел имеет степень k, пропорциональна 1/k в степени. (В случае входящих ссылок во Всемирной паутине эта степень составляла приблизительно 2, сообщили исследователи.)


В степенном распределении отсутствует характерный масштаб (отсюда и название «безмасштабное»). Степенной закон не имеет пика — он просто убывает с увеличением степени, но относительно медленно, и если увеличить масштаб различных участков его графика, они будут выглядеть самоподобными. В результате, хотя большинство узлов по-прежнему имеют низкую степень, хабы с огромным количеством связей появляются в небольших количествах на каждом масштабе.
Парадигма безмасштабности в сетях возникла в исторический момент, когда степенные законы приобрели огромную роль в статистической физике. В 1960-х и 1970-х годах они сыграли ключевую роль в универсальных законах, лежащих в основе фазовых переходов в широком диапазоне физических систем, — открытие, за которое Кеннет Уилсон получил Нобелевскую премию по физике в 1982 году. Вскоре после этого степенные законы легли в основу двух других парадигм, получивших широкое распространение в мире статистической физики: фракталов и теории организации в природе, называемой самоорганизующейся критичностью.
К тому времени, когда Барабаши в середине 1990-х годов обратил свое внимание на сети, физики-статистики были готовы видеть степенные законы повсюду, сказал Стивен Строгац, математик из Корнельского университета (и член консультативного совета Quanta). В физике, по его словам, существует «религия степенных законов».
Команда Барабаши опубликовала свои выводы в журнале Nature в 1999 году; месяц спустя Барабаши и его тогдашняя аспирантка Река Альберт (ныне специалист по сетевым технологиям в Университете штата Пенсильвания) написали в журнале Science статью, которая с тех пор цитировалась более 30 000 раз, что степенные законы описывают структуру не только Всемирной паутины, но и многих других сетей, включая сеть сотрудничества киноактеров, электроэнергетическую сеть западных штатов США и сеть цитирования научных статей. Большинство сложных сетей, как утверждал Барабаши несколько лет спустя в журнале Linked, подчиняются степенному закону, показатель которого обычно находится в диапазоне от 2 до 3.
Альберт и Барабаши утверждали, что простой механизм, называемый «предпочтительным присоединением», объясняет появление этих степенных законов: когда новый узел присоединяется к сети, он с большей вероятностью подключается к заметному узлу с высокой степенью связности, чем к малоизвестному узлу с низкой степенью связности. Другими словами, богатые становятся богаче, а узлы-хабы — более хаберными.
Как писала команда Барабаши в номере журнала Nature от 27 июля 2000 года, безмасштабные сети обладают рядом ключевых свойств, отличающих их от других сетей: они одновременно устойчивы к отказам большинства узлов и уязвимы для целенаправленных атак на центральные узлы. На обложке Nature это последнее свойство было названо «ахиллесовой пятой интернета» (характеристика, которая с тех пор была решительно оспорена экспертами по интернету).
Работа Барабаши произвела фурор среди математиков, физиков и других ученых и сыграла решающую роль в становлении современной области сетевой науки. Она породила поток статей, утверждающих, что одна реальная сеть за другой является безмасштабной — своего рода предпочтительное присоединение, в котором ранние работы Барабаши стали центральными элементами. «Произошел эффект подражания, когда люди делали что-то практически без разбора», — сказал Портер. Волнение перекинулось и на популярную прессу, появились разговоры об универсальных законах природы и статьи на обложках журналов Science, New Scientist и других.
Однако с самого начала парадигма безмасштабности также вызывала сопротивление. Критики указывали на то, что предпочтительное присоединение — далеко не единственный механизм, способный порождать степенные законы, и что сети с одним и тем же степенным законом могут иметь совершенно разные топологии. Некоторые ученые-сетевые аналитики и эксперты в данной области ставили под сомнение безмасштабность конкретных сетей, таких как электросети, метаболические сети и физический интернет.
Другие возражали против недостаточной статистической строгости. Когда степенной закон изображается на «логарифмическом графике» (где оси x и y имеют логарифмическую шкалу), он превращается в прямую линию. Поэтому, чтобы определить, является ли сеть безмасштабной, многие ранние исследователи просто визуально оценивали логарифмический график степеней сети. «Мы даже прищуривались, глядя на экран компьютера под углом, чтобы лучше понять, прямая кривая или нет», — вспоминает специалист по сетям Петтер Хольме из Токийского технологического института в своем блоге.
«Наверное, существует тысяча статей, — сказал Клаузет, — в которых люди строят график распределения степеней вершин, проводят по нему линию и заявляют, что оно не зависит от масштаба, не проводя при этом тщательной статистической работы».
В ответ на эту критику, с течением времени некоторые физики, изучающие безмасштабность, переключили свое внимание на более широкий класс сетей с «тяжелыми хвостами». Тем не менее, продолжал появляться постоянный поток статей, утверждающих безмасштабность для все большего числа сетей.
Дискуссия осложнялась отсутствием единообразия в толковании того, что на самом деле означает «безмасштабная сеть». Является ли безмасштабная сеть сетью, подчиняющейся степенному закону с показателем степени от 2 до 3, или сетью, в которой этот степенной закон возникает из-за предпочтительного присоединения? Или это просто сеть, подчиняющаяся какому-то степенному закону, или следующая степенному закону в определенных масштабах, или что-то еще более импрессионистское?
«Недостаточная точность формулировок постоянно вызывает разочарование», — сказал Портер.
Клаузет, активно занимающийся просветительской деятельностью, обнаружил, что многие студенты, с которыми он общается, до сих пор считают повсеместное распространение степенных законов общеизвестным фактом. «Меня поразило, насколько много путаницы царит среди подрастающего поколения ученых в отношении безмасштабных сетей», — сказал он.
Доказательства против безмасштабности были разрознены в научной литературе, причем большинство работ рассматривали лишь несколько сетей за раз. Клаузет же имел все возможности для гораздо более амбициозного проекта: его исследовательская группа последние несколько лет занималась созданием огромного онлайн-сборника, Колорадского индекса сложных сетей (ICON), включающего более 4000 сетей из экономики, биологии, транспорта и других областей.
«Мы хотели рассматривать гипотезу как проверяемую, а затем оценить доказательства во всех областях», — сказал он.
Подметание грязи и пыли
Для проверки парадигмы безмасштабности Клаузет и его аспирант Бройдо подвергли почти тысячу сетей ICON серии все более строгих статистических тестов, предназначенных для определения того, какие (если таковые имеются) определения безмасштабности могут правдоподобно объяснить распределение степеней узлов сети. Они также сравнили степенной закон с несколькими другими кандидатами, включая экспоненциальное распределение (которое имеет относительно тонкий хвост) и «логарифмически нормальное» распределение (которое имеет более тяжелый хвост, чем экспоненциальное распределение, но более легкий хвост, чем степенной закон).
Бройдо и Клаузет обнаружили, что примерно для двух третей сетей ни один степенной закон не подходил достаточно хорошо, чтобы правдоподобно объяснить распределение степеней. (Это не означает, что оставшаяся треть обязательно подчиняется степенному закону — просто степенной закон не был исключен.) И каждое из других возможных распределений превосходило степенной закон во многих сетях, при этом логарифмически нормальное распределение превосходило степенной закон в 45 процентах сетей и практически сравнялось с ним еще в 43 процентах.
Лишь около 4 процентов сетей удовлетворяли самому строгому критерию Бродо и Клаузета, который, грубо говоря, требует, чтобы степенной закон выдержал их проверку на соответствие, имел показатель степени от 2 до 3 и превосходил четыре других распределения.
По мнению Барабаши, эти результаты не подрывают идею о том, что в основе многих или большинства сложных сетей лежит принцип безмасштабности. В конце концов, сказал он, в реальных сетях механизм, подобный предпочтительному присоединению, будет не единственным фактором — другие процессы часто будут подталкивать сеть к отклонению от чистого принципа безмасштабности, из-за чего сеть не пройдет тесты Бройдо и Клаузета. По словам Барабаши, ученые, занимающиеся изучением сетей, уже разработали способы корректировки этих других процессов в десятках сетей.
«В реальном мире есть грязь и пыль, и эта грязь и пыль останутся на ваших данных», — сказал Алессандро Веспиньяни из Северо-восточного университета, еще один физик, ставший специалистом по сетевым технологиям. «Вы никогда не увидите идеального степенного закона».
В качестве аналогии Барабаши отметил, что камень и перо падают с совершенно разной скоростью, хотя закон всемирного тяготения гласит, что они должны падать с одинаковой скоростью. Если бы вы не знали о влиянии сопротивления воздуха, сказал он, «вы бы пришли к выводу, что закон гравитации неверен».
Клаузет не считает эту аналогию убедительной. «Я думаю, что физики, получившие образование в области статистической механики, довольно часто используют подобные аналогии, чтобы объяснить, почему к их модели не следует предъявлять очень высокие требования».
Клаузет сказал, что если бы вы наблюдали за 1000 падающими объектами, а не только за камнем и пером, то вырисовалась бы ясная картина того, как работают гравитация и сопротивление воздуха. Но его и Бройдо анализ почти 1000 сетей не дал подобной ясности. «Вполне разумно предположить, что для изучения фундаментального явления потребуется меньше специализированных исследований», чем предлагает Барабаши, написал Клаузет в Твиттере.
«Негласное и общепринятое предположение о том, что все сети являются безмасштабными, и что нам самим предстоит понять, как их рассматривать таким образом, — это звучит как неопровержимая гипотеза», — сказал он.
Если некоторые из сетей, отвергнутых тестами, действительно включают в себя безмасштабный механизм, на который накладываются другие силы, то эти силы должны быть довольно сильными, заявили Клаузет и Строгац. «В отличие от того, что мы видим в случае гравитации… где доминирующие эффекты действительно являются доминирующими, а меньшие эффекты представляют собой лишь небольшие возмущения, похоже, что в сетях нет единого доминирующего эффекта», — сказал Строгац.
Для Веспиньяни эта дискуссия иллюстрирует пропасть между взглядами физиков и статистиков, хотя и те, и другие обладают ценными точками зрения. Физики стремятся быть «художниками приближения», сказал он. «Мы же хотим найти некий организующий принцип».
Веспиньяни отметил, что безмасштабная парадигма дает ценное представление о том, как должна вести себя более широкая группа сетей с «тяжелыми хвостами». По его словам, многие характеристики безмасштабных сетей, включая сочетание устойчивости и уязвимости, присущи и сетям с «тяжелыми хвостами», поэтому важный вопрос заключается не в том, является ли сеть точно безмасштабной, а в том, имеет ли она «тяжелый хвост». «Я думал, что сообщество в этом вопросе согласно», — сказал он.
Однако Дункан Уоттс, специалист по сетевым технологиям из исследовательского центра Microsoft в Нью-Йорке, возразил в Твиттере, что такая точка зрения «на самом деле меняет правила игры». По его словам, как и в случае с «безмасштабностью», термин «с тяжелым хвостом» используется в литературе в нескольких разных значениях, и эти два термина иногда смешиваются, что затрудняет оценку различных утверждений и доказательств. По его словам, версия «с тяжелым хвостом», достаточно близкая к «безмасштабности», чтобы многие свойства могли быть перенесены, не представляет собой особенно широкий класс сетей.
«На самом деле, понятие безмасштабности когда-то означало нечто совершенно ясное, и почти наверняка это определение не применимо ко многим вещам», — сказал Уоттс. Но вместо того, чтобы ученые, изучающие сети, возвращались к своим первоначальным утверждениям и отменяли их, по его словам, «утверждение постепенно трансформируется, чтобы соответствовать всем доказательствам, сохраняя при этом свой фирменный стиль и эффект неожиданности. Это плохо для науки».
Портер любит шутить, что если люди хотят обсудить что-то спорное, им следует отложить в сторону американскую политику и поговорить о законах степеней. Но, по его словам, есть веская причина, почему эти дискуссии так напряженны. «Мы спорим, потому что проблемы сложные и интересные».
Клаузет рассматривает свою работу с Бродо не как нападку, а как призыв к действию для специалистов по сетевым технологиям, чтобы они изучили более разнообразный набор возможных механизмов и распределений степеней связей, чем это делалось до сих пор. «Возможно, нам следует рассмотреть новые идеи, вместо того чтобы пытаться подогнать старые», — сказал он.
Веспиньяни соглашается, что предстоит еще много работы. «Если вы спросите меня: „Все ли вы согласны с тем, что является истиной в этой области?“, то „истины пока нет“, — сказал он. — „Общей теории сетей не существует“».
Данная статья была перепечатана на сайте TheAtlantic.com.
Источник: www.quantamagazine.org
























