Статистика не всегда говорит то, что люди думают о ней

Потребление большего количества сыра моцарелла не должно приводить к увеличению количества дипломов в инженерных вузах. Тем не менее, в период с 2000 по 2009 год, чем больше моцареллы съедали американцы, тем больше докторских степеней в области гражданского строительства присуждалось университетами США. За 10-летний период, по мере повышения уровня одного из них, росли и другие. Эти два показателя показали сильную положительную корреляцию. И все же почти наверняка это произошло случайно. Одно не привело к другому.
Это банальный пример. Тем не менее, это показывает важный момент в статистике: корреляция — это не то же самое, что причинно-следственная связь, показывающая, что одно является причиной другого.
Еще одна сложность: у многих событий или тенденций может быть несколько причин. И иногда две переменные могут быть обусловлены третьим фактором. Все это иногда может привести к путанице в статистическом исследовании. (Статистика предполагает сбор и анализ большого количества числовых данных и интерпретацию их значения.)
Эксперименты могут исключить такие другие причины, которые могут привести к путанице, при наличии тестовой и контрольной групп. Но это не всегда возможно или этично. Например, исследователи не хотели бы подвергать детей воздействию токсичных химических веществ только для того, чтобы посмотреть, какие негативные последствия могут последовать.
К счастью, статистика предлагает математические инструменты, которые могут объяснить возможные сбивающие с толку факторы. Это позволяет ученым увидеть, насколько изменение одной переменной может быть связано с различиями в чем-то другом.
Исследователи встроили такой инструмент в свою компьютерную модель для недавнего исследования свинца. В модели были данные о содержании свинца в крови детей и баллах по тесту в третьем классе. Исследователи хотели найти какую-либо связь между этими двумя переменными. Кроме того, в модели были данные о доходах семьи, этнической принадлежности и других факторах.
Статистический инструмент использовал математику, чтобы исключить возможные эффекты от других факторов. Это позволяет модели измерять только взаимосвязь между результатами тестирования. По сравнению с детьми, у которых не было отравления свинцом, дети даже с низким содержанием свинца в крови чаще не справлялись с тестами по чтению и математике. Исследование Environmental Health было опубликовано 7 апреля 2015 года.



























