Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Раскрытие тайны убийства с помощью байесовского вывода

Как фильм «Достать ножи» учит байесовскому мышлению (даже незаметно для вас).

Делиться

af8b6c56c67281aaf0c1869bf099c42e
Фотография Хорхе Росалеса с сайта Unsplash.

Обзор

Помню, как смотрел голливудский детективный триллер «Достать ножи», склонившись над экраном, словно дело было в моих руках. Пока команда детектива Блана допрашивала каждого человека в особняке Тромби, я тоже вычеркивал имена в уме, только чтобы потом снова вставить их после пары неожиданных поворотов сюжета. Тогда мне и в голову не приходило, что этот старомодный детектив заставляет меня заниматься математикой в уме. Хотя это может показаться натяжкой, я твердо убежден, что стиль расследования Бенуа Блана во многом напоминает байесовский вывод. Но те, кто помнит допросы в фильме, быстро поймут, что Бенуа Блан даже не проводил активного допроса. Он сидел рядом с пианино, позволяя своей команде (лейтенанту Эллиоту и рядовому Вагнеру) задавать вопросы. Тогда почему я говорю, что стиль расследования Блана как-то связан с байесовским выводом? Сам Блан упомянул об этом в фильме, и я цитирую:

«Я наблюдаю за фактами без предвзятости разума или сердца». (Бенуа Блан, «Достать ножи» [1])

В этом и заключается суть байесовского вывода, где ваши выводы основаны не на интуиции, а на доказательствах. Давайте вместе разгадаем эту загадку убийства, используя байесовский вывод.

Прежде чем мы начнём, небольшое замечание. На протяжении всего фильма противоречия представлены в двух формах. Одни противоречия показаны в виде флэшбеков, которые демонстрируются только зрителям и в основном неизвестны Бланку. Другие противоречия выявляются в словесных несоответствиях, свидетелем которых Блан становится во время расследования. Поэтому мы сосредоточимся только на словесных несоответствиях, отмеченных Бланком.

Также несколько слов о присвоении и обновлении весовых коэффициентов вероятности. Они не рассчитываются по байесовской формуле, поскольку значения вероятности трудно присвоить поведенческим признакам, таким как уклонение от ответа или ложь. Вместо этого мы используем обоснованные оценки в качестве учебного инструмента, а не математического доказательства. Надеюсь, вам понравится это путешествие.

Подготовка почвы — Формирование первоначальных убеждений

Детектив Блан был анонимно нанят членом семьи для расследования возможного убийства Харлана Тромби. Когда его команда начинает допрос, Блан незаметно наблюдает за потенциальными подозреваемыми со спины. Когда допрос отклоняется от намеченного курса, он направляет команду, постукивая по клавише пианино, чтобы вернуть ее в нужное русло.

Он замечает, что каждое взаимодействие окутано ложью и противоречиями. Его правильный подход заключается не в том, чтобы отбрасывать одну версию событий как необоснованную, цепляясь за другую, основанную на интуиции. Он понимает, что вводящие в заблуждение рассказы могут содержать крупицы правды. Он тщательно анализирует каждое взаимодействие, присваивает весовые коэффициенты каждому наблюдению, а затем объединяет их, чтобы прийти к выводу. Он начинает с неопределенности, но постепенно приближается к наиболее вероятной истине, отбрасывая личные предубеждения.

Блан начинает с перечисления вероятных причин смерти. В байесовском подходе это называется априорной моделью. Априорная модель — это набор предположений, которых мы придерживаемся до появления каких-либо доказательств. В данном случае априорная модель — это первоначальные гипотезы о смерти Тромби до начала расследования.

a9da95fb4ce4d30e6adcae2cd36f1b06
Фотография Алейны Чатак на Unsplash; отредактирована автором.

Оценка полноты первоначальных убеждений

Давайте проанализируем первоначальные предположения, чтобы понять, не упустили ли мы из виду какие-либо другие возможности. Не упустили ли мы из виду возможность того, что это была попытка подставить кого-то? Если да, то следует ли включить это в качестве шестой гипотезы?

Здесь вступает в силу важнейшее правило (принцип MECE) для формулирования гипотез в байесовском выводе. Каждая гипотеза, сформулированная в рамках байесовского вывода, должна быть взаимоисключающей и исчерпывающей (MECE).

Давайте вернемся к шестой потенциальной гипотезе, «Попытка подставить кого-то». Хотя выбранная гипотеза должна ответить на вопрос о том, что могло стать причиной смерти, эта потенциальная гипотеза больше говорит о мотиве смерти, при условии, что будет доказано, что это было убийство. Таким образом, она нарушает правило взаимоисключаемости принципа MECE и, следовательно, не может быть прямой гипотезой.

Присвоение вероятностей (априорных вероятностей)

Давайте остановимся на гипотезах, которые мы сформулировали ранее, поскольку они учитывают все возможные причины смерти (в совокупности исчерпывающие). Следующий логический шаг — присвоить вероятности нашим первоначальным предположениям. Это означает, что мы начинаем с обоснованного предположения о том, насколько вероятно, что каждая гипотеза стала причиной смерти Харлана Тромби. Поскольку мы присваиваем вероятности до того, как получим какие-либо прямые доказательства или данные, мы называем это априорной вероятностью. На приведенном ниже рисунке показано, как мы присваиваем одинаковые веса всем гипотезам. Давайте на мгновение предположим, что это наши априорные вероятности.

e084eb781bceabfc97222b87e6e702d9
Априорные вероятности с равномерным распределением (Изображение предоставлено автором)

Естественно, возникает вопрос: имеет ли каждая гипотеза одинаковую вероятность наступления? Нет, не всегда. В байесовском выводе распространено заблуждение, что всем гипотезам необходимо присваивать одинаковую вероятность. В отсутствие предварительных данных мы предполагаем, что детектив Блан присваивает каждой гипотезе одинаковую вероятность. Но это не всегда так.

Мы также можем предположить неравномерные (неравномерные) вероятности, если у нас есть предварительные знания, указывающие на то, что одна гипотеза более вероятна, чем другие. Общая статистика преступности также может быть полезна для оценки априорных вероятностей. Например, согласно данным ФБР об убийствах [2], говорится, что в большинстве случаев убийства жертвы знают своего убийцу. Убийства, совершенные посторонними лицами, часто требуют мотива, связанного с кражей со взломом или какой-либо местью. Поэтому гипотеза H4 имеет больший вес, поскольку члены семьи имеют больший доступ к жертве. Более того, в случае Харлана Тромби гипотеза о том, что его смерть была вызвана членом семьи, имеет больший вес, поскольку члены его семьи могли быть мотивированы наследованием его богатства и имущества. Идеальными априорными вероятностями в нашем сценарии было бы неравномерное распределение.

53cadd4120b5d5fc55f463163447c272
Вероятности, выбранные для детективной истории «Достать ножи» (изображение предоставлено автором).

Обновление вероятностей на основе имеющихся данных.

Давайте вспомним сцену допроса Марты. У Марты патологическое состояние, из-за которого её рвёт всякий раз, когда она лжёт. Но поскольку Марта изначально считает, что стала причиной смерти Тромби, случайно подменив лекарства, она пытается разрешить ситуацию, давая неполные ответы и полуправду.

Здесь загвоздка в том, что детектив Блан уже знает о её состоянии. Вызывают ли необдуманные ответы Марты подозрения и, следовательно, меняют ли они баланс сил? Одна из возможностей заключается в том, что у Марты был мотив убить мистера Харлана (подтверждая теорию о постороннем лице – H5). Другая возможность состоит в том, что Марта, будучи медсестрой, могла совершить роковую ошибку, которая стоила жизни мистеру Тромби (H2). Байесовская функция правдоподобия полезна в таких неоднозначных ситуациях. Байесовская функция правдоподобия измеряет, насколько хорошо каждая гипотеза объясняет наблюдаемые доказательства. Поведение Марты недостаточно для того, чтобы различить H2 и H5. Поэтому вероятности изменятся лишь незначительно, а не кардинально. Вероятности для H2 и H5 немного увеличатся, а для H1 и H3 уменьшатся.

Важный момент, касающийся вероятностей. Как только мы получаем какое-либо подтверждение (незначительное или существенное) и начинаем обновлять наши веса, это называется апостериорной вероятностью. Исходя из вышеизложенного, мы переназначаем вероятности, как показано.

Из визуального представления видно, что весовые коэффициенты немного сместились в сторону H2, но существенного сдвига пока нет.

47c62a247fca37b98f3018e251f26969
Основано на книге «Полуправда Марты» – Изображение предоставлено автором.

Простые, но прямые противоречия — Байесовское золото

Возникло поразительное противоречие относительно того, кто находился непосредственно рядом с Харланом Тромби на его дне рождения. Дочь Харлана, Линда, упомянула, что она была рядом с Харланом вместе со своим мужем и сыном. Однако Уолт упомянул, что он и его семья были рядом с Харланом. Хотя это противоречие, возможно, и не указывает на какого-либо конкретного человека, оно вызывает подозрения в их коллективной достоверности. Это усиливает сомнения относительно H4.

Ниже приведены обновленные вероятности.

0e09af4c162e7afcab470ef021ff1237
Противоречивые ответы семьи (Изображение предоставлено автором)

Уклонение Уолта от ответа в пользу выкупа

Лейтенант Эллиот спрашивает Уолта, почему Харлан отвел его в сторону для разговора и почему Уолт позже выглядел пристыженным. Уолт немного поколебался, а затем перевел разговор на Рэнсома. Он упомянул, что у Харлана был спор с Рэнсомом. Это говорит о том, что Уолт намеренно скрывает свой разговор с Харланом. Давайте перераспределим вероятности, основываясь на этих доказательствах.

5788cb89f61f2ddd589ac9bff8226a20
Обсуждение поведения Рэнсома (Изображение предоставлено автором)

Противоречия между матерью и дочерью

Когда команда Бланка спрашивает, почему Джони пришла раньше, она отвечает, что хотела встретиться с Харланом по поводу перевода денег на оплату обучения дочери. Но дочь Джони, Мэг, говорит, что ее дедушка, Харлан, никогда не пропускал переводы денег на оплату ее обучения. Это противоречие значительно увеличивает вероятность гипотезы H4.

3d2ff93e8821f794ed2fd38eb156d7b1
Джони и Мег – Противоречия (Изображение предоставлено автором)

Сцена чтения завещания — уточнение вашей гипотезы

До сих пор наибольший вес приходился на H4, что подтверждало теорию об убийстве, совершенном членом семьи. Но когда мы видим, что все имущество было передано медсестре и сиделке Марте, все подозрения смещаются на нее. После этого резкого изменения событий вес H5 почти утраивается. Семья подозревает ее в том, что она манипулировала Харланом, чтобы тот изменил завещание на ее имя. Ниже приведены обновленные вероятности.

c9a50f910ad3b4760a16604c9d59ee07
Чтение завещания – Марте были вручены активы (Изображение предоставлено автором)

Здесь вступает в игру важная концепция, называемая «уточнение гипотез». Байесовский вывод не ограничивает вас первоначальным набором гипотез. Вместо этого он позволяет уточнять гипотезу и расширять её по мере появления дополнительных доказательств. В данном случае H5 (Убийство, совершённое посторонним) представляла собой более широкий термин. Теперь мы можем перейти к более детальной подгипотезе. Обновлённое пространство гипотез и соответствующие веса показаны ниже.

33b511e3aff1fd3fdc005837e0f890b8
Уточнение гипотезы (Изображение предоставлено автором)

Внезапно семья, которая обожала Марту, видит в ней главную подозреваемую. Однако Блан по-прежнему не убежден в наличии у Марты мотива, поскольку токсикологическая экспертиза показывает, что Харлан умер не от передозировки морфина. В отличие от членов семьи, Блан руководствуется не интуицией, а уликами. Следуя по следам, он видит, что улики указывают ему в другом направлении — на Рэнсома.

Кульминация — Абсолютный фактор, меняющий вероятность.

В ходе расследования почти все члены семьи (включая персонал) говорили о ссоре между Рэнсомом Драйсдейлом и его дедом Харланом, из-за которой Рэнсом покинул вечеринку раньше, чем ожидалось. Кроме того, отсутствие Рэнсома на следующий день после смерти Харлана послужило дополнительным доказательством. Однако мотив оставался неясным до тех пор, пока Рэнсом не прибыл в день оглашения завещания. Джейкоб, другой внук Харлана, упомянул, что слышал, как Рэнсом говорил своему деду «Завещание» и «Я тебя предупреждаю», прежде чем уйти. Когда его спросили об этом члены семьи, Рэнсом признался, что уже знал, что его исключили из завещания. Детектив Бланк, наблюдавший за всем этим, понял, что это может быть мотивом Рэнсома для убийства Харлана. На основании этих доказательств мы обновляем наши гипотезы. Поскольку H4 (Убийство членом семьи) — это более широкий термин, мы переходим к более детальной подгипотезе. Наше обновленное пространство гипотез и соответствующие веса показаны ниже.

630e9dd6e931b892f818bb6f9a45f019
Вероятность перехода к выкупу – вычеркнуто из завещания (Изображение предоставлено автором)

Обратите внимание, как резко снижается вероятность того, что Марта была убийцей, на основании новых доказательств, показывающих, что токсикологическая экспертиза не выявила передозировки морфина, и того факта, что Рэнсом был зол из-за того, что его не включили в завещание. Апостериорная вероятность смещается по мере появления веских доказательств. Именно это делает байесовский подход таким интуитивно понятным. Основанный на условной вероятности, он задает самый честный вопрос: «Учитывая все, что мне известно на данный момент, каков наиболее вероятный ответ?».

dda0fe5eb2b70fa9aecad301b73571c9
Вероятность в движении (Изображение предоставлено автором)

На приведенной выше диаграмме обратите внимание, как вероятность успеха Марты периодически резко падает, в то время как вероятность успеха Рэнсома взлетает к концу диаграммы на основе новых доказательств.

Заключение — Не удалось достичь сходимости к H3?

Как мы видели, фильм «Достать ножи» служит отличным примером для иллюстрации рассуждений в условиях неопределенности, что, по сути, является основной предпосылкой байесовского вывода. Первоначально вероятность убийства членом семьи возрастала, поскольку в каждом разговоре были противоречия. Но по мере появления новых доказательств в отношении Марты подозрение сместилось на нее. Однако с прибытием Рэнсома и последующими откровениями о его ссоре с Харланом вероятности сошлись на нем. В действительности Харлан покончил жизнь самоубийством, чтобы защитить Марту, поскольку они оба считали, что она дала ему смертельную дозу морфина. Так что, байесовский вывод терпит неудачу, поскольку он не сошлся на H3 (Смерть от самоубийства)? Иногда истина может быть многослойной, как в этом случае, когда Рэнсом намеренно подменил наркотики и забрал антидот с единственной целью — вызвать смерть Харлана. Следовательно, хотя Рэнсом физически не убил Харлана, он спланировал его смерть. Байесовский подход позволил глубже разобраться в причинах смерти Харлана, которой было самоубийство. При нейтральном подходе байесовский вывод может эффективно помочь вам обнаружить скрытые под поверхностью истины слои.

Ссылки

[1] Официальная расшифровка фильма «Достать ножи» режиссера Райана Джонсона

[2] Данные ФБР об убийствах

Субха Ганапати Посмотреть все из Субха Ганапати

Источник: towardsdatascience.com

✅ Найденные теги: Байесовского, новости, Помощью, Раскрытие, Тайны, Убийства

Добавить комментарий

Новости других рубрик

Архив рубрики ~Обо всем~: После использования этого ноутбука с Windows для работы и развлечений я задаюсь вопросом, зачем мне до сих пор нужен системный блок ПК. Архив рубрики ~Обо всем~: Подсказки, ответы и помощь от NYT Strands за 31 мая #819 Архив рубрики ~Обо всем~: По имеющимся данным, умные очки Apple появятся на рынке не раньше конца 2027 года. Архив рубрики ~Обо всем~: Да, вам следует удалить свои данные из интернета — и наш любимый сервис сейчас предлагает скидку 55%. Архив рубрики ~Обо всем~: «Легенда о Vox Machina», «Каждый год после» и другие новые релизы Prime Video, которые мы посмотрим в июне. Архив рубрики ~Обо всем~: Программы для переранжирования тоже не волшебные: когда кросс-кодировочный слой оправдывает затраты Архив рубрики ~Обо всем~: Контроллер Steam был распродан очень быстро, и Valve работает над пополнением запасов. Архив рубрики ~Обо всем~: ExpressVPN значительно превосходит конкурентов по результатам проверок безопасности, но что они означают?