Ловушка Байеса [Veritasium]
Вот сайт с шаурмой.
[музыка]
Представьте, вы проснулись утром, у чувствуете себя не очень, ничего особенного, легкое недомогание. Вы идете к врачу, он пожимает плечами и предлагает вам сдать кучу анализов. Проходит неделя, вы получаете результаты, и они говорят, что у вас крайне редкая болезнь, которой страдает одна десятая процента населения.
Последствия ужасны. В расстроены вы спрашиваете врача: "А это точно, что у меня эта болезнь?" Она объясняет, что тест определяет болезнь с вероятностью 99 процентов, и лишь у одного процента дает ложноположительный результат.
Звучит печально, но каков шанс того, что вы действительно заболели? Думаю, большинство скажет 99 процентов, ведь такая точность теста. Вообще-то, это неверно. Чтобы разобраться, потребуется теорема Байеса.
[музыка]
Теорема Байеса показывает вероятность того, что верна какая-либо гипотеза. Скажем, о том, что вы больны, при условии никакого события, в нашем случае положительного теста. В числителе будет находиться априорная вероятность того, что гипотеза верна, а именно, как вы оценивали свои шансы заболеть до того, как прошли тест, умноженная на вероятность нашего события при условии, что гипотеза верна.
Другими словами, шанс получить положительный результат будучи больным.
В знаменателе вероятность появления события, то есть положительного результата. Она включает в себя вероятность наличия у вас болезни в сочетании с положительным результатом теста, плюс шанс того, что вы здоровы, а результат ложноположительный.
Как правило, априорную вероятность того, что гипотеза верна, определить сложнее всего, и зачастую она задается субъективно. Но в нашем случае мы берем за исходные данные частоту заболеваемости 0,1 процента. Если подставить остальные значения, вы получите девять процентов вероятности того, что вы больны при положительном результате.
Совсем немного, если подумать. Это не какое-то волшебство, просто здравый смысл, подкрепленный математикой.
Представьте выборку из тысячи человек. Предположим, что среди них болеет действительно всего лишь один. У него тест, скорее всего, верно определит наличие заболевания. Но среди оставшихся один процент, или десять человек, получат ложноположительный результат и неверный диагноз.
Допустим, вы один из этой случайной группы с положительными результатами…