Вероятность события. P(A) = 1, что будет дождь
Всем привет! С вами Георгий Вольфсон, а это реальная математика на научно-популярном канале QWERTY. Если вы ещё не подписаны на нас, срочно подписывайтесь, пока в соответствии с новым законом нас ещё не закрыли окончательно. Но надеемся, всё-таки, что этот закон нас не коснётся, и будем продолжать радовать вас новыми выпусками.
И вот сегодня мы порадуем вас вероятностями, а точнее, вероятностным подходом и как он работает в нашем реальном мире. Что вообще такое вероятность? На так, примерно на пальце, вероятностью события называется то, насколько часто это событие происходит. Так, если коротко, то есть некая величина от нуля до единицы, которая характеризует, как часто это событие наступает в среднем. Допустим, если вероятность равна нулю, то событие вообще невозможно, всё на ней наступит в принципе. А если событие имеет вероятность единицу, значит, оно наступит точно. Такое событие еще называют достоверным.
Все, что между нулём и единицей, а так как мы понимаем, вот она может наступить, может не наступить. На самом деле эта история встречается на практике очень часто. И вот первый пример: представьте себе, что некоторые фабрика выпускает сумки, и мы хотим оценить, вот допустим, мы заказали партию 20,000 сумок. Сколько из этих сумок будет с браком? Понятно, что проверять все двадцать тысяч, ну как-то что нам делать? Давайте попробуем взять просто поменьше какое-нибудь количество, ну например, выпустить пробную партию из ста сумок и выяснить, что из них три сумки оказались бракованными.
Ставить мне нужно достать кое-что из подсумка. Не, эта позорная сумка. Банан сам знает. Из этого следует, что вот вероятность брака в этой порции 3 процента. Значит, мы можем сказать, что на большой партии, скорее всего, вероятность тоже будет близка к трём процентам. На это, скорее всего, я пока заострю ваше внимание, но к нему мы еще вернемся.
Пока же заметим, что тогда, если партия была 20,000, то чтобы посчитать количество бракованных сумок, просто умножаем на 3 сотых: 20,000, разделить на 100, это будет 200, умножить на три целых 662 тысяч будет бракованным. Правда, обращаем внимание, да, что в таких случаях мы получаем ответ очень приближенный. Более того, если, например, в самом начале, представьте себе, что вы роняете 100 сумок, а, скажем, 10 из них бракованных оказалось, следует ли из этого, что в итоге на 20,000 тоже будет 0 бракованных?
На самом деле вовсе не обязательно. Может, просто из этих десяти так получилось, что ни одна бракованная не попалась. И наоборот, вот я из ста выбрал, там у меня три оказались бракованными, а может быть, на самом деле это мне просто повезло, и всего было из большой большой партии 7 хороших сумок, но они попали в эту партию. Понятно, что, скорее всего, это не так.
Если хотим предсказать, мы не можем это сделать достоверно, но, скорее всего, будет вот таким образом. Это примерные серии, как если вы кидаете там десять раз монетку. Как вы думаете, сколько раз упадёт она орлом? Вовсе не факт, что 5. Хотя вы понимаете, доверять на два зависания в воздухе мысли читать не будем.
Вероятность того, что выпадет ровно 5 орлов, она меньше 50 процентов. Если вы посчитаете аккуратно, странно, но факт. Что говорит нам это? Вероятно, что если мы сделаем много бросков, ну, типа тысячу, то, скорее всего, орлов будет около 500. Вот о чём говорит на самом деле. Вряд ли с 0.5 не ровно 500, конечно, но около. То есть там 490 вполне возможно, 400 уже очень маловероятно из 1000, а из десяти тысяч тем более. Там 4000 ещё менее вероятно.
Если мы возьмём достаточную выборку, исходно 100 сумок всё-таки более-менее достаточно, то, скорее всего, вот это число 3 будет достаточно близко к тому, чтобы оценить правильный реальный рэп. На этом же строятся разные подходы к оцениванию тех величин, которые посчитать совсем трудно.
Ну, например, представьте себе, что вы купили кекс с изюмом, как водится. А вот сколько в нём изюминок? Но мой сын, когда ему задал эту задачу, предложил опустить кекс, например, в чай или в какую-то жидкость, чтобы всё мучное полностью растопилось, просто выглядел туда изюм и посчитать. Но если кекс большой, вы же понимаете, что это довольно много придётся изюминок пересчитать. Поэтому что мы можем сделать? Например, вот я беру кекс форме такого брусочка, замерил длину этого брусочка, ну, скажем, 15 сантиметров. Взял и отрезал кусочек в один сантиметр толщины, посчитал, сколько изюминок в нём.
Можно по методу моего сына? Привет! Но дальше мне не нужно считать во всём тексте, да? Я просто взял это количество изюминок, умножил на 15, это и есть тот самый вероятностный подход. При чём здесь вероятность? При том, что мы можем посчитать, ну, с какой вероятностью нам встретится столько-то изюминок в этом кусочке. Оценили, ну и дальше взяли.
Опять же пропорционально на эту же тему работает ещё более крутое исследование, которое мне всё время очень запало в душу. Представьте себе, что у вас есть большое озеро, и в нём плавает рыба. Вам надо сказать, вот сколько рыбы в этом озере. Тут, знаете ли, история с кексом не сработает. Хотя, конечно, может кто-то предложит осушить полностью озеро и посчитать рыбу. Ну, это как слишком пожирательно, воровски.
Если сделать аналогию с кексом, то можно попытаться взять, там, не знаю, 100 кубометров вот этого озера, охватить, допустим, какой-то сетью, вытащить оттуда рыбу. После этого взять вот это количество кубометров, разделить на общее количество кубометров в озере, ну и составить пропорцию. Неплохо, но где гарантия, что рыба распределена равномерно? То есть всё-таки, когда мы говорим про кекс и изюм, они выдаются более-менее случайно. Кстати, похожую задачу я пробовал насчёт изюма и решить шоколадкой с попаданием орешков, но там у меня вероятность никогда хорошо не работала. А потому что почему-то самые ореховые кусочки доставались жене и сыну, а мне вот нет. Видимо, вероятность просто работала против меня.
Но вернёмся к озеру. Можно ли сделать как-то по-другому? Что говорит вероятностный подход? Давайте сделаем следующее: вот возьмём и выловим, допустим, 100 рыб, не будем делать с ними ничего противоестественного, просто их пометим, как-нибудь пометили, отпустили обратно в озеро. Прошёл, допустим, день, рыба как-то более-менее перемешалась, и мы снова выловили с ториевыми. Вот вопрос: сколько из этих рыб будет помечёнными? В том эксперименте, который проводился, оказалось, что 77 рыб помечены. Что же это значит? Это значит, что помечённые рыбы составляют от общего количества рыб примерно 7 процентов.
Конечно, опять же мы говорим о том, что это приблизительные вычисления. Заметьте, что когда мы говорим про рыбу в озере, даже приблизительный ответ – это очень неплохо. Ведь если вас попросить вот сейчас подойти к озеру Байкал и оценить, сколько рыбы там, наверно, кто-то из вас скажет 100,000, а кто-то скажет миллион, а кто-то скажет 10 миллионов. Ошибиться можно на много порядков. Сколько там реально? Посмотрите в Википедии, удивитесь.
С помощью вероятностного подхода мы можем хотя бы примерно оценить эти количества. Если в моем примере 100 – это 7 процентов, 1 процент – это 100 разделить на 7, что-то около 14. Ну и тогда 100 процентов – это 14 умножить на 100, примерно 1400. Понятно, что я взял совсем маленький примерчик, и в реальности, если это не такое маленькое озеро, больше похоже на лужу, а реальное озеро типа Байкала – 100 рыб – это капля в море, а точнее, узи. Реально надо будет выводить, допустим, не 1000 или 10,000 рыб, нам пометить их.
Выборка, которую мы делаем, получается нерепрезентативной, то есть мы не можем сделать нормального вывода по итогам вот этой выборки. Это то же самое, что оценивать количество орешков в шоколадке по одной дольке. По одной дольке, может быть, и 0, может быть, наоборот, и 4 там. Но если вы оцените, допустим, 10 долек среди нити, тогда, наверное, вы получите что-то более разумное.
Ну и ещё немножко про вероятность. Я уверен, что мало кто из вас сталкивается с тем, чтобы оценивать количество рыбы в Балтийском море. Но зато, наверняка, многие из вас видят такое сочетание, как вероятность дождя. Когда вы открываете прогноз погоды, то увидите, что дождь пойдёт там сразу 70 процентов или 30 процентов. И не очень понятно, как на это реагировать. То есть на ноль процентов понятно, как реагировать: видимо, дождя не будет. Хотя мы с вами знаем, что, скорее всего, будет, но это другой вопрос. Если сто процентов, тоже понятно, значит, вот нам обещают дождь.
А что значит 70 процентов? Когда я провёл в школе у себя опрос и спросил: ребята, вот как вы думаете, что означает эти 70 процентов, я получил разные очень интересные трактовки. Несколько учеников считают, что 70 процентов означает, что 7 из 10 синоптиков считают, что пойдёт дождь, а 3 из 10 считают, что не пойдёт. Ну, это логично, потому что даже вроде бы не может пойти на 70 процентов. Он или идёт, или не идёт. Правда, вот берётся 70 процентов, что 7 за и трое против, но это не так.
Есть другое мнение, что 70 процентов – это значит, что если вы возьмёте территорию, допустим, всего города, то на 70 процентов территории дождь пойдёт, а на 30 – нет. Забавно, что с этой точки зрения сталкивался, когда читал разные статьи в интернете на эту тему. Насколько мне, опять же, сказали знакомые синоптики, всё-таки это тоже не так, хотя многие культивируют именно эту точку зрения, что да, вот это касается территории.
Если это так, если какие-то конторы действительно так рассчитывают вероятность, то тогда очень забавный момент, что чем больше вы двигаетесь по городу, тем выше вероятность, что вы попадёте под дождь. Потому что если вы стоите на одном месте, и, допустим, у вас вероятность дождя там 70 процентов, то собирается 30 процентов, вы там, где дождя не будет. Но если вы переезжаете, там, не знаю, по 4 местам в городе, вероятность, что везде, где вы были, не будет дождя, это 0.3 на 0.3 на 0.3 на 0.3, но это, соответственно, намного меньше 0.000801. В этом случае вам нужно лучше всё вообще сидеть дома.
Но на самом деле, насколько я знаю, большинство контор, которые прогнозируют погоду, делают иначе. Давайте заметим, что когда мы пытаемся предсказать поведение такого сложного механизма, как планета Земля, есть куча-куча факторов, которые влияют на то, что будет. Например, завтра скорость и сила ветра, атмосферное давление, может быть, какие-то метеориты, которые прилетают. Да, короче, куча всего влияет, чтобы прогнозировать, что получится.
Да, нужно привести некую модель той системы, которая у нас есть. Дальше мы в эту модель забиваем начальные данные, и после этого смотрим, что происходит с этой моделью, как она будет развиваться в будущем. Мы же с вами понимаем, что вот эти начальные данные могут чуть-чуть отличаться. Условно, скорость ветра может быть 9 метров в секунду, а может быть 10 метров в секунду. И если мы в объём вот эти разные начальные данные, все помнят, что такое эффект бабочки, поменяться может через сутки очень многое, и вместо солнечной погоды можем получить ливень.
И вот так-то и рассчитывается вероятность. То есть представьте себе, что проводится, допустим, 100 случайных экспериментов, где чуть-чуть поменялась скорость ветра, чуть-чуть изменилось там давление, чуть ещё какие-то параметры поменялись, и дальше смотрится вот из этих ста экспериментов 70 дождь пошёл, а в 30 не пошёл. Вот это значит, что в 70 параллельных вселенных дождь будет, а тогда вероятность будет примерно 70 процентов.
Есть ещё один фактор, который мне как раз сообщили знакомые синоптики, и он уже не имеет отношения к математике, что практически во всех прогнозах погоды вероятность дождя всегда завышается. Потому что, ну, если вам скажут, что дождь пойдёт с маленькой вероятностью 10 процентов, а он реально пойдёт, вы будете, скорее всего, сильно огорчены и, может быть, даже разозлены, что вот как же так вас не предупредили, что дождь идёт. Если же наоборот не угадают в другую сторону и вам скажут, что будет дождь, а реально будет солнце, вы вряд ли сильно будете возмущаться на синоптиков. Скорее вы порадуетесь: о, круто, потому что солнце!
Или, как в армянском гидра медик, или с мамой завтра дождь будет. Но я очень надеюсь, что независимо от теории вероятности, буквально через месяц все мы увидим в прогнозе погоды нулевую вероятность дождя. Даже те, кто, как и я, живёт в Питере.
Кстати, в комментариях нам тут недавно писали: «А какова вероятность того, что я поставлю лайк под этим видео?» Ну здесь, как и в случае с шоколадкой, как видите, выборка не совсем репрезентативна. Потому что я уверен, что вероятность того, что ты поставишь лайк под этим видео, равна просто 100 процентам. Ведь это видео классно!
Ну а на этом у нас сегодня всё. Не забывайте подписываться на нас и оставляйте свои комментарии. Приводите свои примеры, где встречается с вероятностью. Мы обязательно на них ответим. Пока-пока!
[Музыка] [Музыка]