Научись решать за несколько дней!

Практикум по теории вероятностей

Научись решать в считанные дни!



1.13. Относительная частота события и статистическая вероятность


Давайте вспомним, с чего всё начиналось:

Вероятность наступления события  в некотором испытании – есть отношение , где:

 – общее число всех равновозможных, элементарных исходов этого испытания, которые образуют полную группу событий;

 – количество элементарных исходов, благоприятствующих событию .

Например:
 –  вероятность того, что в результате броска монеты выпадет «орёл»;
 – вероятность того, что на игральной кости выпадет 5 очков;
 – вероятность того, что из колоды будет извлечена трефа

Внимательный читатель заметил, что все комментарии о вероятностях сформулированы в будущем времени. И это не случайность – классическое определение оценивает вероятность ДО проведения испытаний и даже без их фактического проведения. То есть, монета ещё не подброшена, а вероятность появления орла мы уже знаем. Можно дать зарок никогда не брать в руки кубик либо колоду карт, однако, вероятности событий  беспроблемно рассчитываются и без этого.

Почему такое возможно? Такое возможно потому, что все элементарные исходы известны и подсчитаны заранее:

орёл и решка – итого 2 элементарных исхода;
1, 2, 3, 4, 5, 6 – 6 элементарных исходов;
6, 7, 8, 9, 10, В, Д, К, Т каждой масти – всего 36 карт.

Кроме того, для применения классического определения вероятности необходима равновозможность элементарных исходов (см. определение). Равновозможность выпадения граней монеты либо кубика обуславливается симметрией и несмещённым центром тяжести, колода же карт должна быть полной, некраплёной и хорошо перемешанной.

И всё было бы ладно, но в реальной жизни рассмотренные выше модели встречаются нечасто. В большинстве ситуаций элементарные исходы перечислить затруднительно или невозможно, и ещё труднее обосновать их равновозможность. Простой пример:

Штирлиц пошёл в лес за грибами. Найти вероятность того, что он найдёт подберёзовик.

Совершенно понятно, что все грибы в лесу (общее количество элементарных исходов) пересчитать практически невозможно, а значит, классическое определение вероятности не срабатывает. И даже если группа разведчиков учтёт все грибы в небольшой роще, классифицирует их по видам, то препятствием станет неравновозможность исходов. Почему? Поляна мухоморов намного заметнее, чем замаскировавшиеся подберёзовики…, так, кто это предложил их покрасить в красный цвет? :) …ну что тут сказать? – с такими страна на пропадёт!

Кстати, вспомнилась ещё одна каверзная задачка на счёт неравновозможности исходов. Её суть состоит в следующем: если в городе проживает примерно равное количество мужчин и женщин (которых подсчитать значительно проще =)), то это ещё не значит, что вероятность встретить на улице мужчину либо женщину равна -й. Ибо за углом может быть отделение полиции или швейная фабрика.

А теперь вновь обратим внимание на шаблонные формулировки стандартных задач тервера:

 «Стрелок попадает в мишень с вероятностью 0,8»;
«Вероятность изготовления бракованной детали на данном станке составляет 0,05».

Возникает вопрос, откуда взялись эти значения? И ответ здесь один: данные вероятности могли получиться только на основе ранее проведённых опытов.

Относительной частотой события  называют отношение числа испытаний , в которых данное событие появилось, к общему числу  фактически проведённых испытаний:
, или короче:

Относительная частота наряду с вероятностью является одним из ключевых понятий тервера, но если классическое либо геометрическое определение вероятности не требуют проведения испытаний, то относительная частота рассчитывается ПОСЛЕ опытов и исключительно на основе фактически полученных данных.

В том случае, если серии испытаний проводятся в неизменных условиях, то относительная частота обнаруживает свойство устойчивости, то есть колеблется около определённого значения. Поясню это на конкретных примерах:

Пусть некий профессиональный стрелок произвёл 100 выстрелов по мишени и попал 83 раза. Тогда относительная частота поражения цели составит: .

Предположим, что тот же самый стрелок в точно такой же «форме» и в приблизительно таких же условиях снова провёл серию из 100 выстрелов. Вероятно ли, что он снова попадёт 83 раза? Не очень. Но количество попаданий вряд ли будет сильно отличаться от предыдущего результата. Пусть, например, стрелок попал 79 раз. Тогда относительная частота поражения цели составит: .
В третьей серии из 100 выстрелов, проведённой при похожих обстоятельствах, данный стрелок попал 81 раз,  и т.д.

Иногда будут случаться блестящие серии более 90 попаданий, иногда «провалы», но среднее количество попаданий будет варьироваться около 80. И когда количество фактически проведённых испытаний станет достаточно большим, то речь зайдёт о статистической вероятности.

Если в одинаковых (примерно одинаковых) условиях проведено достаточно много испытаний, то за статистическую вероятность события принимают относительную частоту данного события либо близкое число.

Предположим, что на протяжении нескольких лет наш спортсмен, сохраняя стабильный уровень подготовки, совершил 10000 выстрелов и попал 8037 раз. Относительная частота поражения цели составит:  и за статистическую вероятность его результативности целесообразно принять , которая становится теоретической оценкой, например, перед грядущими соревнованиями.

Именно так и собирается богатая спортивная статистика в различных видах спорта.

Аналогичная история с утверждением «Вероятность изготовления бракованной детали на данном станке равна 0,05».

Эту оценку невозможно получить с помощью классического определения вероятности – она следует только из практики! Если на станке произведены десятки тысяч деталей и на каждую, скажем, тысячу выпущенных деталей, приходится в среднем 50 бракованных, то в качестве статистической вероятности брака принимается значения .

В Задаче 76 фигурировала вероятность рождения мальчика . Откуда взялось данное значение? Из многолетнего подсчёта фактически рождённых детей в определённом регионе. Но это вовсе не означает, что среди 100 новорожденных будет ровно 52 мальчика. В следующей сотне рождённых их может оказаться, например, 45, и относительная частота  будет далека от истины.
Но если рассмотреть выборку в тысячи и десятки тысяч младенцев, то  отклонится от  совсем-совсем незначительно. И это уже не случайность. Как известно, такое соотношение новорожденных сложилось эволюционно – по причине бОльшей смертности мужчин.

В учебном пособии В.Е. Гмурмана есть весьма удачный пример, в котором продемонстрировано, как при подбрасывании монеты относительная частота появления орла приближается к своей вероятности  (полученной по классическому определению:

Таким образом, с увеличением количества независимых испытаний
случайность превращается в закономерность

Вернёмся к рулетке. В отдельно взятом сеансе игры отдельно взятый человек может выиграть, причём выиграть по-крупному. Это случайность. Но, совершая миллионы и миллионы оборотов, рулетка на протяжении веков приносит неизменную прибыль владельцам казино. И это закономерность.

Существует байка о том, что крупный выигрыш не отдадут, а если и отдадут, то «вы с ним не дойдёте до дома». Чисто житейская фантазия. Да, кому-то повезло, но сколько проиграется?! К тому же человек, посещающий подобные заведения, с большой вероятностью придёт снова и «сольёт» ещё больше. А чтобы он вернулся, казино, скорее наоборот – создаст максимальный комфорт и безопасность для «счастливчика». Ибо на длинной дистанции разорятся ВСЕ игроки.

Другой пример. Пусть в некой лотерее приняло участие  билетов, из которых  выиграли хоть какой-то приз. Таким образом, относительная частота выигрыша составила: . Поскольку билетов продано очень много, то с большой вероятностью можно утверждать, что в будущем, при сопоставимых объемах продаж, доля выигравших билетов будет примерно такой же, и за статистическую вероятность выигрыша удобно принять значение .

Организатор лотереи знает, что из миллиона проданных билетов выиграют около 300 тысяч с небольшим отклонением. Этот факт важен для грамотного распределения призового фонда, и это закономерность. Но всем участникам лотереи достаётся….
– правильно, случайность! То есть, если вы купите 10 билетов, то это вовсе не значит, что выиграют 3 билета. Так, выигрыш только по одному билету – есть событие очень даже вероятное, по формуле Бернулли:

А если учесть тот факт, что львиная доля выигрышей – сущая мелочь, то картина вырисовывается совсем унылая. Ситуацию спасают красочные телевизионные розыгрыши и различные психологические трюки.  

Желающие могут самостоятельно исследовать вероятность выигрыша в различные лотереи – вся статистика есть в свободном доступе ;) И, говоря откровенно, вас просто поразит это чудовищное надувательство. Впрочем, рулетка гораздо коварнее.

Практическая часть параграфа будет тесно связана с только что изложенным материалом:

Вероятность отклонения относительной частоты от вероятности

Вероятность того, что в  независимых испытаниях относительная частота
 события  отклонится от вероятности  (появления данного события в каждом испытании) не более чем на , приблизительно равна:
, где  – функция Лапласа.

Эта формула следует из интегральной теоремы Лапласа.

Итак, расклад следующий: в распоряжении имеется вероятность  наступления события , которая предварительно получена с помощью классического/геометрического определения или посредством серьёзной статистической оценки. Планируется провести  независимых испытаний, в которых событие  может наступить некоторое количество раз, причём значение , разумеется, предсказать нельзя. Полученная относительная частота  может оказаться как больше, так и меньше вероятности  (поэтому нужен знак модуля).

Требуется найти вероятность того, что в серии из  независимых испытаний, расхождение между относительной частотой и теоретической вероятностью , будет не больше, чем заранее заданное число, например, не больше, чем .

Возвращаемся к любимой задаче:

Задача 79
В некотором регионе в результате многолетнего статистического исследования установлена вероятность рождения мальчика . С какой вероятностью можно утверждать, что среди следующей тысячи новорожденных, относительная частота появления мальчика отклонится от соответствующей вероятности не более чем на 0,02?

Решение: используем формулу

По условию, .  Таким образом:

 – искомая вероятность.

Напоминаю, что значения функции Лапласа можно найти по соответствующей таблице или с помощью Калькулятора (Пункт 5).

Ответ:
Каков смысл полученного результата? Если рассмотреть достаточно много групп по 1000 новорожденных в каждой, то примерно в 79,6% этих групп доля мальчиков будет находиться в пределах:

или, умножая все три части неравенства на тысячу: от 500 до 540 мальчиков.

И на самом деле рассмотренная задача эквивалентна следующей: «Найти вероятность того, что среди 1000 новорожденных будет от 500 до 540 мальчиков, если вероятность рождения мальчика равна 0,52». А эта задача как раз и решается через разобранную выше интегральную теорему Лапласа.

Следующая задача для самостоятельного решения:

Задача 80
Производится некоторый опыт, в котором случайное событие  может появиться с вероятностью 0,6. Опыт повторяют в неизменных условиях  раз. Определить вероятность того, что в 800 независимых испытаниях относительная частота появления события  отклонится от вероятности не более чем: а) на 0,05, б) на 0,03

Условие сформулировано в общем виде, как оно чаще всего и бывает. Ещё раз повторим суть задания: проводится  опытов, в результате чего событие  наступит  раз – сколько именно, предугадать невозможно. Относительная частота составит . С другой стороны, известна вероятность  события , которая установлена ранее с помощью классического / геометрического определения или путём сбора солидной статистики. Требуется найти вероятность  – того, что относительная частота отклонится от вероятности, не более чем на .
В чём смысл? С найденной вероятностью  можно утверждать, что относительная частота будет заключена в следующих пределах:

или в абсолютном количестве появлений события , умножаем все части на 800:

 (от 440 до 520 появлений в 800 испытаниях)

Для  этот промежуток будет меньше (найдите самостоятельно), и логично, что уменьшиться вероятность того, что  примет значение из этого, более узкого промежутка.
На практике не менее популярна обратная задача, её можно сформулировать следующим образом: Как определить, сколько нужно провести испытаний , чтобы с заранее заданной вероятностью  обеспечить желаемую точность ?
Задача 81
Проводится некоторый опыт, в котором случайное событие  может появиться с вероятностью 0,4. Определить, сколько опытов нужно провести, чтобы с вероятностью большей, чем 0,9 можно было ожидать отклонения относительной частоты появления события  от  не более чем на 0,05.

Решение: используем ту же формулу , но на этот раз нам известны величины:

По условию, требуется найти такое количество опытов , чтобы с вероятностью бОльшей чем  разница  составила не более чем . Ну, а коль скоро с вероятностью «бОльшей», то задачу следует разрулить через строгое неравенство:
 – подставляем известные значения и делим обе части на два:

По таблице значений функции  либо с помощью Калькулятора (Пункт 5*, этот способ будет точнее) по известному значению функции  находим соответствующий аргумент: . Таким образом:

Возведём обе части в квадрат:

, и финальный штрих:

Ответ: для того, чтобы с вероятностью большей, чем 0,9, можно было ожидать отклонения  , нужно провести более 259 опытов.

2.1. Случайные величины

1.12. Интегральная теорема Лапласа

| Оглавление |



Полную и свежую версию этой книги в pdf-формате,
а также курсы по другим темам можно найти здесь.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

С наилучшими пожеланиями, Александр Емелин




© mathprofi.ru / com, 2010-2022, Высшая математика – просто и доступно!