Инт. теорема Лапласа





Здравствуйте Александр! В задачах раздела "Интегральная теорема Лапласа" рассматриваются дискретные случайные величины. Плотность распределения такой величины это ступенчатый график. В диапазоне от k до k+1 плотность вероятности f(k) остается постоянной, а далее она ступенчато изменяется. Вероятность для k событий равна площади прямоугольника с основанием от k до k+1 и высотой f(k) => P(k)=f(k)*(k+1-k)=f(k)*1. Это в идеале. В реальности, с помощью инт.теоремы Лапласа мы ищем площадь под кривой f(x) с основанием от k до k+1. Т.е. мы интегрируем f(x) от k до k+1. Для 2-х событий k и k+1 вероятность равна интегралу f(x) в диапазоне от k до k+2. В общем случае, вероятность событий в диапазоне от k до k+n равна интегралу f(x) от k до k+n+1. Если бы мы искали вероятность с помощью ф.Бернулли, то P=P(k)+P(k+1)....P(k+n). Т.е. диапазон суммирования по ф.Бернулли не равен диапазону интегрирования по ф.Лапласа. Задача №3: Вы интегрируете от 65 до 80. Это диапазон суммирования. Интегрировать необходимо от 65 до 81. Задача №4: Вы интегрируете от 1250 до 1275. Это диапазон суммирования. Интегрировать необходимо от 1250 до 1276. И т.д.


Всего: 20 комментариев.
Добавить комментарий

Александр Емелин    27.02.2017 в 16:13
Здравствуйте, Константин!
Было бы интересно взглянуть на вычисления - вероятнее всего, там образовалась ошибка округления.

Konstantin    27.02.2017 в 20:28
Здравствуйте Александр. Для 0 P(0-105)+(P(106-1000)=0.7019+0.2643=0.9662 - не равно 1! Для 0

Konstantin    27.02.2017 в 20:32
Здравствуйте Александр, в комментарий мой ответ не поместился. Добавил его в первоначальное сообщение.

Александр Емелин    27.02.2017 в 21:55
Спасибо, я проверю данную информацию.

Konstantin    28.02.2017 в 21:08
Здравствуйте Александр, переформулировал свое замечание (см. текст сообщения)

Александр Емелин    01.03.2017 в 00:48
Ещё раз спасибо, но я всё же остановлюсь на "классической" версии ( в частности, уч. пособия Гмурмана) - дабы не путать аудиторию. Дело в том, что через мои руки прошли десятки методичек, и ни в одной из них не говорилось об увеличении диапазона.
Думается, такой вариант вполне допустим, поскольку теорема Лапласа - это ЗАВЕДОМО неточный метод. В случае небольшого количества испытания - да - погрешность велика, однако на этот счёт существуют свои критерии, о которых есть информация в статье.

Konstantin    01.03.2017 в 09:27
Согласен. Лучше не путать аудиторию))) Но у аудитории могут возникнуть вопросы (на примере задачи 5-б). 1) Сумма противоположных событий д.б. равна 1. Почему тогда P=P(мест не хватит)+P(мест хватит)=0.263544+0.700919=0.9644 не равна 1. Куда делись 0.036%? Списать на "заведомую неточность" не получится, т.к. интегрирование ф.Лапласа в диапазоне от 0 до 1000 дает 1. 2) Задачу можно решить 2 способами. 1-й способ дан в статье. 2-й способ - найти вероятность противоположного события и вычесть из единицы. Два разных решения. Почему? Какое решение предпочесть? Ведь 0.036 дают отностительную погрешность 13% для ответа. И Гмурман и статья с решениями задач категоричны. Ответ д.б. один.

Александр Емелин    01.03.2017 в 17:44
Строго говоря, предложенный Вами подход тоже не точен. Провёл экспериментальные расчёты для Примера 5 (студенты в столовой):
1) Теорема Лапласа: вероятность 0 до 105:
0,7019 ("классическая версия")
2) Теорема Лапласа: вероятность 0 до 106:
0,7357 (ваша версия)
3) Более точный расчёт по формуле Бернулли (проверил в Экселе ):
0,7221
Таким образом, в 1-м случае получается недобор, а во 2-м случае - сопоставимый с ним по погрешности перебор.
Но с полной группой событий - дилемма, подумаю, как лучше поступить. Проще всего, будет, конечно, умолчать. Но можно сделать и отдельную справку для продвинутых студентов - даже ссылку на этот топик.

Konstantin    02.03.2017 в 09:15
Конечно метод не точен. Потому что ф.Лапласа уже приближение. Вопрос в том, точнее ли он классического. Из теоретических соображений - д.б.точнее.
1) "0-105" У меня получилось 0.7009. Считал 2 способами, без использования таблиц.
2) "0-106" У меня получилось 0.7365
3) Бернулли: у меня не получилось посчитать. Excel отказывается работать с факториалами > 160 (подскажите как вы сделали). Принимаю ваше значение 0.7221.
Погрешность:
1) 2.9%
2) -2.0% - на 30% точнее

Александр Емелин    02.03.2017 в 09:52
Для подсчёта методом Лапласа удобно использовать встроенную функцию Экселя и, например, мой калькулятор:
mathprofi.ru/files/kalkuljator_localnoi_i_interralnoi_teorem_laplasa.xls

Александр Емелин    02.03.2017 в 10:03
Для точных вычислений применяем функцию БИНОМРАСП к массиву от 0 до 105, затем суммируем результаты, файл запостил здесь:
http://mathprofi.com/messages/626-Test-Primera-5--stati-Lokalnaya-i-integralnaya-teoremy-Laplasa.html

Александр Емелин    02.03.2017 в 10:10
Ваша цитата:
"Погрешность:
1) 2.9%
2) -2.0% - на 30% точнее"
- погрешности будут меняться в зависимости от диапозона интегрирования и от примера к примеру, таким образом, спор о том, что точнее несколько бессмыслен - ведь оба подхода дают приближённый результат. Однако, заметьте, что Ваше предложение не логично, ибо учитывает "лишнего студента", что приведёт тысячи читателей к неслабой такой путанице.
Осталось обдумать и аккуратно рассказать - как тут быть с полной группой событий.

Konstantin    02.03.2017 в 20:48
Цитата "однако, заметьте, что Ваше предложение не логично, ибо учитывает "лишнего студента""
Логика моего предложения основана на свойствах интеграла (см.объяснение выше).
Оно учитывает ВСЕХ студентов в выборке и никого больше.
Интегрирование ведется ДО "лишнего студента". Но "лишнего студента" не включает.
Стандартный метод ведет интегрирование ДО последнего студента в выборке.
"ДО последнего студента" означает, что последний студент из расчета выпадает.
В этом я вижу ошибку.
Цитата "...что приведёт тысячи читателей к неслабой такой путанице."
Путаница у читателей не имеет отношения к правильности или ошибочности метода.

А теперь к вопросу который вызовает использование стандартного метода:
Проблема с полной группой событий.
Проблема не так малозначительна как кажется.
Достаточно разбить группу событий не на 2, а большее число диапазонов.
Пример задачи:
p=0.5, n=500
Найти вероятность для k
0-200;201-220;221-230;231-240;241-250;251-260;261-270;271-280;281-300;301-500.
Как видно сумма всех диапазонов образует полную группу событий.
Вероятность суммы отдельных диапазонов д.б. P=1.
АМ дает P=1
КМ - P=0.9
Как вы объясните студентам куда делись 0.1 ?

Александр Емелин    02.03.2017 в 21:34
"Интегрирование ведется ДО "лишнего студента". Но "лишнего студента" не включает."
При "традиционном" подходе, как видно из решения, используется знаки нестрогих неравенств , то есть оба конца промежутка включаются. Может, когда я напишу учебное пособие, то разберу этот момент подробно, но не в онлайн статье - у меня будет очень много матюков от посетителей сайта - по той причине, что у них не зачли задачи :)

"Вопрос в том, точнее ли он классического."
Если для отдельно взятого интервала "классический" метод имеет тенденцию занижать приближение, то альтернативный подход с таким же успехом на каких-то интервалах занижает, а где-то и сопоставимо завышает результаты. - Как мы видели в конкретном примере.

"Как вы объясните студентам куда делись 0.1 ?"
При данном подходе это накопленная погрешность вычислений, на каждую группу - приходится в среднем 0,01, что вполне и вполне приемлемо.

В случае необходимости более точных вычислений, есть другой инструментарий (тот же Эксель).
В связи с развитием вычислительной техники, метод Лапласа, кстати, можно считать устаревшим - в 80 годах прошлого века даже банальный логарифм было вычислить не так-то просто.

Александр Емелин    02.03.2017 в 21:53
Кстати, при альтернативном подходе, возможно, лучше "идти на компромисс" - т.е. считать от 0 до 105,5 и от 105,5 до 1000. Но всё это требует отдельного исследования.

Александр Емелин    02.03.2017 в 23:14
Кажется, хорошее решение найдено!
1) Когда требуется найти вероятность на определённом отрезке (а это подавляющее большинство задач), то смысла что-то модифицировать - нет; если результат и удастся улучшить, то незначительно. Это не стОит того, чтобы всех путать.
2) Когда исследуется полная группа событий, то нужно внести поправки в промежутки и обозначения; причём допустимо использовать 2 способа. Я уже внёс соответствующую информацию после Примера 5 статьи
http://mathprofi.ru/lokalnaja_i_integralnaja_teoremy_laplasa.html
Таким образом, и гуманитарии целы, и технари сыты :)

Konstantin, большое спасибо за замечания!

Konstantin    03.03.2017 в 09:25
Здравствуйте Александр,
"Кажется, хорошее решение найдено!"
Это не решение, а попытка завуалировать дырку в методе расчета))

"... а мы не учли интервал от 105 до 106. Вот здесь то и пропал кусочек 0,0338"
А почему вы не учли интервал 105-106? На каком основании вы выкинули "кусочек"?

"Когда требуется найти вероятность на определённом отрезке (а это подавляющее большинство задач), то смысла что-то модифицировать - нет"

Обратимся к предложенной мной задаче (см.выше) n=500, p=0.5.
Для большей ясности разобъем диапазон на минимально возможные отрезки: 0-1, 2-3, 4-5 и.т.д.
Сумма вероятностей всех диапазонов:
БМ - 1.00
АМ - 1.00
КМ - 0.5
Куда делись 50% вероятности? Вы ее то же спишете на погрешность метода?
А ответ простой - вы просто не проинтегрировали ПОЛОВИНУ кривой и "обвинили" :) метод Лапласа в неточности.

"если результат и удастся улучшить, то незначительно. Это не стОит того, чтобы всех путать."
Возвращаясь к задаче.
В диапазоне событий на которые приходится 0,999999973 вероятности, АМ дает большую точность.
Увеличим отрезки 0-10,11-20,12-30...
В диапазоне событий на которые приходится 0,99587 вероятности, АМ дает большую точность.
Увеличим отрезки 0-50,51-100,101-150...
В диапазоне событий на которые приходится 0,99999 вероятности, АМ дает большую точность.

Резюмируя
- в диапазоне +/-2σ а может и +/-3σ - АМ обеспечивает большую точность.
- АМ в отличие от КМ при суммировании дает P=1 и не требует объяснений о "пропавшем кусочке"))
- АМ дает одинаковый ответ при прямом и обратном методе (от противоп.события) и не требует ложных обвинений метода Лапласа в неточности.

Александр Емелин    03.03.2017 в 10:37
1) "Это не решение, а попытка завуалировать дырку в методе расчета))"
Хорошо, давайте я буду переправлять Вам все претензии от читателей, которые использовали АМ, отличный КМ, который изложен в стандартных источниках. Вы согласны? :)

2) "А почему вы не учли интервал 105-106? На каком основании вы выкинули "кусочек"?"
Здесь я имел ввиду, что такое решение машинально напрашивается (исходя из изложенной ранее в статье информации). Таким образом, КМ даёт вполне приемлемый ответ - ведь постановка ТИПОВОЙ задачи такова, что нужно найти приближённое решение на достаточно широком интервале. Оно найдено? Найдено - задача решена, и оценка точности здесь не при чём (об её улучшении в условии речи не идёт). Если углубляться в теоретизировании, то, можно ведь отыскать и ещё более точный метод, нежели тот, который Вы предлагаете.
Однако ниже я всё же кратко изложил суть АМ, плюс ссылка этот эпичный топик :) т.е. люди, которым это будет нужно или интересно - разберутся.

3) подавляющее большинство задач - да, спасибо, здесь я внесу правку, что - типовых задач, которые встречаются реально. И все случаи , которые Вы перечислили к ним не относятся (а я за годы практики, перерешал сотни таких задач, если не добрую тысячу). К слову, на слишком малых отрезках можно использовать локальную теорему

4) "АМ дает одинаковый ответ при прямом и обратном методе (от противоп.события) и не требует ложных обвинений метода Лапласа"
А я и на обвинял метода Лапласа - я руководствовался практическими соображениями (см. пп 1, 2 данного поста). Кстати, это и есть концепция всего ресурса - практика. Я не занимаюсь теоретическими вопросами, однако всегда имею их ввиду и готов обсудить.

Konstantin    03.03.2017 в 10:53
Ваши возвражения я если и не принимаю, то понимаю!)))
Спасибо за интересное общение.
Хорошего дня.

Александр Емелин    03.03.2017 в 10:56
Спасибо! - Ваша информация была действительно полезна