Правило трех сигм: различия между версиями
Mykola (обсуждение | вклад) |
Mykola (обсуждение | вклад) |
||
(не показано 6 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
− | '''Правило трех сигм (3-sigma rule)''' - правило, утверждающее, что вероятность того, что случайная величина отклонится от своего математического ожидания более чем на три среднеквадратических отклонения, | + | '''Правило трех сигм (3-sigma rule)''' - правило, утверждающее, что вероятность того, что случайная величина отклонится от своего математического ожидания более чем на три среднеквадратических отклонения, не превышает 0,28%. Правило справедливо только для случайных величин, распределенных по нормальному закону. |
+ | |||
+ | Гипотетически, данное правило распространяется на ЛЮБЫЕ физические параметры [[Тело человеческого существа|тела человеческого существа]]. | ||
[[Файл:3-sigma.jpg|600px|thumb|left|Правило трех сигм (3-sigma rule)]] | [[Файл:3-sigma.jpg|600px|thumb|left|Правило трех сигм (3-sigma rule)]] | ||
Строка 14: | Строка 16: | ||
Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения. | Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения. | ||
− | Пусть оценки учеников класса следующие: '''2, 4, 4, 4, 5, 5, 7, 9''' | + | Пусть оценки учеников класса следующие: |
+ | |||
+ | '''2, 4, 4, 4, 5, 5, 7, 9''' | ||
+ | |||
+ | Тогда средняя оценка равна: | ||
− | + | '''m = (2+4+4+4+5+5+7+9) / 8 = 5''' | |
− | |||
Вычислим квадраты отклонений оценок учеников от их средней оценки: | Вычислим квадраты отклонений оценок учеников от их средней оценки: | ||
− | + | '''(2-5)^2 = (-3)^2 =9''' | |
+ | |||
+ | '''(4-5)^2 = (-1)^2 =1''' | ||
+ | |||
+ | '''(4-5)^2 = (-1)^2 =1''' | ||
+ | |||
+ | '''(4-5)^2 = (-1)^2 =1''' | ||
+ | |||
+ | '''(5-5)^2 = 0^2 =0''' | ||
+ | |||
+ | '''(5-5)^2 = 0^2 =0''' | ||
+ | |||
+ | '''(7-5)^2 = 2^2 =4''' | ||
+ | |||
+ | '''(9-5)^2 = 4^2 =16''' | ||
+ | |||
+ | |||
Среднее арифметическое этих значений называется дисперсией: | Среднее арифметическое этих значений называется дисперсией: | ||
− | + | '''sigms^2 = (9+1+1+1+0+0+4+16)/8=4''' | |
+ | |||
+ | |||
Стандартное отклонение равно квадратному корню дисперсии: | Стандартное отклонение равно квадратному корню дисперсии: | ||
− | + | '''sigma=2''' | |
+ | |||
+ | |||
Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7: | Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7: | ||
− | + | '''sigms^2 = (9+1+1+1+0+0+4+16)/7~4.57''' | |
+ | |||
и стандартное отклонение равнялось бы: | и стандартное отклонение равнялось бы: | ||
− | + | '''sigma~2.14''' | |
+ | |||
Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей. | Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей. | ||
+ | |||
+ | |||
+ | |||
+ | == Людей, тела которых обладают "средними" параметрами, на планете Земля не существует == | ||
+ | |||
+ | Все люди «видят» (воспринимают, проявляют, ощущают …) любые объекты «нашего» Мира при помощи множества рецепторов своего «плотного» вещественного тела, данные от которых поступают в мозг и им обрабатываются. Но почему-то один человек способен ощущать тепло только положив руку на горячую сковородку, а другой ощущает тепло кота, который приблизился к нему ближе 100 метров. | ||
+ | |||
+ | Оказывается, что тела у людей все разные и тел, которые представляют собою некую совокупность множества «средних» параметров, в природе не существует и это уже было неоднократно подтверждено многими научными исследованиями. Как пример: | ||
+ | |||
+ | В конце 40-х годов прошлого века у американских военно-воздушных сил возникла серьёзная проблема: пилоты теряли контроль над самолётами. В худшее время разбивалось до 17 пилотов за день. Тщательные исследования показали, что основной причиной многих небоевых аварий (происшествий (incidents) или несчастных случаев (accidents) была стандартизация размера кабины и кресла пилота, созданная на основе тщательного измерения более 4000 пилотов по 140 параметрам размера, включая длину большого пальца, высоту до промежности и расстояние от глаза до уха. В результате они вычислили среднее значение каждого параметра. Все верили, что более тщательное вычисление параметров «среднего» пилота приведёт к созданию более удобного кокпита и уменьшит количество аварий. Но последовавшие за многочисленными авариями исследования показали, что не существовало такого понятия как средний пилот. Если вы проектируете устройство для тела «среднего человеческого существа», то в реальности оно не будет подходить ни для кого. Именно поэтому у каждого космонавта своё персональное кресло… Этот интересный факт более детально описан в книге Тодда Роуза (Todd Rose) «The End of Average. How We Succeed in a World That Values Sameness». |
Текущая версия на 08:34, 29 ноября 2022
Правило трех сигм (3-sigma rule) - правило, утверждающее, что вероятность того, что случайная величина отклонится от своего математического ожидания более чем на три среднеквадратических отклонения, не превышает 0,28%. Правило справедливо только для случайных величин, распределенных по нормальному закону.
Гипотетически, данное правило распространяется на ЛЮБЫЕ физические параметры тела человеческого существа.
На рисунке видно, что в пределах одного среднеквадратического отклонения лежит 68,26% значений, принимаемых нормально распределенной случайной величиной (соответствует доли площади под кривой распределения). В пределах двух среднеквадратических отклонений — уже 95,44%, а в пределах трех — 99,72%. Это означает, что вероятность того, что случайная величина примет значение, отклоняющееся от математического ожидания больше чем на три среднеквадратических отклонения, не превышает 0,28%
В теории вероятностей и статистике среднеквадрати́ческое отклоне́ние — наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания (аналога среднего арифметического с бесконечным числом исходов). Обычно он означает квадратный корень из дисперсии случайной величины, но иногда могут означать тот или иной вариант оценки этого значения.
В литературе обычно обозначают греческой буквой сигма. В статистике принято два обозначения: sigma — для генеральной совокупности и sd (с англ. standard deviation — стандартное отклонение) — для выборки.
Пример вычисления стандартного отклонения
Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.
Пусть оценки учеников класса следующие:
2, 4, 4, 4, 5, 5, 7, 9
Тогда средняя оценка равна:
m = (2+4+4+4+5+5+7+9) / 8 = 5
Вычислим квадраты отклонений оценок учеников от их средней оценки:
(2-5)^2 = (-3)^2 =9
(4-5)^2 = (-1)^2 =1
(4-5)^2 = (-1)^2 =1
(4-5)^2 = (-1)^2 =1
(5-5)^2 = 0^2 =0
(5-5)^2 = 0^2 =0
(7-5)^2 = 2^2 =4
(9-5)^2 = 4^2 =16
Среднее арифметическое этих значений называется дисперсией:
sigms^2 = (9+1+1+1+0+0+4+16)/8=4
Стандартное отклонение равно квадратному корню дисперсии:
sigma=2
Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:
sigms^2 = (9+1+1+1+0+0+4+16)/7~4.57
и стандартное отклонение равнялось бы:
sigma~2.14
Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.
Людей, тела которых обладают "средними" параметрами, на планете Земля не существует
Все люди «видят» (воспринимают, проявляют, ощущают …) любые объекты «нашего» Мира при помощи множества рецепторов своего «плотного» вещественного тела, данные от которых поступают в мозг и им обрабатываются. Но почему-то один человек способен ощущать тепло только положив руку на горячую сковородку, а другой ощущает тепло кота, который приблизился к нему ближе 100 метров.
Оказывается, что тела у людей все разные и тел, которые представляют собою некую совокупность множества «средних» параметров, в природе не существует и это уже было неоднократно подтверждено многими научными исследованиями. Как пример:
В конце 40-х годов прошлого века у американских военно-воздушных сил возникла серьёзная проблема: пилоты теряли контроль над самолётами. В худшее время разбивалось до 17 пилотов за день. Тщательные исследования показали, что основной причиной многих небоевых аварий (происшествий (incidents) или несчастных случаев (accidents) была стандартизация размера кабины и кресла пилота, созданная на основе тщательного измерения более 4000 пилотов по 140 параметрам размера, включая длину большого пальца, высоту до промежности и расстояние от глаза до уха. В результате они вычислили среднее значение каждого параметра. Все верили, что более тщательное вычисление параметров «среднего» пилота приведёт к созданию более удобного кокпита и уменьшит количество аварий. Но последовавшие за многочисленными авариями исследования показали, что не существовало такого понятия как средний пилот. Если вы проектируете устройство для тела «среднего человеческого существа», то в реальности оно не будет подходить ни для кого. Именно поэтому у каждого космонавта своё персональное кресло… Этот интересный факт более детально описан в книге Тодда Роуза (Todd Rose) «The End of Average. How We Succeed in a World That Values Sameness».