Введение в биостатистику


рас- пределения средних случайных выборок



Pdf көрінісі
бет44/76
Дата18.04.2023
өлшемі1,74 Mb.
#174841
1   ...   40   41   42   43   44   45   46   47   ...   76
Байланысты:
ОСНОВЫ БИОСТАТИСТИКИ

рас-
пределения средних случайных выборок
. Если процесс 


96 
отбора выборок и размещение полученных средних на кри-
вой распределения будут продолжены до бесконечности, 
обнаружится, что распределение, действительно, становится 
нормальным. Кривая распределения выборочных средних 
будет нормальной даже в том случае, если изучаемая попу-
ляция не имеет нормального распределения.
Этот принцип известен под названием 
центральной 
предельной теоремы
, которая гласит, что 
независимо от 
формы распределения величин признака в популяции, из ко-
торой были отобраны выборки, кривая распределения вы-
борочных средних всегда будет оставаться нормальной.
Согласно центральной предельной теореме, с увеличением 
размера выборок, кривая распределения выборочных сред-
них все более приближается к нормальной. Кроме того, 
центральная предельная теорема гласит, что средняя всех 
выборочных средних (
x
µ
) равна истинной средней всей по-
пуляции (μ). 
Подобно всем распределениям, распределение выбороч-
ных средних характеризуется не только средней, но и стан-
дартным отклонением. Здесь, как и везде, стандартное от-
клонение является мерой вариабельности, показывающей 
разброс элементов распределения. Это особое стандартное 
отклонение выборочных средних от истинной популяцион-
ной средней, показывающее их меру вариабельности, назы-
вается 
стандартной ошибкой
средней
и обозначается сим-
волом 
СОС или буквой 
m

Чем меньше величина стандарт-
ной ошибки, тем ближе средняя любой конкретной выборки 
к популяционной средней. 
Однако, выборочные средние характеризуются гораздо 
меньшей вариабельностью, по сравнению с индивидуаль-
ными результатами, на основе которых они были получены. 
Например, вычисленные средние уровня холестерина в кро-
ви в двух различных выборках, отобранных из одной и той 
же популяции, будут иметь очень близкие значения. Во вся-
ком случае их значения будут намного ближе друг к другу, 


97 
чем значения уровня холестерина в крови у двух людей, 
случайно отобранных из популяции.
Причина меньшей вариабельности выборочных средних, 
по сравнению с индивидуальными значениями, очевидна. 
Средняя арифметическая усредняет значения нескольких 
индивидуальных значений. Даже при наличиии в выборке 
нескольких крайних (выскакивающих) значений их влияние 
будет в значительной степени сглажено воздействием нор-
мальных значений данной переменной, составляющих 
большинство. Это позволяет делать о выборке достаточно 
обоснованные заключения.
Рассмотрим следующий пример. Предположим нам не-
обходимо сравнить средний рост студентов и студенток-
медиков. Если мы просто отберем 1 студента и 1 студентку 
и сравним их значения роста, то скорее всего рост мальчика 
будет выше роста девочки. Однако, может статься так, что 
выбранная студентка будет выше мальчика. Рост как сту-
дентов, так и студенток подвержен значительной вариации, 
и кривые распределения их значений роста в значительной 
степени наслаиваются друг на друга, если даже средний 
рост мальчиков на 15 см выше роста девочек.
Любая попытка сделать заключение на основе выборок, 
включающих одно единственное наблюдение, разумеется, 
бесмысленна вследствие присущей переменным вариабель-
ности и, как следствие этого, ненадежности. Однако, было 
бы очень удивительно, если бы мы, отобрав по 16 мальчи-
ков и девочек, вдруг выявили, что средний рост девочек 
значительно выше среднего роста мальчиков. Даже при на-
личии среди отобранных студентов небольшого числа не-
обычно высоких девочек и мальчиков с необычно низким 
ростом, их воздействие на значение выборочной средней 
будет очень незначительным.
При повторном отборе нескольких выборок студентов и 
студенток и вычислении выборочных средних мы заметим, 
что их значения от выборки к выборке несколько варьиру-
ют. Однако благодаря эффекту сглаживания, воздействию 


98 
обсужденного явления усреднения эта вариация выбороч-
ных средних значительно сократится, и кривые распределе-
ния выборочных средних роста мальчиков и девочек почти 
не будут наслаиваться друг на друга. Иными словами, в 
сущности, любая отобранная выборка мальчиков и девочек 
будет указывать на то, что, на самом деле, мальчики выше 
девочек.
Таким образом, средние величины являются менее ва-
риабельными, по сравнению с индивидуальными величина-
ми переменных. Мы уже обсудили, что это уменьшение ва-
риабельности является прямым следствием усреднения ин-
дивидуальных значений в выборке. Однако возникает во-
прос, насколько эта вариабельность меньше и отчего зави-
сит ее величина.
Совершенно очевидно, что вариабельность выборочных 
средних будет зависеть от вариабельности индивидуальных 
значений переменной, на основе которых они были вычис-
лены. Чем больше вариабельность индивидуальных значе-
ний, тем более вариабельными будут значения средних 
арифметических. Кажется одинаково обоснованным также 
предположение о том, что вариабельность выборочной 
средней должна зависеть от размера выборки, для которой 
она была рассчитана. Выборка, включающая всего 2 наблю-
дения, лишь отчасти усредняет вариабельность индивиду-
альных значений и в значительно меньшей степени умень-
шает воздействие необычайно высоких или низких значе-
ний переменной. С другой стороны, выборка, включающая 
100 наблюдений, обеспечивает значительно более надеж-
ную защиту средней от воздействия необычных значений, и 
средняя, полученная из такой выборки, будет внушать го-
раздо больше доверия, чем средняя выборки, включающей 
всего 2 наблюдения. 
Таким образом, вариабельность выборочных средних, 
или стандартная ошибка, зависит от двух величин - стан-
дартного отклонения и размера выборки. Отношение между 
ними показано в нижеприведенной формуле:


99 
Как видно из формулы, стандартная ошибка равна стан-
дартному отклонению популяции, деленному на корень 
квадратный из размера выборки. Чем больше значение 
стандартного отклонения, т.е. чем больше наблюдения от-
личаются от средней, тем меньше уверенности в величине 
средней и тем больше стандартная ошибка. Чем больше 
объем выборки, тем больше уверенности в том, что полу-
ченная выборочная средняя будет близка к значению ис-
тинной популяционной средней и тем меньше, соответст-
венно, стандартная ощибка. 
Так как кривая распределения средних случайных выбо-
рок, по определению, является нормальной, все известные 
факты о нормальном распределении и z-значениях могут 
быть использованы для определения вероятности того, что 
выборка будет иметь значение средней выше или ниже оп-
ределенной величины, при условии, что выборка является 
случайной.
Кроме того, так как независимо от формы распределения 
величин переменной в популяции, из которой были произ-
ведены выборки, кривая распределения выборочных сред-
них всегда будет оставаться нормальной, то z-значения мо-
гут быть использованы вне зависимости от формы распре-
деления в популяции, при условии, опять-таки, что выборка 
является случайной.
Методика определения выборочной средней очень схожа 
с методикой определения отдельного элемента- она вклю-
чает нахождение z-значений, соответствующих интересую-
щей нас величине. Однако, вместо вычисления z-значения, 
показывающего на сколько стандартных отклонений от-
дельный элемент лежит выше или ниже популяционной 
средней, в данном случае z-значение будет показывать на 
сколько стандартных ошибок данная выборочная средняя 
лежит выше или ниже популяционной средней. Таким обра-
.


Достарыңызбен бөлісу:
1   ...   40   41   42   43   44   45   46   47   ...   76




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет