ДИСПЕРСИОННЫЙ АНАЛИЗ
Нередко задачей биомедицинских исследований является
сравнение более чем двух групп, например, сравнение ре-
зультатов лечения трех групп пациентов, получавших лече-
ние по различным схемам. Если каждая из сравниваемых
групп включает пациентов молодого и пожилого возраста,
исследователь может также провести сравнение между воз-
растными группами, и в итоге получит 6 сравниваемых
групп, три группы с различными схемами лечения с двумя
возрастными группами в каждой из них. Нулевая гипотеза в
этом случае будет утверждать, что:
Ho:
μ
1
=
μ
2
=
μ
3
=
μ
4
=
μ
5
=
μ
6
.
127
Теоретически эта гипотеза может быть проверена с ис-
пользованием множественного t-теста. Однако, этот метод
имеет ряд недостатков. Во-первых, он требует больших за-
трат времени, так как включает проведение 15 отдельных t-
тестов. Кроме того, статистическая чувствительность каж-
дого теста будет сравнительно низкой, а вероятность воз-
никновения ошибки I типа будет высокой.
К счастью, имеется статистический метод, который пре-
одолевает все эти проблемы. Это - дисперсионный анализ
(ANOVA
, аббревиатура от Anlysis of Variance), который в
настоящее время используется достаточно часто. В сущно-
сти, рассмотренный нами t-тест является частным случаем
дисперсионного анализа, позволяющим выявить различия
только между двумя группами. Дисперсионный анализ – это
более общий случай исследования различий, когда возмож-
но, сравнение более чем двух групп. В случае простого
сравнения двух групп результат применения дисперсионно-
го анализа совпадает с результатом сравнения по t-
критерию.
Вычисления, лежащие в основе дисперсионного анализа
достаточно длинны и не входят в данный курс. Однако,
вкратце суть дисперсии можно свести к следующему. Дис-
персия характеризует разброс, или вариабельность, значе-
ний переменной. В любой совокупности результатов иссле-
дования, например, в результатах, полученных от использо-
вания трех различных схем лечения у молодых и пожилых
пациентов, обсужденных ранее, будет иметь место вариа-
бельность изучаемой переменной. Это общая вариабель-
ность переменной обусловлена двумя компонентами. Во-
первых, она обусловлена вариабельностью, возникающей
вследствие известной разницы между группами (межгруп-
повая вариабельность), в нашем примере, разницей между
различными схемами лечения, а также разницей между воз-
растными группами. Вторым компонентом, обусловливаю-
щим общую вариабельность переменной в результатах ис-
следования, является обычная вариабельность изучаемой
128
переменной в пределах каждой группы (внутригрупповая
вариабельность), возникающая вследствие индивидуального
различия между пациентами, ошибки выборочного иссле-
дования и т.д.
Дисперсионный анализ дает возможность определить,
является ли выявленная в результатах исследования общая
вариабельность в значительной степени обусловленной
изучаемым различием между группами. Иными словами,
дисперсионный анализ позволяет ответить на вопрос, при-
надлежат ли сравниваемые группы к одной и той же попу-
ляции или они отобраны из различных популяций. Если все
выборки принадлежат одной и той же популяции, то меж-
групповая вариабельность должна быть не больше, чем ва-
риабельность переменной внутри самих выборок. Если же
сравниваемые группы принадлежат разным популяциям и,
следовательно, между ними существует значительное раз-
личие, то дисперсия между различными группами должна
быть значительно больше, по сравнению с колебанием ве-
личины переменной в пределах отдельных групп.
Если исследование было проведено правильно, это раз-
личие между изучаемыми группами должно быть вследст-
вие использования различных схем лечения или различия в
возрасте пациентов.
Таким образом, дисперсионный анализ позволяет опре-
делить является ли дисперсия выборочных средних относи-
тельно общей средней для всей совокупности данных дос-
товерно большей, по сравнению с дисперсией переменной
относительно средней в пределах каждой выборки. Делает-
ся это посредством вычисления простого соотношения, на-
зываемого F-соотношением (F-ratio):
межгрупповая дисперсия
внутригрупповая дисперсия
Однако, начинается статистический анализ, как всегда, с
формулирования нулевой и альтернативной гипотез. Нуле-
F =
129
вая гипотеза будет утверждать, что между изучаемыми пе-
ременными, в нашем примере - между результатом лечения
и использованной схемой лечения, а также между результа-
том и возрастом пациентов, связи нет. Альтернативная ги-
потеза будет утверждать обратное.
На втором этапе вычисляется F-соотношение, показы-
вающее отношение межгрупповой дисперсии к внутригруп-
повой.
Затем, как обычно, при проверке гипотезы определяются
критические значения для F. Полученная величина F
выч.
сравнивается с критическим значением F
крит.
, найденным в
таблице F-значений. Как и в случае t-теста, если вычислен-
ное значение превышает табличное значение, соответст-
вующее определенной величине
α, то нулевая гипотеза
должна быть отвергнута.
Таким образом, F-тест – это тест соотношения диспер-
сий, и он используется в дисперсионном анализе для выяс-
нения, существует ли статистически значимое различие ме-
жду изучаемыми группами. Иными словами, существуют
ли, кроме обычной внутригрупповой дисперсии перемен-
ной, значительные источники ее дисперсии в совокупности
данных.
F-
тесты иногда используются отдельно от метода дис-
персионного анализа для проверки гипотез о различии меж-
ду дисперсиями переменной в различных группах. Напри-
мер, может возникнуть необходимость сравнения диспер-
сии уровня гемоглобина в крови больных, получавших раз-
ные препараты против анемии.
Если многочисленные сравниваемые группы отличаются
друг от друга только по одной переменной, например, по
виду использованной схемы лечения, то используется од-
номерный дисперсионный анализ (One-way ANOVA).
Если же сравниваемые группы отличаются одновременно
по двум переменным, используется двухмерный дисперси-
онный анализ (Two-way ANOVA). Например, этот стати-
стический метод анализа понадобится, если группы пациен-
130
тов отличаются не только по виду использованной схемы
лечения, но и по возрасту. В этом случае ANOVA покажет
не только то, имеется ли важный источник вариабельности
в результатах, но и то обусловлено ли это воздействием од-
ной переменной, другой переменной или обеих переменных
вместе взятых. В случае установления факта воздействия
только одной из изучаемых переменных, говорят об основ-
ном эффекте. Eсли значительным является эффект от ком-
бинированного воздействия двух переменных, то это эф-
фект взаимодействия. Эффект взаимодействия возникает в
случаях, когда эффект обеих переменных, вместе взятых,
отличается от суммы их индивидуального воздействия.
При необходимости изучения различий между группами,
отличающимися по нескольким переменным, может быть
использован многофакторный дисперсионный анализ (Mul-
tifactor ANOVA).
Достарыңызбен бөлісу: |