Реализация двухфакторного дисперсионного анализа в среде Statistica 10 Рассмотрим данные с результатами тестирования студентов мужского и женского пола по трем тестам: «легкому», «среднему» и «сложному». Данные расположены не случайно, а сгруппированы по полу, по сложности теста, а внутри этих групп – по возрастанию полученного балла:
№
|
Пол
|
Тест
|
Балл
|
1
|
Женщина
|
Легкий
|
64
|
2
|
Женщина
|
Легкий
|
69
|
3
|
Женщина
|
Легкий
|
73
|
4
|
Женщина
|
Легкий
|
90
|
5
|
Женщина
|
Легкий
|
94
|
6
|
Женщина
|
Средний
|
30
|
7
|
Женщина
|
Средний
|
39
|
8
|
Женщина
|
Средний
|
63
|
9
|
Женщина
|
Средний
|
72
|
10
|
Женщина
|
Средний
|
76
|
11
|
Женщина
|
Сложный
|
10
|
12
|
Женщина
|
Сложный
|
25
|
13
|
Женщина
|
Сложный
|
34
|
14
|
Женщина
|
Сложный
|
41
|
15
|
Женщина
|
Сложный
|
60
|
16
|
Мужчина
|
Легкий
|
41
|
17
|
Мужчина
|
Легкий
|
43
|
18
|
Мужчина
|
Легкий
|
53
|
19
|
Мужчина
|
Легкий
|
65
|
20
|
Мужчина
|
Легкий
|
78
|
21
|
Мужчина
|
Средний
|
43
|
22
|
Мужчина
|
Средний
|
45
|
23
|
Мужчина
|
Средний
|
65
|
24
|
Мужчина
|
Средний
|
71
|
25
|
Мужчина
|
Средний
|
96
|
26
|
Мужчина
|
Сложный
|
34
|
27
|
Мужчина
|
Сложный
|
41
|
28
|
Мужчина
|
Сложный
|
60
|
29
|
Мужчина
|
Сложный
|
64
|
30
|
Мужчина
|
Сложный
|
71
|
Создадим в программе Statistica таблицу, куда внесем данные из примера. Выберем меню Statistics/ANOVA.
В диалоге Quick в окне Type of analysis укажем Factorial ANOVA, а в окне Specification method укажем Quick specs dialog (Рис.7.10).
Рис.7.10 Стартовое окно для проведения многофакторного анализа
Нажав «OK», переходим в следующий диалог.
Во вкладке Quick необходимо указать столбцы с факторами и исследуемыми признаками, а также необходимые коды факторов.
Нажав кнопку Variables (Переменные), в окне Dependent variables list укажем столбец - Балл, а в окне Categorical predictors (factor) - столбцы -Пол и Тест (в этом и подобном окнах, если нужно выбрать несколько переменных, то их можно выделять щелчком мыши на их названии при нажатой клавише Ctrl). Нажимаем «OK».
В диалоге Factor codes для обоих факторов выбираем All (Рис. 7.11).
Рис. 7.11 Выбор кодов факторов (значений переменных Пол и Тест, для которых будет выполняться анализ). В обоих случаях нажаты кнопки All (Все)
Очередное «OK» переводит в окно ANOVA Results 1.
Кнопка All effects выводит таблицу дисперсионного анализа (Рис.7.12).
Рис.7.12 Основная таблица результатов двухфакторного анализа
Как видно из таблицы, влияние признака Пол незначимо, но и влияние признака Тест, и взаимодействие Пол*Тест оказывается значимым.
Чтобы понять, в чем заключается такое взаимодействие, полезно построить график с помощью кнопки All effects/Graphs в окне ANOVA Results 1. В открывающемся диалоговом окне выбираем строку Пол*Тест.
Программа предлагает два варианта построения графика: с отображением на оси абсцисс признака Тест или признака Пол.
Приведем оба варианта (Рис.7.13 и Рис. 7.14).
Рис. 7.13 Вариант графика, отражающего взаимодействие факторов, в котором на оси абсцисс показан признак Пол, а точки, соответствующие определенным значениям признака Тест, показаны линиями
Рис.7.14 Вариант графика, отражающего взаимодействие факторов, в котором на оси абсцисс показан признак Тест, а точки, соответствующие определенным значениям признака Пол, показаны линиями
Очевидно, что проще работать со вторым из графиков. Линиями на нем показаны результаты испытуемых двух полов.
Из графика видно, что женщины хорошо решают легкие тесты, при решении средних тестов они получают плохие результаты, а в случае сложных тестов их результаты опять повышаются.
Реакция мужчин другая: легкие тесты они решают хорошо, на тестах средней сложности результат практически такой же, а сложные тесты они решают лучше всего.
Итак, вывод о том, что пол человека не влияет на результаты тестов, нуждается в корректировке. Нет оснований утверждать, что один пол сдает тесты хуже или лучше, чем другой; зато ясно, что мужчины реагируют на усложнение тестов совсем иначе, чем женщины. Значит, пол все-таки влияет на баллы, но не повышая или понижая оценку, а меняя реакцию на изменение другого фактора.
6. Литература:
Гланц С. Медико-биологическая статистика. Пер. с англ.-М.: Практика, 1998. - 459 с.
Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов / В.Е. Гмурман. - М.: высшая школа, 2003. - 479 с.
Жижин К.С. Медицинская статистика: Учебное пособие / К.С. Жижин. - Ростов н/Д: Феникс, 2007. - 160 с.
Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине и биологии: Руководство. В 2-х томах / Под ред. Ю.М. Комарова. Т. 1. Теоретическая статистика. - М.: Медицина, 2000. - 412 с.
Основы высшей математики и математической статистики: Учебник / И.В. Павлушков и соавт. - М.: ГЭОТАР-МЕД, 2004. - 424 с.
Халафян А.А. Statistica 6. Статистический анализ данных. 3-е изд. Учебник - М.: ООО «Бином-Пресс», 2007. - 512 с.
Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. - СПб.: ВМедА, 2002. - 266 с.
Контроль:
Тесты
Занятие №8
Тема: Статистические методы в эпидемиологическом анализе. Анализ заболеваемости по факторам риска.
Цель: применение методов корреляционного анализа при анализе заболеваемости по факторам риска.
Задачи обучения: сформировать навыки установления корреляционной зависимости методом наименьших квадратов, а также оценки силы, направленности и достоверности полученного коэффициента корреляции.
Основные вопросы темы:
Почему для количественной оценки факторов риска используется корреляционный анализ?
Что представляет собой корреляционная зависимость?
Как вычисляется линейный коэффициент корреляции?
Какие виды корреляционной зависимости Вы знаете?
Как определяется достоверность коэффициента корреляции?
Методы обучения и преподавания: письменное выполнение индивидуальных заданий.
Задача 1.
В одном населенном пункте зарегистрировано наличие хронической эпидемии дизентерии Флекснера. Предварительный анализ и лабораторные исследования показали, что в питьевой воде водопроводной сети наблюдаются частые «проскоки» нестандартных проб по бактериологическим показателям (фактор риска).
Необходимо проверить гипотезу о наличии связи между этими двумя признаками, сделать выводы. Исходные данные представлены в таблице:
Месяц
|
Число больных дизентерией (х)
|
Доля нестандартных проб воды (у)
|
Январь
|
10
|
0
|
Февраль
|
9
|
0,5
|
Март
|
2
|
1,1
|
Апрель
|
7
|
2,0
|
Май
|
6
|
1,8
|
Июнь
|
11
|
2,9
|
Июль
|
26
|
6,7
|
Август
|
32
|
4,5
|
Сентябрь
|
46
|
8,7
|
Октябрь
|
38
|
7,1
|
Ноябрь
|
8
|
3,2
|
Декабрь
|
5
|
0
|
Задача 2.
Вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде и жесткостью воды. Оценить достоверность связи. Сделать вывод. Исходные данные представлены в таблице:
Жесткость воды (в градусах)
|
Количество кальция в воде (в мл/л)
|
4
|
28
|
8
|
56
|
11
|
77
|
27
|
191
|
34
|
241
|
37
|
262
|
Задача 3.
Проведено изучение зависимости заболеваемости инфарктом миокарда по месяцам года в зависимости от среднемесячной температуры воздуха.
Вычислить коэффициент корреляции, определить направление и силу связи между показателями. Оценить достоверность связи. Сделать вывод. Исходные данные представлены в таблице:
Месяц
|
Заболеваемость инфарктом миокарда по месяцам
(на 10 000 тыс. жителей)
|
Среднемесячная температура воздуха
|
Январь
|
1,6
|
-7,1
|
Февраль
|
1,23
|
-7,7
|
Март
|
1,14
|
-5,8
|
Апрель
|
1,13
|
-4,1
|
Май
|
1,12
|
+13
|
Июнь
|
1,02
|
+14,9
|
Июль
|
0,91
|
+18,8
|
Август
|
0,82
|
+15,6
|
Сентябрь
|
1,06
|
+9,0
|
Октябрь
|
1,22
|
+6,0
|
Ноябрь
|
1,33
|
-1,0
|
Декабрь
|
1,4
|
-7,7
|
Цель анализа заболеваемости по факторам риска:
проверка гипотез о причинах, вызывающих заболевание;
выявление факторов, определяющих риск заражения и заболевания людей;
установление типов эпидемий.
Для количественной оценки факторов риска используется корреляционный анализ, показывающий характер и тесноту связи между заболеваемостью и возможной ее причиной.
Достарыңызбен бөлісу: |