Пример. По следующим данным, полагая, что зависимость между признаками линейная, построить уравнение регрессии:
Заболеваемость гриппом на 1000 населения, х
|
352
|
228
|
340
|
300
|
196
|
258
|
237
|
Заболеваемость пневмонией на 1000 населения, у
|
64
|
60
|
52
|
48
|
46
|
41
|
32
|
Решение.
Для определения коэффициентов уравнения регрессии «а» и «b» методом наименьших квадратов составить расчетную таблицу:
№
|
х
|
у
|
ху
|
х2
|
ух
|
ух-уср
|
(ух-уср)2
|
у-ух
|
(у-ух)2
|
1
|
352
|
64
|
22528
|
123904
|
55,89467
|
6,89
|
47,54
|
8,11
|
65,70
|
2
|
228
|
60
|
13680
|
51984
|
45,07266
|
-3,93
|
15,42
|
14,93
|
222,83
|
3
|
340
|
52
|
17680
|
115600
|
54,84738
|
5,85
|
34,19
|
-2,85
|
8,11
|
4
|
300
|
48
|
14400
|
90000
|
51,35641
|
2,36
|
5,55
|
-3,36
|
11,27
|
5
|
196
|
46
|
9016
|
38416
|
42,27988
|
-6,72
|
45,16
|
3,72
|
13,84
|
6
|
258
|
41
|
10578
|
66564
|
47,69089
|
-1,31
|
1,71
|
-6,69
|
44,77
|
7
|
237
|
32
|
7584
|
56169
|
45,85813
|
-3,14
|
9,87
|
-13,86
|
192,05
|
Сумма
|
1911
|
343
|
95466
|
542637
|
343
|
0,00
|
159,45
|
0,00
|
558,55
|
Среднее
|
273
|
49
|
13638
|
77519,6
|
49
|
0,00
|
22,78
|
0,00
|
79,79
|
Рассчет коэффициентов регрессии:
,
.
Уравнение линейной парной регрессии: у=25,17+0,087х
Нахождение теоретических значений «уx» путем подстановки в уравнение регрессии фактических значений «х».
Построение графиков фактических (у) и теоретических значений (ух) результативного признака:
Проверка правильности выбранного уравнения:
,
(р, k, n-k-1)=(0,05; 1; 5)=6,61.
Fнаблкрит, то уравнение регрессии подобрано неверно.
4. Иллюстративный материал: презентация, слайды.
5. Литература:
Гланц С. Медико-биологическая статистика. Пер. с англ.-М.: Практика, 1998. - 459 с.
Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов / В.Е. Гмурман. - М.: Высшая школа, 2003. - 479 с.
Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине и биологии: Руководство. В 2-х томах / Под ред. Ю.М. Комарова. Т. 1. Теоретическая статистика. - М.: Медицина, 2000. - 412 с.
Основы высшей математики и математической статистики: Учебник / И.В. Павлушков и соавт. - М.: ГЭОТАР-МЕД, 2004. - 424 с.
Петри А., Сэбин К. Наглядная медицинская статистика /А. Петри, К. Сэбин; пер. с англ. - М.: ГЭОТАР-Медиа, 2009. - 168 с.
Применение методов статистического анализа для изучения общественного здоровья и здравоохранения: учебное пособие / ред. Кучеренко В.З. - 4-е изд., перераб. и доп. – М.: ГЭОТАР - Медиа, 2011. - 256 с.
6. Контрольные вопросы
1. Из каких этапов состоит регрессионный анализ?
2. Какие виды регрессии Вы знаете?
ЛЕКЦИЯ №6
1. Тема: Планирование и организация статистических исследований.
2. Цель: ознакомить студентов с этапами медико-биологического эксперимента, произвести обзор статистических пакетов, применяемых в биостатистике.
План лекции:
Этапы медико-биологического эксперимента.
Выбор статистического метода обработки данных.
Использование современной вычислительной техники в биостатистике.
Классификация статистических пакетов и современные требования к ним.
3. Тезисы лекции.
Независимо от того, какие задачи ставятся при проведении научного медико-биологического исследования, оно должно проводится в определенной последовательности.
Определяют цель и задачи исследования:
Цель исследования должна быть актуальной для медицинской науки и практики здравоохранения (зачем проводятся исследования?).
Задачи исследования - это конкретизированное, расширенное и уточненное определение цели (как будет достигнута цель?).
Основные этапы медико-биологического эксперимента:
составление плана и программы;
сбор статистического материала (статистическое наблюдение);
обработка собранного материала;
анализ полученных данных.
I этап. Составление плана и программы
План исследования:
Определение объекта наблюдения - статистической совокупности, о которой будут собирать сведения.
Определение места исследования - территории, учреждений.
Определение времени (сроков) проведения исследования.
Определения вида (единовременное, текущее) и метода (сплошной, не сплошной) наблюдения.
Исполнители и руководитель исследования.
Материально-техническое обеспечение исследования.
Оценка стоимости исследования.
Программа исследования:
Определение статистической совокупности, единицы совокупности, единицы наблюдения.
Определение программы наблюдения, т.е. определение первичного статистического документа, содержащего перечень признаков, подлежащих регистрации.
Определение программы разработки материала, т.е. выбор группировки материала и составление макетов разработочных таблиц с различной группировкой признаков.
II этап. Сбор статистического материала (статистическое наблюдение).
Статистическое наблюдение – это регистрация изучаемых единиц на специальных учетных медицинских документах.
Статистическое наблюдение классифицируется:
с учетом полноты охвата единиц совокупности,
с учетом факторов по времени;
по способу наблюдения.
Классификация статистического наблюдения
Признаки классификации
|
Виды наблюдения
|
Учет факторов по времени
|
Текущее (постоянное)
|
Единовременное (одномоментное)
|
Полнота охвата единиц совокупности
|
Сплошное
|
Не сплошное
|
Способ наблюдения
|
Непосредственное наблюдение
|
Выкопировка данных, анамнестический метод
|
III этап. Обработка собранного материала:
Проверка собранного материала на полноту и правильность заполнения учетных документов, устранение дубликатов.
Шифровка (кодирование) путем проставления условного знака около каждого признака.
Раскладка карт по группам в соответствии с шифром, подсчет карт в каждой группе.
Составление общей сводки, т.е. занесение результатов подсчета в макеты таблиц заранее установленной формы для получения сравнительных и обобщающих величин.
IV этап. Анализ полученных данных
Алгоритм анализа:
вычисление показателей (средних и относительных величин);
построение графических изображений, иллюстрирующих полученные данные;
сравнение результатов исследования;
формулировка выводов, заключения и предложений по данному исследованию.
На этом этапе применяются специальные статистические методики:
метод стандартизации,
метод корреляции,
дисперсионный анализ,
дискриминантный анализ и пр.
В процессе медико-биологического исследования очень часто возникает проблема выбора статистического метода, необходимого для решения конкретной задачи.
Статистические методы, применяемые при решении типичных
медико-биологических задач:
Задача
|
Статистический
показатель
|
Метод
|
Оценить принадлежность …
|
варианты к выборке
|
средняя арифметическая (M) и значение отдельной варианты (x)
|
t-критерий Стьюдента
|
Оценить достоверность отличия …
|
двух выборок по величине признака
|
средняя арифметическая (M)
|
сравнение средних
арифметических по t-критерию Стьюдента
|
двух выборок по изменчивости признака
|
дисперсия,
стандартное отклонение,
коэффициент вариации
|
сравнение дисперсий по F-критерию Фишера
|
двух выборок в целом
|
ранги
|
сравнение степени упорядоченности вариант по критериям U-Уилкоксона и Q-Розенбаума
|
эмпирического и теоретического распределений
|
частоты встречаемости вариант
|
сравнение частотных распределений по χ2 -критерию Пирсона
|
Оценить достоверность влияния …
|
фактора на величину признака
|
факториальная и случайная дисперсия, сила влияния
|
дисперсионный анализ по F-критерию Фишера
|
одного признака на другой признак
|
коэффициент регрессии
|
регрессионный анализ по критериям
F-Фишера и t-Стьюдента
|
двух признаков друг на друга (взаимодействие)
|
коэффициент корреляции
|
корреляционный анализ по t-критерию Стьюдента
|
В последнее время к проведению статистического анализа практически всегда привлекаются различные компьютерные статистические пакеты.
Современные международные стандарты практики проведения клинических исследований и практики распространения лекарственных препаратов предъявляют высокие требования к использованию статистических методов при анализе результатов медико-биологических и фармацевтических исследований.
Появление мощных статистических пакетов дало широкий доступ к проведению анализа лицам - профессионалам в своей предметной области, но не имеющим специальной математической подготовки.
В тоже время необходимо отметить, что применение статистических методов является творческой деятельностью и, как любая творческая деятельность требует от биостатистика при выборе методов анализа и интерпретации полученных результатов глубоких знаний не только в области биомедицины, но и математики.
Неадекватное применение мощных математических методов может приводить к ложным выводам.
В связи с этим актуальной является задача выбора адекватных критериев из множества возможных, предоставляемых различными статистическими пакетами, а также правильная интерпретация полученных результатов.
Среди статистических пакетов анализа данных чаще используют следующие три вида программ:
профессиональные пакеты - предназначены для анализа очень больших объемов данных либо для применения узкоспециализированных методов;
универсальные пакеты - рассчитаны на использование для анализа самых различных предметных областей, содержат широкий диапазон статистических методов (Statistica 6.0, StatSoft);
специализированные пакеты - обычно содержат небольшое число статистических методов, наиболее часто используемых в конкретной предметной области (MedStat, Biostat, CIA).
Универсальные пакеты обладают большими мощностями, профессиональным интерфейсом, в то же время их универсальность требует от пользователя достаточной подготовки в области математической статистики для выбора адекватных критериев из большого их разнообразия и правильной интерпретации в терминах конкретной предметной области.
Специализированные пакеты точно адресованы конечному пользователю, однако зачастую они предназначены для решения узкого круга задач.
Остановимся на описании некоторых универсальных статистических пакетов.
1) Система SAS известна с 1976 г. и способна работать под управлением практически любой операционной системы.
Она включает свыше 20 различных программных продуктов, объединенных друг с другом «средствами доставки информации».
Основным достоинством SAS является непревзойденная мощность по набору статистических алгоритмов среди универсальных пакетов.
Кроме того, SAS предоставляет пользователю возможность подключения собственных алгоритмов.
Однако, высокая стоимость системы и малая распространенность ее в Казахстане делает ее малоизвестной среди отечественных специалистов, занимающихся исследованием качества жизни.
2) Пакет SPSS предназначен в первую очередь для статистиков-профессионалов. Он включает развитый аппарат статистического анализа, соизмеримый по мощности с SAS.
Программу SPSS для Windows считают в настоящее время одним из лидеров среди универсальных статистических пакетов.
Алгоритмы шкалирования опросников качества жизни распространяются также в виде скриптов на языке SPSS. Научиться самостоятельно писать подобные алгоритмы может любой специалист без начального программистского образования.
SPSS имеет более 50 типов удобных диаграмм, а также развитые средства подготовки отчетов. Аналитические параметры отображаются на экране в виде простых и понятных меню и диалоговых окон. Его новая «контекстно-ориентированная» справочная система содержит пошаговые инструкции для наиболее важных операций.
В литературных источниках, посвященных исследованию качества жизни, упоминания об использовании SPSS встречаются практически наравне с упоминаниями о SAS.
3) Пакет Statistica 6.0 не стоит использовать пользователю-новичку в статистике, так как он предполагает владение статистической терминологией.
Тем не менее на отечественном рынке этот пакет пользуется популярностью благодаря высокой активности фирмы-разработчика Statsoft, способствующей популяризации пакета.
Ряд авторов считает, что пакет Statistica является хорошо сбалансированным по соотношению «мощность/удобство».
Наличие достаточно широкого спектра функциональных алгоритмов делает его достаточно привлекательным для статистиков-профессионалов.
В частности, он включает в себя ряд непараметрических методов анализа и методы многомерного анализа. В пакете Statistica хорошо развиты средства манипулирования исходными данными, данные легко редактируются.
Сильной стороной пакета является графика и средства редактирования графических материалов.
В пакете представлены сотни типов графиков, матрицы и пиктограммы. Предоставляется возможность разработки собственного проекта графика.
Достарыңызбен бөлісу: |