Глава 18.
Множественный регрессионный анализ
256
Для проведения множественного регрессионного анализа сначала необходимо вы-
полнить три подготовительных шага. Эти шаги (шаги 1–3) позволят подготовить
рабочий файл данных, запустить программу
IBM SPSS
Statistics 19
и открыть файл
(в данном случае — файл
ex020.sav
). Пошаговые инструкции этого процесса при-
ведены в главе 4 (с. 60), а подробные разъяснения — в главе 2.
После завершения шага 3 на экране должно присутствовать окно редактора дан-
ных со строкой меню и загруженным файлом
help.sav
.
ШАГ 4
В меню
Анализ
выберите команду
Регрессия
4
Линейная
. На экране по-
явится
диалоговое окно
Линейная
регрессия
, показанное на рис. 18.1.
Рис. 18.1.
Диалоговое окно Линейная регрессия
В верхней части диалогового окна расположено поле
Зависимая
переменная
, пред-
назначенное для указания единственной переменной-критерия. Ниже следует спи-
сок
Независимые
переменные
, заполняемый одной или несколькими независимы-
ми переменными, число которых теоретически не ограничено. С помощью кнопки
Следующий
, расположенной справа от метки
Блок 1
из 1
, вы можете задать не один,
а несколько наборов предикторов и тем самым провести одновременно несколько
вариантов регрессионного анализа. Как только вы определите все независимые
переменные и установите необходимые параметры анализа, щелчок на кнопке
Сле-
дующий
приведет к очистке списка
Независимые
переменные
, который будет готов
к принятию нового набора предикторов. После того
как вы зададите все блоки
независимых переменных и щелкните на кнопке
OK
, SPSS выполнит все варианты
регрессионного анализа и сгенерирует результаты для каждого из них. Обратите
внимание, что во всех вариантах анализа, проводимых одновременно, должна быть
Пошаговые алгоритмы вычислений
257
общая зависимая переменная, иначе процедуру регрессии каждый раз пришлось
бы запускать заново.
Важным элементом диалогового окна
Линейная
регрессия
является раскрываю-
щийся список
Метод
. Пункты этого списка определяют алгоритмы включения не-
зависимых переменных в уравнение регрессии.
Принудительное включение
f
— метод, применяющийся по умолчанию. Все неза-
висимые переменные включаются в уравнение независимо от степени их кор-
реляции с переменной-критерием.
Включение
f
— пошаговое включение переменных с проверкой на значимость их
частной корреляции с критерием. В результате в уравнение включаются все пе-
ременные, имеющие значимую частную корреляцию с переменной-критерием.
Включение производится в
порядке возрастания p-уровня.
Исключение
f
— пошаговый метод, сначала включающий в уравнение регрессии
все независимые переменные, а затем поочередно удаляющий все переменные,
чья корреляция с критерием имеет уровень значимости выше заданного поро-
гового значения. Как правило, пороговым значением является
p = 0,1.
Шаговый отбор
f
— комбинация пошаговых методов включения и исключения.
Основной идеей является изменение доли влияния независимой переменной
на критерий при появлении в уравнении других независимых переменных.
Если влияние какой-либо из включенных переменных
становится слишком
слабым, она исключается из уравнения. Подобный метод используется при
регрессионном анализе наиболее часто.
Блочное исключение
f
— это метод принудительного удаления переменных. Он
требует предварительного задания метода
Включение
в качестве предыдущего
блока, например
Блок 1
из 1
. При задании следующего блока, в данном случае
Блок 2
из 2
, в список
Независимые
переменные
вы сможете ввести те независи-
мые переменные, которые хотите исключить из уравнения регрессии. При вы-
полнении команды вы получите результат со всеми заданными переменными,
а затем — результат с удаленными переменными. Если в анализе участвуют не-
сколько блоков, то можно задавать операцию удаления после каждого из них.
Окно и кнопка
Переменная отбора наблюдений
дадут возможность выбрать груп-
пирующую переменную для задания подгруппы наблюдений, в отношении кото-
рой будет проводиться анализ.
Кнопка
Графики
используется для графического отображения остатков. Кнопка
Статистики
открывает диалоговое окно
Линейная
регрессия
:
Статистики
, показанное
на рис. 18.2. По умолчанию в окне установлены два флажка. Флажок
Оценки
вклю-
чает в вывод коэффициенты
B, стандартные коэффициенты регрессии
β
, а также
соответствующие стандартные ошибки,
t-критерии и уровни значимости. Флажок
Согласие модели
генерирует значения множественного коэффициента корреляции
R,
величину R
2
, таблицу дисперсионного анализа, соответствующие
F-величины
и уровни их значимости. Таким образом, указанные флажки отвечают за генера-
цию основных элементов регрессионного анализа.