315
Дискриминантный анализ
и составе классов. В дискриминантном анализе изначально заданы количество
и состав классов, и основная задача заключается в определении того, насколько
точно можно предсказать принадлежность объектов к классам при помощи данно-
го набора дискриминантных переменных (предикторов).
Дискриминантный анализ представляет собой
альтернативу множественного
регрессионного анализа (см. главу 18) для случая, когда зависимая переменная
представляет
собой не количественную, а номинальную переменную. При этом
дискриминантный анализ решает, по сути, те
же задачи, что и множественный
регрессионный анализ: предсказание значений «зависимой» перемененной (в дан-
ном случае — категорий номинального признака) и определение того, какие «не-
зависимые» переменные лучше всего подходят для такого предсказания. Дискри-
минантный анализ основан на составлении уравнения регрессии (см. главы 17
и 18), использующего номинальную зависимую переменную (обратите внимание
на то, что она не является количественной, как в случае регрессионного анали-
за). Уравнение регрессии составляется на основе тех объектов, о которых известна
групповая принадлежность, что позволяет максимально точно подобрать его коэф-
фициенты. После того как уравнение регрессии получено, его можно использовать
для группировки интересующих нас объектов в целях прогнозирования их принад-
лежности к какому-либо классу. Команда дискриминантного анализа весьма непро-
ста и требует настройки множества параметров, описание большинства из которых
лежит за рамками темы данной книги. Тем не менее при необходимости вы можете
обратиться за дополнительной информацией к руководству пользователя SPSS.
Как и для большинства сложных статистических операций, параметры дискрими-
нантного анализа в основном определяются особенностями данных, а также задача-
ми исследователя. Как всегда, мы рассмотрим пример (на этот раз единственный)
проведения дискриминантного анализа в разделе пошаговых процедур, а раздел
«Представление результатов» посвятим интерпретации выводимых данных.
Для демонстрации дискриминантного анализа мы рассмотрим пример прогнози-
рования успешности обучения на основе предварительного тестирования. Файл
class.sav
содержит данные о 46 учащихся (объекты с 1 по 46), юношей и девушек
(переменная
пол
), закончивших курс обучения, в
отношении которых известны
оценки успешности обучения — для этого используется переменная
оценка
(1 —
низкая, 2 — высокая). Кроме того, в файл включены данные предварительного
тестирования этих учащихся до начала обучения (13 переменных):
и1
f
,
...
,
и11
— 11
показателей теста интеллекта;
э_и
f
— показатель экстраверсии по тесту Г. Айзенка (H. Eysenck);
н
f
— показатель нейротизма по тесту Г. Айзенка.
Еще для 10 претендентов на курс обучения (объекты с 47 по 56) известны лишь ре-
зультаты их предварительного тестирования (13 перечисленных переменных). Зна-
чения переменной
оценка
для них, разумеется, неизвестны, и в файле данных им
соответствуют пустые ячейки. В процессе дискриминантного анализа мы, в част-
ности, попытаемся спрогнозировать успешность обучения этих 10 претендентов
в предположении, что выборки закончивших обучение и претендентов идентичны.