Глава 21.
Кластерный анализ
306
Блок
f
— определяет меру расстояния по метрике города (см. главу 23);
Минковского
f
— определяет меру расстояния Минковского (см. главу 23);
Настроенная
f
— позволяет задавать пользовательскую меру расстояния.
Процедура стандартизации выбирается в раскрывающемся списке
Стандартизация
.
По умолчанию выбран пункт
Нет
, однако в случаях, когда переменные представ-
лены в разных шкалах (единицах измерения) стандартизация необходима, и чаще
всего выбирают пункт
z-значения
. Оставшиеся пункты, в которых допускается ва-
рьирование среднего значения или стандартного отклонения распределения, могут
привести к другим результатам; выбор какого-либо из них определяется степенью
его применимости к исследуемым данным и удобством для исследователя.
В группе
Преобразовать значения
по умолчанию установлен переключатель
По
переменным
, и в большинстве случаев менять его на альтернативный (
По наблюде-
ниям
) нет необходимости.
В группе
Мера преобразования
имеются три флажка, позволяющих изменить зна-
чения переменных:
Взять модуль
,
Сменить знак
и
Привести к 0–1
.
Последняя из четырех функциональных кнопок окна
Иерархический
кластерный
анализ
— кнопка
Сохранить
— открывает диалоговое окно
Иерархический
кластер-
ный
анализ
:
Сохранить
, показанное на рис. 21.5. С помощью этого окна можно со-
здавать новые переменные, значения которых будут указывать принадлежность
наблюдений кластерам.
Рис. 21.5.
Диалоговое окно Иерархический кластерный анализ: Сохранить
Если установлен переключатель
Нет
, никакого сохранения в процессе анализа не
производится. Иначе при выполнении анализа будут созданы переменные, которые
окажутся в конце файла. Если поставить переключатель в
Одно
решение
и указать
в поле число 3, то получим новую переменную, значение которой равно 1, 2 или
3 в зависимости от того, какому кластеру будет принадлежать соответствующий
объект в решении. Если же установить переключатель
Диапазон
решений
, в поле
Минимальное число кластеров
указать число 3, а в поле
Максимальное число кла-
стеров
— число 5, это приведет к созданию трех новых переменных: первая будет
принимать значения от 1 до 3, вторая — от 1 до 4, третья — от 1 до 5.
Пошаговые алгоритмы вычислений
307
В следующем примере проводится кластерный анализ с несколькими допол-
нительными параметрами, обсуждавшимися выше. В качестве идентификатора
используется переменная
марка
. Все остальные переменные файла задействуются
для вычисления расстояния между объектами. Мы включим в выводимые резуль-
таты последовательность слияния и дендрограмму, но исключим диаграмму на-
копления. Значения всех переменных нормализуем для того, чтобы придать им
равные веса и привести к одной шкале. В качестве расстояния между объектами
зададим квадрат Евклидова расстояния, а в качестве метода кластеризации — меж-
групповое связывание. Кроме того, мы создадим новую переменную, в которой
сохраним решение с тремя кластерами.
ШАГ 5
После выполнения шага 4 должно быть открыто диалоговое окно
Ие-
рархический
кластерный
анализ
, показанное на рис. 21.1. Если вы уже
успели поработать с этим окном, щелкните на кнопке
Сброс
.
Щелкните сначала на переменной
1.
марка
, а затем — на нижней кноп-
ке со стрелкой, чтобы переместить переменную в поле
Метить зна-
чениями
.
Щелкните сначала на переменной
2.
цена
и, нажав на клавиатуре
кнопку
Shift
, щелкните на переменной
пробег
. В результате окажут-
ся выделенными все оставшиеся в списке переменные.
Щелкните на верхней кнопке со стрелкой, чтобы переместить вы-
3.
деленные переменные в список
Переменные
.
Щелкните на кнопке
4.
Графики
, чтобы открыть диалоговое окно
Иерар хический
кластерный
анализ
:
Графики
, показанное на рис. 21.3.
Установите флажок
5.
Дендограмма
и переключатель
Нет
в группе
Со-
сульчатая диаграмма
. Щелкните на кнопке
Продолжить
, чтобы вер-
нуться в диалоговое окно
Иерархический
кластерный
анализ
.
Щелкните на кнопке
6.
Метод
, чтобы открыть диалоговое окно
Иерар-
хический
кластерный
анализ
:
Метод
, показанное на рис. 21.4.
В списке
7.
Метод
оставьте выбранным пункт
Межгрупповые
связи
,
в списке
Стандартизация
выберите пункт
z-значения
и щелкните на
кнопке
Продолжить
, чтобы вернуться в диалоговое окно
Иерархиче-
ский
кластерный
анализ
.
Щелкните на кнопке
8.
Сохранить
, чтобы открыть диалоговое окно
Иерар-
хический
кластерный
анализ
:
Сохранить
, показанное на рис. 21.5.
Установите переключатель
9.
Одно
решение
, введите в расположенное
рядом поле значение 3 и щелкните на кнопке
Продолжить
, чтобы
вернуться в
Иерархический
кластерный
анализ
.
Щелкните на кнопке
10.
OK
, чтобы открыть окно вывода.
В следующем примере проводится кластерный анализ, в котором вместо объек-
тов участвуют переменные. Мы используем данные файла
TestIQ.sav
, содержащего
11 переменных
и1
, ...,
и11
. Обратите внимание на следующее обстоятельство. Обыч-
но при группировании переменных исследователя интересует их взаимосвязь, а не
их различие (сходство), как при группировании объектов. Исключением является
|