Руководство по анализу данных с помощью самой мощной и популярной


Глава 21.  Кластерный анализ 306



Pdf көрінісі
бет234/304
Дата10.10.2024
өлшемі8,54 Mb.
#206058
түріРуководство
1   ...   230   231   232   233   234   235   236   237   ...   304
Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Глава 21. 
Кластерный анализ
306
Блок
f
— определяет меру расстояния по метрике города (см. главу 23);
Минковского
f
— определяет меру расстояния Минковского (см. главу 23);
Настроенная
f
— позволяет задавать пользовательскую меру расстояния.
Процедура стандартизации выбирается в раскрывающемся списке 
Стандартизация

По умолчанию выбран пункт 
Нет
, однако в случаях, когда переменные представ-
лены в разных шкалах (единицах измерения) стандартизация необходима, и чаще 
всего выбирают пункт 
z-значения
. Оставшиеся пункты, в которых допускается ва-
рьирование среднего значения или стандартного отклонения распределения, могут 
привести к другим результатам; выбор какого-либо из них определяется степенью 
его применимости к исследуемым данным и удобством для исследователя. 
В группе 
Преобразовать значения
по умолчанию установлен переключатель 
По 
переменным
, и в большинстве случаев менять его на альтернативный (
По наблюде-
ниям
) нет необходимости.
В группе 
Мера преобразования
имеются три флажка, позволяющих изменить зна-
чения переменных: 
Взять модуль

Сменить знак
и 
Привести к 0–1
.
Последняя из четырех функциональных кнопок окна 
Иерархический
кластерный
анализ
— кнопка 
Сохранить
— открывает диалоговое окно 
Иерархический
кластер-
ный
анализ

Сохранить
, показанное на рис. 21.5. С помощью этого окна можно со-
здавать новые переменные, значения которых будут указывать принадлежность 
наблюдений кластерам. 
Рис. 21.5.
Диалоговое окно Иерархический кластерный анализ: Сохранить
Если установлен переключатель 
Нет
, никакого сохранения в процессе анализа не 
производится. Иначе при выполнении анализа будут созданы переменные, которые 
окажутся в конце файла. Если поставить переключатель в 
Одно
решение
и указать 
в поле число 3, то получим новую переменную, значение которой равно 1, 2 или 
3 в зависимости от того, какому кластеру будет принадлежать соответствующий 
объект в решении. Если же установить переключатель 
Диапазон
решений
, в поле 
Минимальное число кластеров
указать число 3, а в поле 
Максимальное число кла-
стеров
— число 5, это приведет к созданию трех новых переменных: первая будет 
принимать значения от 1 до 3, вторая — от 1 до 4, третья — от 1 до 5.


Пошаговые алгоритмы вычислений
307
В следующем примере проводится кластерный анализ с несколькими допол-
нительными параметрами, обсуждавшимися выше. В качестве идентификатора 
используется переменная 
марка
. Все остальные переменные файла задействуются 
для вычисления расстояния между объектами. Мы включим в выводимые резуль-
таты последовательность слияния и дендрограмму, но исключим диаграмму на-
копления. Значения всех переменных нормализуем для того, чтобы придать им 
равные веса и привести к одной шкале. В качестве расстояния между объектами 
зададим квадрат Евклидова расстояния, а в качестве метода кластеризации — меж-
групповое связывание. Кроме того, мы создадим новую переменную, в которой 
сохраним решение с тремя кластерами.
ШАГ 5
После выполнения шага 4 должно быть открыто диалоговое окно 
Ие-
рархический
кластерный
анализ
, показанное на рис. 21.1. Если вы уже 
успели поработать с этим окном, щелкните на кнопке 
Сброс
.
Щелкните сначала на переменной 
1. 
марка
, а затем — на нижней кноп-
ке со стрелкой, чтобы переместить переменную в поле 
Метить зна-
чениями
.
Щелкните сначала на переменной 
2. 
цена
и, нажав на клавиатуре 
кнопку 
Shift
, щелкните на переменной 
пробег
. В результате окажут-
ся выделенными все оставшиеся в списке переменные.
Щелкните на верхней кнопке со стрелкой, чтобы переместить вы-
3. 
деленные переменные в список 
Переменные
.
Щелкните на кнопке 
4. 
Графики
, чтобы открыть диалоговое окно 
Иерар хический
кластерный
анализ

Графики
, показанное на рис. 21.3.
Установите флажок 
5. 
Дендограмма
и переключатель 
Нет
в группе 
Со-
сульчатая диаграмма
. Щелкните на кнопке 
Продолжить
, чтобы вер-
нуться в диалоговое окно 
Иерархический
кластерный
анализ
.
Щелкните на кнопке 
6. 
Метод
, чтобы открыть диалоговое окно 
Иерар-
хический
кластерный
анализ

Метод
, показанное на рис. 21.4.
В списке 
7. 
Метод
оставьте выбранным пункт 
Межгрупповые
связи

в списке 
Стандартизация
выберите пункт 
z-значения
и щелкните на 
кнопке 
Продолжить
, чтобы вернуться в диалоговое окно 
Иерархиче-
ский
кластерный
анализ
.
Щелкните на кнопке 
8. 
Сохранить
, чтобы открыть диалоговое окно 
Иерар-
хический
кластерный
анализ

Сохранить
, показанное на рис. 21.5.
Установите переключатель 
9. 
Одно
решение
, введите в расположенное 
рядом поле значение 3 и щелкните на кнопке 
Продолжить
, чтобы 
вернуться в 
Иерархический
кластерный
анализ
.
Щелкните на кнопке 
10. 
OK
, чтобы открыть окно вывода.
В следующем примере проводится кластерный анализ, в котором вместо объек-
тов участвуют переменные. Мы используем данные файла 
TestIQ.sav
, содержащего 
11 переменных 
и1
, ..., 
и11
. Обратите внимание на следующее обстоятельство. Обыч-
но при группировании переменных исследователя интересует их взаимосвязь, а не 
их различие (сходство), как при группировании объектов. Исключением является 




Достарыңызбен бөлісу:
1   ...   230   231   232   233   234   235   236   237   ...   304




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет