Глава 21.
Кластерный
анализ
310
держит первый (
Кластер 1
) и второй (
Кластер 2
) столбцы, которые соответствуют
номерам кластеров, объединяемых на данном шаге. После объединения кластеру
присваивается номер, соответствующий номеру в колонке
Кластер
1
. Так, на пер-
вом шаге объединяются объекты 5 и 14, и кластеру присваивается номер 5, далее
этот кластер на шаге 3 объединяется с элементом 4, и новому кластеру присваи-
вается номер 4 и т. д. Следующая колонка
Коэффициент
содержит значение рас-
стояния между кластерами, которые объединяются на данном шаге. Колонка
Этап
первого
появления
кластера
показывает, на каком шаге до этого появлялся первый
и второй из объединяемых кластеров. Последняя колонка
Следующий
этап
пока-
зывает, на каком шаге снова появится кластер, образованный на этом шаге.
Рис. 21.6.
Таблица
шагов агломерации
Как видно по таблице, на первом этапе происходит объединение в кластер пары
объектов, расстояние между которыми является наименьшим. На втором этапе
SPSS снова подсчитывает расстояния между объектами и
объединяет в кластер
пару наиболее близких объектов; при этом в результате может получиться либо
один кластер из трех объектов, либо два кластера из двух объектов. Процесс слия-
ния продолжается до тех пор, пока все объекты не попадут в один кластер. Попро-
буем объяснить результаты, полученные на этапах 1 и 13.
На этапе 1 происходит объединение объектов 5 и 14
f
. Расстояние между объ-
ектами равно 0,439. Ни один из двух объектов не принадлежит какому-либо
кластеру, о чем свидетельствуют нули в столбцах
Cluster 1
(
Кластер 1
) и
Cluster 2
(
Кластер 2
) колонки
Stage
Cluster
First
Appears
(
Этап
первого
появления
кластера
).
Следующим этапом для данного кластера, судя по столбцу
Next
Stage
(
Следую-
щий
этап
), является этап 3, на котором к кластеру присоединяется объект 4.
На этапе 13 происходит объединение кластеров
f
,
содержащих объекты 1 и 3.
Объект 1 был объединен с кластером, содержащим объект 2 на этапе 9, а объ-
Представление результатов
311
ект 3 — с объектами 7 и 13 на этапе 10. Расстояние между объединяемыми на
этом этапе кластерами равно 9,656. Образованный на этом этапе кластер по-
является далее на следующем шаге.
По таблице шагов агломерации можно предварительно оценить число кластеров.
Для этого необходимо проследить динамику увеличения расстояний по шагам кла-
стеризации и определить шаг, на котором отмечается резкое возрастание расстоя-
ний. Оптимальному числу классов соответствует разность между числом объектов
и
порядковым номером шага, на котором было обнаружено резкое возрастание
расстояний. Так, в нашем примере это обнаруживается при переходе от шага 12
к шагу 13.
Следовательно, наиболее оптимальное количество кластеров должно
быть получено на шаге 12 или 13. Оно равно численности объектов минус номер
шага, то есть 15 – 12 = 3 или 15 – 13 = 2, то есть 3 или 2 кластера. Выбор того или
иного решения зависит уже от содержательных соображений.
Дендограмма представляет процесс кластеризации в форме древовидной структу-
ры (рис. 21.7).
Достарыңызбен бөлісу: