Руководство по анализу данных с помощью самой мощной и популярной



Pdf көрінісі
бет236/304
Дата10.10.2024
өлшемі8,54 Mb.
#206058
түріРуководство
1   ...   232   233   234   235   236   237   238   239   ...   304
Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Представление результатов
В этом разделе представлены фрагменты выводимых данных, сгенерированные 
программой при выполнении шагов 5 и 5а.
После выполнения шага 5 в окне вывода появится показанная на рис. 21.6 та-
блица 
Шаги агломерации
. В этой таблице вторая колонка 
Кластер
объединен
с
со-


Глава 21. 
Кластерный анализ
310
держит первый (
Кластер 1
) и второй (
Кластер 2
) столбцы, которые соответствуют 
номерам кластеров, объединяемых на данном шаге. После объединения кластеру
присваивается номер, соответствующий номеру в колонке 
Кластер
1
. Так, на пер-
вом шаге объединяются объекты 5 и 14, и кластеру присваивается номер 5, далее 
этот кластер на шаге 3 объединяется с элементом 4, и новому кластеру присваи-
вается номер 4 и т. д. Следующая колонка 
Коэффициент
содержит значение рас-
стояния между кластерами, которые объединяются на данном шаге. Колонка 
Этап
первого
появления
кластера
показывает, на каком шаге до этого появлялся первый 
и второй из объединяемых кластеров. Последняя колонка 
Следующий
этап
пока-
зывает, на каком шаге снова появится кластер, образованный на этом шаге.
Рис. 21.6.
Таблица шагов агломерации
Как видно по таблице, на первом этапе происходит объединение в кластер пары 
объектов, расстояние между которыми является наименьшим. На втором этапе 
SPSS снова подсчитывает расстояния между объектами и объединяет в кластер 
пару наиболее близких объектов; при этом в результате может получиться либо 
один кластер из трех объектов, либо два кластера из двух объектов. Процесс слия-
ния продолжается до тех пор, пока все объекты не попадут в один кластер. Попро-
буем объяснить результаты, полученные на этапах 1 и 13.
На этапе 1 происходит объединение объектов 5 и 14
f
. Расстояние между объ-
ектами равно 0,439. Ни один из двух объектов не принадлежит какому-либо 
кластеру, о чем свидетельствуют нули в столбцах 
Cluster 1
(
Кластер 1
) и 
Cluster 2
(
Кластер 2
) колонки 
Stage
Cluster
First
Appears
(
Этап
первого
появления
кластера
). 
Следующим этапом для данного кластера, судя по столбцу 
Next
Stage
(
Следую-
щий
этап
), является этап 3, на котором к кластеру присоединяется объект 4.
На этапе 13 происходит объединение кластеров
f
, содержащих объекты 1 и 3
Объект 1 был объединен с кластером, содержащим объект 2 на этапе 9, а объ-


Представление результатов
311
ект 3 — с объектами 7 и 13 на этапе 10. Расстояние между объединяемыми на 
этом этапе кластерами равно 9,656. Образованный на этом этапе кластер по-
является далее на следующем шаге.
По таблице шагов агломерации можно предварительно оценить число кластеров. 
Для этого необходимо проследить динамику увеличения расстояний по шагам кла-
стеризации и определить шаг, на котором отмечается резкое возрастание расстоя-
ний. Оптимальному числу классов соответствует разность между числом объектов 
и порядковым номером шага, на котором было обнаружено резкое возрастание 
расстояний. Так, в нашем примере это обнаруживается при переходе от шага 12 
к шагу 13. Следовательно, наиболее оптимальное количество кластеров должно 
быть получено на шаге 12 или 13. Оно равно численности объектов минус номер 
шага, то есть 15 – 12 = 3 или 15 – 13 = 2, то есть 3 или 2 кластера. Выбор того или 
иного решения зависит уже от содержательных соображений.
Дендограмма представляет процесс кластеризации в форме древовидной структу-
ры (рис. 21.7).


Достарыңызбен бөлісу:
1   ...   232   233   234   235   236   237   238   239   ...   304




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет