21 Кластерный анализ
297
Сравнение кластерного и факторного анализов
298
Этапы кластерного анализа
300
Кластерный анализ матрицы различий (сходства)
302
Пошаговые алгоритмы вычислений
309
Представление результатов
313
Завершение анализа и выход из программы
Программа SPSS реализует три метода кластерного анализа:
Двухэтапный кластер-
ный анализ
(TwoStep),
Кластеризация К-средними
(K-means) и
Иерархическая класте-
ризация
(Hierarchical).
Двухэтапный кластерный анализ позволяет выявить группы (кластеры) объек-
тов по заданным переменным, если эти группы действительно существуют. При
этом программа автоматически определяет количество существующих кластеров
(групп). Если невозможно однозначно определить количество кластеров, все объ-
екты помещаются в один.
Кластеризация К-средними разбивает по заданным
переменным все множество
объектов на заданное пользователем число кластеров так, чтобы средние значения
для кластеров по каждой из переменных максимально различались.
Иерархическая кластеризация, как наиболее гибкий из рассматриваемых методов,
позволяет детально исследовать структуру различий между объектами и выбрать
наиболее оптимальное число кластеров. В силу этого иерархический кластерный
анализ применяется наиболее часто и будет нами рассмотрен более подробно.
Зачастую описание нового статистического метода удобно проводить путем его
сравнения с другим методом. Именно таким образом мы и начнем рассмотрение
иерархического кластерного анализа, сравнивая его с факторным анализом. При
многочисленных общих чертах между указанными
статистическими методами
существует немало различий. Если вы еще не знакомы с понятием факторного
анализа, настоятельно рекомендуем вам обратиться к началу главы 20, посколь-
ку далее мы займемся сравнительной характеристикой факторного и кластерного
анализов. Как обычно, после теоретической части последуют примеры практиче-
ской реализации статистических методов средствами SPSS, оформленные в виде
пошаговых процедур.