Байланысты: А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011
297 Сравнение кластерного и факторного анализов Главное сходство между кластерным и факторным анализами заключается в том,
что тот и другой предназначены для перехода от исходной совокупности мно-
жества переменных (или объектов) к существенно меньшему числу факторов
(кластеров). Тем не менее реализация статистических процедур и интерпретация
результатов для двух типов анализа различаются; пять основных отличий при-
ведены ниже.
Целью факторного анализа является замена большого числа исходных пере-
f
менных меньшим числом факторов. Кластерный анализ, как правило, при-
меняется для того, чтобы уменьшить число объектов путем их группировки.
Другими словами, в процедуре кластерного анализа обычно переменные не
группируются, а выступают в качестве критериев для группировки объектов.
Так, в примере факторного анализа (см. главу 20) 11 субтестов интеллекта (пе-
ременных) были сведены к трех факторам, каждый из которых объединил не-
сколько родственных исходных переменных. Кластерный анализ обычно при-
меняется для выделения групп объектов, исходя из их сходства по измеренным
признакам. Применительно к примеру с 11 субтестами интеллекта типичной
задачей кластерного анализа была бы классификация учащихся (объектов) та-
ким образом, чтобы по измеренным 11 показателям внутри каждой группы
объекты были бы более похожи друг на друга, чем на объекты из других групп.
Группы объектов, выделенные в результате кластерного анализа на основе за-
данной меры сходства между объектами, называются кластерами.
Заявленные в предыдущем пункте различия между кластерным и факторным
f
вариантами анализа со всей полнотой категоричности могут быть отнесены
лишь к ранним версиям SPSS. Начиная с версии SPSS 10.0, программа позво-
ляет с равным успехом проводить кластерный анализ не только объектов, но
и переменных. В последнем случае кластерный анализ может выступать как
более простой аналог факторного анализа. В разделе пошаговых процедур мы
продемонстрируем оба варианта кластерного анализа.
Действия, выполняемые в ходе статистических операций в каждом из вари-
f
антов анализа, принципиально различаются. В факторном анализе на каж-
дом этапе извлечения фактора для каждой переменной подсчитывается доля
дисперсии, которая обусловлена влиянием данного фактора. При кластерном
анализе вычисляется расстояние между текущим объектом и всеми остальны-
ми объектами, и кластер образует та пара, для которой расстояние оказалось
наименьшим. Подобным образом каждый объект группируется либо с другим
объектом, либо включается в состав существующего кластера. Процесс кла-
стеризации конечен и продолжается до тех пор, пока все объекты не будут
объединены в один кластер. Разумеется, подобный результат в общем случае