Байланысты: А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011
Глава 21. Кластерный анализ
302 достаточно заменить в строке
VALUE
LABELS
ROWTYPE_
слово
DISIMILARITY
на слово
SIMILARITY
.
Пошаговые алгоритмы вычислений Структура раздела пошаговых процедур принципиально ничем не отличается от
аналогичных разделов в других главах книги: шаги 1–4 являются подготовитель-
ными для выполнения анализа, шаги 6–7 требуются для печати результатов и за-
вершения работы программы, а несколько вариантов (в данном случае два) шага 5
соответствуют разным способам выполнения статистической операции. Снача-
ла мы продемонстрируем вариант использования кластерного анализа объектов
с включением в вывод нескольких интересующих нас величин. Второй вариант
шага 5 проиллюстрирует кластерный анализ переменных. В нем мы вновь обра-
тимся к файлу
TestIQ.sav
для того, чтобы вы имели возможность сравнить кластер-
ный анализ переменных с факторным анализом, описанным в предыдущей главе.
При проведении кластерного анализа сначала выполняются три подготовительных
шага. Эти шаги (шаги 1–3) позволят подготовить рабочий файл данных, запустить
программу
IBM SPSS
Statistics 19
и открыть файл (в данном случае — файл
cars.sav
).
Пошаговые инструкции этого процесса приведены в главе 4 (с. 60), а подробные
разъяснения — в главе 2.
После завершения шага 3 на экране должно присутствовать окно редактора дан-
ных со строкой меню и загруженным файлом
cars.sav
.
ШАГ 4 В меню
Анализ
выберите команду
Классификация
4
Иерархическая
кла-
стеризация
. Откроется диалоговое окно
Иерархический
кластерный
ана-
лиз
, показанное на рис. 21.1.
Ваши дальнейшие действия в значительной степени зависят от того, какой тип
кластеризации вы выберете. Для этой цели в группе
Кластеризовать
предусмотре-
ны два переключателя:
Наблюдения
и
Переменные
. Вначале в списке
Переменные
указываются имена тех переменных, значения которых будут использоваться при
кластеризации. В нашем примере в список
Переменные
следует поместить все
переменные, кроме переменной
марка
, поскольку последняя представляет собой
марку автомобиля. Далее следует задать способ идентификации объектов. Как
правило, в роли идентификатора выступает переменная, содержащая уникальный
номер объекта или его имя в виде строки. В данном случае мы будем использовать
вполне подходящую для этого переменную
марка
. Имя идентифицирующей пере-
менной указывается в поле
Метить значениями
.
Если вместо переключателя
Наблюдения
в группе
Кластеризовать
установить пере-
ключатель
Переменные
, в списке
Переменные
потребуется указать кластеризуемые
переменные, а поле
Метить значениями
останется пустым. По умолчанию флаж-
ки
Статистики
и
Графики
в группе
Вывести
установлены, и в большинстве случаев
нет необходимости их сбрасывать. В правой части диалогового окна расположены
4 кнопки, предназначенные для задания дополнительных параметров команды.