Руководство по анализу данных с помощью самой мощной и популярной


Глава 21.  Кластерный анализ 308



Pdf көрінісі
бет235/304
Дата10.10.2024
өлшемі8,54 Mb.
#206058
түріРуководство
1   ...   231   232   233   234   235   236   237   238   ...   304
Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Глава 21. 
Кластерный анализ
308
случай, когда данные представляют собой оценки объектов экспертами — тогда 
строки соответствуют экспертам, а столбцы оцениваемым объектам. Поскольку 
в нашем примере интерес представляют именно взаимосвязи между переменными, 
и мы хотим сравнить результаты с факторным анализом, то в качестве меры близо-
сти целесообразно выбрать корреляцию. При этом корреляции надо учитывать по 
абсолютной величине, так как большие (по модулю) отрицательные их величины 
так же свидетельствуют о связи, как и большие положительные. Все это необхо-
димо иметь в виду, если речь идет о кластеризации переменных. Большинство 
остальных параметров команды оставим установленными по умолчанию; даже 
в стандартизации в данном случае нет необходимости, так как на величину корре-
ляции не влияют единицы измерения переменных. Добавим лишь дендрограмму 
в выводимые результаты и исключим оттуда сосульчатую диаграмму. Обратите 
внимание, поскольку для выполнения анализа необходим файл 
TestIQ.sav
, а не 
cars.
sav
, который использовался в предыдущем примере, мы начинаем с шага 3а.
ШАГ 3А
Откройте файл данных, с которым вы намерены работать (в нашем слу-
чае — это файл 
TestIQ.sav
). Если он расположен в текущей папке, то вы-
полните следующие действия.
Выберите в меню 
1. 
Файл
команду 
Открыть
4
Данные
или щелкните на 
кнопке 
Открыть
файл данных
панели инструментов.
В открывшемся диалоговом окне дважды щелкните на имени 
2. 
TestIQ.
sav
или введите его с клавиатуры и щелкните на кнопке 
OK
.
ШАГ 4А
В меню 
Анализ
выберите команду 
Классификация
4
Иерархическая
кла-
стеризация
. Откроется диалоговое окно 
Иерархический
кластерный
ана-
лиз
, показанное на рис. 21.1.
ШАГ 5А
После выполнения предыдущего шага должно быть открыто диалоговое 
окно 
Иерархический
кластерный
анализ
. Если вы уже успели поработать 
с этим окном, щелкните на кнопке 
Сброс
.
В группе 
1. 
Кластеризовать
установите переключатель 
Переменные
.
Нажмите кнопку мыши на переменной 
2. 
и1
и, не отпуская кнопки, пере-
тащите указатель на переменную 
и11
, затем кнопку мыши отпустите. 
В результате окажутся выделенными все 11 переменных 
и1

и2
, ..., 
и11
.
Щелкните на верхней кнопке со стрелкой, чтобы переместить вы-
3. 
деленные переменные в список 
Переменные
.
Щелкните на кнопке 
4. 
Графики
, чтобы открыть диалоговое окно 
Иерар-
хический
кластерный
анализ

Графики
, показанное на рис. 21.3.
Установите флажок 
5. 
Дендограмма
и переключатель 
Нет
в группе 
Со-
сульчатая диаграмма
. Щелкните на кнопке 
Продолжить
, чтобы вер-
нуться в диалоговое окно 
Иерархический
кластерный
анализ
.
Щелкните на кнопке 
6. 
Метод
, чтобы открыть диалоговое окно 
Иерар-
хический
кластерный
анализ

Метод
, показанное на рис. 21.4.


Представление результатов
309
В ниспадающем списке 
7. 
Интервальная
выберите пункт 
Корреляция
Пирсона
, а в группе 
Мера преобразований 
установите флажок 
Взять 
модуль
. Щелкните на кнопке 
Продолжить
, чтобы вернуться в диало-
говое окно 
Иерархический
кластерный
анализ
.
Щелкните на кнопке 
8. 
OK
, чтобы открыть окно вывода.
Эта процедура реализует кластерный анализ 11-ти показателей теста интеллекта. 
В выводимые данные включается такая информации о переменных, как число на-
блюдений, число пропущенных значений и т. п. Затем выводятся шаги агломе-
рации (объединения в кластеры) и горизонтальная дендрограмма. Рекомендуем 
сравнить полученные результаты с результатами факторного анализа в главе 20.
После выполнения шага 5 (5а) программа автоматически откроет окно вывода. Для 
просмотра результатов при необходимости можно воспользоваться вертикальной 
и горизонтальной полосами прокрутки. Обратите внимание на стандартную стро-
ку меню в верхней части окна вывода: ее присутствие позволяет выполнять любые 
статистические операции, не переключаясь обратно в окно редактора данных.
В следующем примере кластерный анализ проводится с применением языка Син-
таксис.
ШАГ 3б
Создайте файл Синтаксис, как это описано в разделе «Кластерный ана-
лиз матрицы различий (сходства)» в этой главе, или откройте файл 
примера 
Synt_Clust.sps
. Если он расположен в текущей папке, то выпол-
ните следующие действия.
Выберите в меню 
1. 
Файл
команду 
Открыть
4
Синтаксис
.
В открывшемся диалоговом окне дважды щелкните на имени 
2. 
Synt_
Clust.sps
. Откроется редактор синтаксиса с текстом команд.
Выберите в меню команду 
3. 
Запуск
4
Все
.
После выполнения шага 3б будет создан и открыт новый файл данных, содержа-
щий матрицу 8 
×
8 попарных различий 8 объектов. Кроме того, будет открыто 
окно вывода, содержащее результаты кластерного анализа этих 8 объектов мето-
дом средней связи (между группами). В окне редактора данных вы можете заме-
нить представленную матрицу своими данными и выполнить кластерный анализ, 
отредактировав открытое окно редактора синтаксиса. Для этого надо просто уда-
лить все строки с начала до строки 
CLUSTER
и запустить команду 
Запуск
4
Все
.


Достарыңызбен бөлісу:
1   ...   231   232   233   234   235   236   237   238   ...   304




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет