Руководство по анализу данных с помощью самой мощной и популярной


Глава 21.  Кластерный анализ 300



Pdf көрінісі
бет230/304
Дата10.10.2024
өлшемі8,54 Mb.
#206058
түріРуководство
1   ...   226   227   228   229   230   231   232   233   ...   304
Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Глава 21. 
Кластерный анализ
300
методы объединения объектов, однако мы не станем рассматривать их в этой 
книге. При необходимости обратитесь к руководству пользователя SPSS.
Интерпретация результатов
4. 
. Как и в случае факторного анализа, желаемое 
число кластеров и оценка результатов анализа зависят от целей исследователя. 
Для рассматриваемого примера нам представляется наиболее предпочтитель-
ным число кластеров, равное 3. Как показывает анализ, все марки можно разде-
лить на 3 группы: первая группа имеет высокую стоимость (среднее значение — 
15 230), небольшой срок эксплуатации (4 года) и средний пробег (85 400 км). 
Вторая группа имеет среднюю стоимость, небольшой пробег, наибольший воз-
раст, но хорошее техническое состояние. Третья группа содержит недорогие 
модели с большим пробегом и невысоким рейтингом технического состояния.
Кластерный анализ 
матрицы различий (сходства)
Довольно часто исходной информацией для кластерного анализа являются не дан-
ные типа «объекты-переменные», а непосредственно данные о различии (сходстве) 
объектов. Например, респондент может оценивать различие (сходство) объектов, 
предъявляемых попарно, с перебором всех пар объектов. Или данными могут быть 
частоты совместной встречаемости для каждой пары объектов. В этих случаях ис-
ходные данные представляют собой квадратную матрицу, как правило, симметрич-
ную относительно главной диагонали, каждый элемент которой — мера различия 
(или сходства) пары объектов, которым соответствует строка и столбец матрицы.
К сожалению, кнопочный интерфейс программы SPSS не позволяет обрабатывать 
матрицы различий методами кластерного анализа (в многомерном шкалировании 
это возможно). Поэтому для обработки таких данных следует обратиться к ко-
мандному языку 
Синтаксис
(
Syntax
).
В SPSS предусмотрен формат данных для матрицы различия (сходства). При по-
мощи синтаксиса такая матрица создается следующим образом
1
. Для создания 
командного файла 
Синтаксис
необходимо открыть окно редактора синтаксиса, вы-
брав команду 
Открыть
4
Синтаксис
в меню 
Файл
. Предположим, необходимо создать 
матрицу различий 8 
×
8 с именами объектов 
a
b
c
d
e
f
g
h
. Для этого в открытом 
окне 
Редактор синтаксиса
следует ввести следующий текст (не важно, прописными 
иди строчными буквами):
DATA LIST FREE /ROWTYPE_(a8) VARNAME_(a8) a b c d e f g h.
BEGIN DATA
PROX A 0 6 2 7 18 0 1 5
PROX B 6 0 14 3 8 4 19 14
1
Решение проблемы заимствовано с сайта 
http://www.spsstools.ru
(
А. Балабанов
, Raynald's SPSS 
Tools по-русски).


Кластерный анализ матрицы различий (сходства)
301
PROX C 2 14 0 30 12 4 6 8
PROX D 7 3 30 0 1 16 3 4
PROX E 18 8 12 1 0 19 13 14
PROX F 0 4 4 16 19 0 5 1
PROX G 1 19 6 3 13 5 0 16
PROX H 5 14 8 4 14 1 16 0
END DATA.
EXECUTE.
VALUE LABELS ROWTYPE_ 'PROX' 'DISIMILARITY'.
Результатом выполнения этой команды будет создание матрицы различий 8 
×
8
в окне редактора данных.
Матрица может содержать меры не различия, а сходства, например, если каждое 
значение матрицы — частота совместной встречаемости. Тогда последнюю строку 
следует заменить на следующую:
VALUE LABELS ROWTYPE_ 'PROX' 'SIMILARITY'.
Чтобы выполнить введенную команду, ее нужно выделить и щелкнуть на кнопке 
Запустить выделенный фрагмент
панели инструментов. Второй вариант запуска — 
выбрать в меню команду 
Запуск
4
Все
. Имейте в виду, что любой пропущенный 
знак, включая завершающую точку или неверно написанное слово, приведет к вы-
даче программой сообщения об ошибке.
После выполнения команды в редакторе данных можно заменить полученную ма-
трицу на свои данные, следя за тем, чтобы количество строк равнялось количеству 
столбцов, в каждой строке переменной 
ROWTYPE_
стояло значение 
DISIMILARITY 
(или
SIMILARITY
, если данные — меры сходства), а в строках переменной 
VARNAME_
присутствовало имя объекта.
Для выполнения кластерного анализа методом межгруппового связывания с выво-
дом таблицы шагов агломерации и дендрограммы следует выполнить следующий 
синтаксис:
CLUSTER
/MATRIX IN (*)
/METHOD BAVERAGE
/PRINT SCHEDULE
/PLOT DENDROGRAM.
Вся синтаксическая конструкция, создающая матрицу различий 8 
×
8 (попарных 
различий 8 объектов) и выполняющая кластерный анализ указанным методом 
сохранена в папке примеров 
Examples
в файле под именем 
Synt_Clust.sps
1
. При 
желании вы можете открыть этот файл и выполнить его указанным выше спо-
собом без предварительной редакции или отредактировав. Например, вы можете 
заменить указание матрицы различий на задание матрицы сходства. Для этого 
1
Все файлы данных, включая и указанный файл «синтаксис», вы можете найти по адресу 
http://
www.piter.com/books/download/978591180318
.




Достарыңызбен бөлісу:
1   ...   226   227   228   229   230   231   232   233   ...   304




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет