Руководство по анализу данных с помощью самой мощной и популярной

Глава 21. Кластерный анализ 300

жүктеу/скачать 8,54 Mb.

Pdf көрінісі

бет	230/304
Дата	10.10.2024
өлшемі	8,54 Mb.
	#206058
түрі	Руководство

1 ... 226 227 228 229 230 231 232 233 ... 304

Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Кластерный анализ матрицы различий (сходства)

Глава 21.
Кластерный анализ
300
методы объединения объектов, однако мы не станем рассматривать их в этой
книге. При необходимости обратитесь к руководству пользователя SPSS.
Интерпретация результатов
4.
. Как и в случае факторного анализа, желаемое
число кластеров и оценка результатов анализа зависят от целей исследователя.
Для рассматриваемого примера нам представляется наиболее предпочтитель-
ным число кластеров, равное 3. Как показывает анализ, все марки можно разде-
лить на 3 группы: первая группа имеет высокую стоимость (среднее значение —
15 230), небольшой срок эксплуатации (4 года) и средний пробег (85 400 км).
Вторая группа имеет среднюю стоимость, небольшой пробег, наибольший воз-
раст, но хорошее техническое состояние. Третья группа содержит недорогие
модели с большим пробегом и невысоким рейтингом технического состояния.
Кластерный анализ
матрицы различий (сходства)
Довольно часто исходной информацией для кластерного анализа являются не дан-
ные типа «объекты-переменные», а непосредственно данные о различии (сходстве)
объектов. Например, респондент может оценивать различие (сходство) объектов,
предъявляемых попарно, с перебором всех пар объектов. Или данными могут быть
частоты совместной встречаемости для каждой пары объектов. В этих случаях ис-
ходные данные представляют собой квадратную матрицу, как правило, симметрич-
ную относительно главной диагонали, каждый элемент которой — мера различия
(или сходства) пары объектов, которым соответствует строка и столбец матрицы.
К сожалению, кнопочный интерфейс программы SPSS не позволяет обрабатывать
матрицы различий методами кластерного анализа (в многомерном шкалировании
это возможно). Поэтому для обработки таких данных следует обратиться к ко-
мандному языку
Синтаксис
(
Syntax
).
В SPSS предусмотрен формат данных для матрицы различия (сходства). При по-
мощи синтаксиса такая матрица создается следующим образом
1
. Для создания
командного файла
Синтаксис
необходимо открыть окно редактора синтаксиса, вы-
брав команду
Открыть
4
Синтаксис
в меню
Файл
. Предположим, необходимо создать
матрицу различий 8
×
8 с именами объектов
a
b
c
d
e
f
g
h
. Для этого в открытом
окне
Редактор синтаксиса
следует ввести следующий текст (не важно, прописными
иди строчными буквами):
DATA LIST FREE /ROWTYPE_(a8) VARNAME_(a8) a b c d e f g h.
BEGIN DATA
PROX A 0 6 2 7 18 0 1 5
PROX B 6 0 14 3 8 4 19 14
1
Решение проблемы заимствовано с сайта
http://www.spsstools.ru
(
А. Балабанов
, Raynald's SPSS
Tools по-русски).

Кластерный анализ матрицы различий (сходства)
301
PROX C 2 14 0 30 12 4 6 8
PROX D 7 3 30 0 1 16 3 4
PROX E 18 8 12 1 0 19 13 14
PROX F 0 4 4 16 19 0 5 1
PROX G 1 19 6 3 13 5 0 16
PROX H 5 14 8 4 14 1 16 0
END DATA.
EXECUTE.
VALUE LABELS ROWTYPE_ 'PROX' 'DISIMILARITY'.
Результатом выполнения этой команды будет создание матрицы различий 8
×
8
в окне редактора данных.
Матрица может содержать меры не различия, а сходства, например, если каждое
значение матрицы — частота совместной встречаемости. Тогда последнюю строку
следует заменить на следующую:
VALUE LABELS ROWTYPE_ 'PROX' 'SIMILARITY'.
Чтобы выполнить введенную команду, ее нужно выделить и щелкнуть на кнопке
Запустить выделенный фрагмент
панели инструментов. Второй вариант запуска —
выбрать в меню команду
Запуск
4
Все
. Имейте в виду, что любой пропущенный
знак, включая завершающую точку или неверно написанное слово, приведет к вы-
даче программой сообщения об ошибке.
После выполнения команды в редакторе данных можно заменить полученную ма-
трицу на свои данные, следя за тем, чтобы количество строк равнялось количеству
столбцов, в каждой строке переменной
ROWTYPE_
стояло значение
DISIMILARITY
(или
SIMILARITY
, если данные — меры сходства), а в строках переменной
VARNAME_
присутствовало имя объекта.
Для выполнения кластерного анализа методом межгруппового связывания с выво-
дом таблицы шагов агломерации и дендрограммы следует выполнить следующий
синтаксис:
CLUSTER
/MATRIX IN (*)
/METHOD BAVERAGE
/PRINT SCHEDULE
/PLOT DENDROGRAM.
Вся синтаксическая конструкция, создающая матрицу различий 8
×
8 (попарных
различий 8 объектов) и выполняющая кластерный анализ указанным методом
сохранена в папке примеров
Examples
в файле под именем
Synt_Clust.sps
1
. При
желании вы можете открыть этот файл и выполнить его указанным выше спо-
собом без предварительной редакции или отредактировав. Например, вы можете
заменить указание матрицы различий на задание матрицы сходства. Для этого
1
Все файлы данных, включая и указанный файл «синтаксис», вы можете найти по адресу
http://
www.piter.com/books/download/978591180318
.

жүктеу/скачать 8,54 Mb.

Достарыңызбен бөлісу:

1 ... 226 227 228 229 230 231 232 233 ... 304