Агрегирование данных
Агрегирование данных позволяет создавать такие значения переменных, каждое из
которых представляет собой результат объединения группы исходных значений,
например среднее. В процессе агрегирования задается группирующая переменная
(например, номер респондента), каждое значение которой неоднократно встреча-
ется в исходных данных. Затем для каждого значения группирующей переменной
вычисляются новые значения агрегируемых переменных исходя из их исходных
значений по заданной функции (например, среднее).
В качестве примера будем использовать файл
ex021.sav
(см. описание в главе 14).
В нем значения переменных
НАЧАЛО
,
СЕРЕДИНА
,
КОНЕЦ
представлены для каждо-
го респондента дважды (в две строки), в соответствии с переменной
Отсрочка
: без
отсрочки (0) и с отсрочкой (1). Соответственно, номер каждого респондента (пере-
менная
N
) повторяется дважды. Предположим, исследователь желает агрегиро-
вать значения переменных
НАЧАЛО, СЕРЕДИНА, КОНЕЦ
так, чтобы для респондента
с неповторяющимся номером
N
каждое значение этих переменных представляло
собой среднее двух исходных значений (с отсрочкой и без нее).
После выполнения шага 2 на экране должно быть окно редактора данных SPSS.
Глава 4.
Управление данными
84
ШАГ 3М
Откройте файл данных, с которым вы намерены работать (в нашем слу-
чае — это файл
ex021.sav
). Если он расположен в текущей папке, то вы-
полните следующие действия.
Выберите в меню
1.
Файл
команду
Открыть
4
Данные
или щелкните на
кнопке
Открыть
данные
панели инструментов.
В открывшемся диалоговом окне дважды щелкните на имени
2.
ex021.
sav
или введите его с клавиатуры и щелкните на кнопке
OK
.
ШАГ 4М
В меню
1.
Данные
выберите команду
Агрегировать данные
, чтобы от-
крыть окно, показанное на рис. 4.13.
Поле
Группирующая переменная
предназначено для помещения переменной, по-
вторяющимся значениям которой должна соответствовать группа агрегируемых
значений. А переменные, для которых агрегируются значения, переносятся в поле
Итоги для переменной(ых)
. Для нашего примера группирующей переменной высту-
пает номер респондента (
N
), а агрегируемые переменные –
НАЧАЛО, СЕРЕДИНА,
КОНЕЦ
. В связи с тем, что для переменных
Инт
и
Знач
значения для повторяю-
щихся
N
идентичны, то результаты агрегирования для них, в случае вычисления
среднего, будут равны исходным значениям. Поэтому они тоже могут быть поме-
щены в список
Итоги для переменной(ых)
.
Группа переключателей
Сохранить
управляет судьбой агрегированных перемен-
ных. В нашем случае целесообразно создание нового набора данных, который по-
сле проверки результата агрегирования может быть сохранен.
Кнопка
Функция
позволяет задавать другие способы агрегирования, нежели приня-
тое по умолчанию вычисление среднего, а кнопка
Имя и Метка
позволяет задавать
имена агрегируемым переменным, иные, чем присваиваемые по умолчанию.
На следующем шаге создадим новый набор данных с именем
ex021agg.sav
, содер-
жащий агрегированные переменные
НАЧАЛО
,
СЕРЕДИНА
,
КОНЕЦ
: каждое новое их
значение будет равно среднему двух исходных значений (с отсрочкой и без). Так-
же включим в этот набор значения переменных
Инт
и
Знач
.
ШАГ 5М
В окне
1.
Агрегировать данные
щелкните по переменной
N
, затем – по
кнопке со стрелкой, чтобы перенести ее в поле Группирующая пере-
менная.
Перенесите переменные
2.
Инт
,
Знач
,
НАЧАЛО
,
СЕРЕДИНА
,
КОНЕЦ
в поле
Итоги для переменной(ых)
. Для этого нажмите на клавиатуре клави-
шу
Ctrl
и, удерживая ее, щелкните последовательно на именах этих
переменных, для их выделения. Затем щелкните на соответствую-
щую кнопку со стрелкой.
В области
3.
Сохранить
установите переключатель
Создать новый набор
данных
… и задайте его имя
ex021agg
.
Для выполнения команды щелкните по кнопке
4.
ОК
.
Реструктурирование данных
Достарыңызбен бөлісу: |