4 Управление данными
58
Знакомство с возможностями управления данными
61
Получение информации о файле
61
Обработка пропущенных значений
62
Преобразование данных
67
Выбор наблюдений для анализа
70
Перекодировка в новую переменную
74
Перекодирование существующей переменной
77
Сортировка наблюдений
78
Объединение данных разных файлов
83
Агрегирование данных
85
Реструктурирование данных
Материал этой главы посвящен вопросам эффективной работы с исходными дан-
ными. Описанные здесь операции весьма полезны в большинстве случаев обра-
ботки и анализа данных, так как практически всегда существует необходимость
в предварительной подготовке и преобразовании исходных данных. Поэтому из-
ложенные рекомендации по форматированию данных помогут вам работать с про-
граммой гораздо свободнее.
Знакомство с возможностями
управления данными
В процессе работы вам могут понадобиться преобразованные данные, являющиеся
результатом некоторых действий над исходными данными файла. К примеру, для
вашего исследования может представлять интерес среднее значение или сумма
баллов по нескольким
тестам для каждого учащегося, ранг каждого ученика по
успеваемости и т. п. Иногда желательно упорядочить данные файла по какому-
либо признаку, например по результатам выполнения какого-либо задания. Не-
редко возникает необходимость обработки не всех данных файла, а лишь их под-
множества, выделяемого по определенным критериям (например, по полу, классу,
успеваемости и пр.). Существует и обратная задача: если данные хранятся в не-
Знакомство с возможностями
управления данными
59
скольких небольших файлах, может возникнуть потребность в их объединении
для последующего анализа.
Перечисленные проблемы указывают на то, что для
регулярной аналитической
работы недостаточно умения вводить данные и применять к ним статистические
процедуры. Возникает задача эффективного управления. Способы решения этой
задачи бывают весьма нетривиальными, и исчерпывающий рассказ о них не впол-
не соответствовал бы теме книги. Тем не менее представленного в этой главе ма-
териала вполне достаточно, чтобы научиться свободно манипулировать данными.
Несмотря на то что навыки управления данными приходят с опытом и требуют
некоторого терпения, обязательно освойте их. Это придаст процессу исследования
гибкость, простоту и легкость. Тогда выполнение статистических процедур, казав-
шихся сложными и громоздкими, станет для вас интуитивно понятным.
Мы рассмотрим следующие основные команды управления данными:
команда
f
Информация
о
файле данных
позволяет получить сведения о перемен-
ных как открытого, так и любого внешнего файла данных SPSS: имена, метки
имен и значений;
команда
f
Преобразовать
4
Заменить
пропущенные
значения
, как ясно из ее на-
звания, работает с отсутствующими
значениями переменных;
команда
f
Преобразовать
4
Вычислить переменную
позволяет путем вычислений
создавать новые переменные на основе существующих;
команда
f
Преобразовать
4
Ранжировать
наблюдения
позволяет создать новую пере-
менную путем ранжирования значений существующей переменной;
с помощью команды
f
Данные
4
Отобрать наблюдения
можно выбрать подмноже-
ство наблюдений для дальнейшего анализа;
команды
f
Преобразование
4
Перекодировать в
другие
переменные
и
Преобра зо ва-
ние
4
Перекодировать в те же переменные
предназначены для изменения способа
кодирования
переменных, например уменьшения числа возможных значений;
команда
f
Данные
4
Сортировать
наблюдения
позволяет упорядочить объекты
в соответствии с назначенными критериями;
команды подменю
f
Слить
файлы
меню
Данные
используются для добавления
в файл новых переменных или наблюдений из другого файла;
команда
f
Агрегировать данные
меню
Данные
позволяет создавать такие значения
переменных, каждое из которых представляет собой результат объединения
группы
исходных значений, например их среднее;
команды
f
Реструктурировать
меню
Данные
позволяют производить сложные
манипуляции со структурой файла данных, например преобразовывать набор
переменных в группы значений одной переменной или, наоборот, группы зна-
чений одной переменной — в набор переменных.
Все дальнейшие главы книги, начиная с этой, построены таким образом, что они
практически не связаны друг с другом. После вводной части каждой главы приве-