Допущение линейности
До сих пор изучаемые нами графики рассеяния состояли из точек, несколько
отклоняющихся от прямой линии, которая образуется при полной корреляции со
значениями -1,00 или +1,00. Однако не все взаимосвязи линейны, а вычисление
пирсонова r для нелинейного случая не поможет выявить природу такой взаимо
связи. На рис. 9.5 показан гипотетический пример, отражающий одно известное
психологическое открытие: взаимосвязь между возбуждением и выполнением за
дания. Сложные задания выполняются хорошо при среднем уровне возбуждения,
но гораздо хуже при очень низком или очень высоком (см., например, Anderson,
1990). При очень низком уровне возбуждения у человека недостаточно сил, чтобы
работать над заданием, а очень высокое возбуждение мешает эффективной обра
ботке информации, требующейся для выполнения работы. Из графика рассеяния
видно, что точки ложатся вдоль определенной кривой, но при попытке применить
линейную корреляционную процедуру вы получите, что r равно нулю или очень
близко к нему. Анализ криволинейных взаимосвязей, подобных изображенной на
рис. 9.5, проводится особыми методами, рассмотрение которых не входит в задачу
данной книги.
3 1 8 Глава 9. Корреляционные исследования
Рис. 9.5. Криволинейная взаимосвязь между уровнем возбуждения
и выполнением задания
Ограничение диапазона
При проведении корреляционного исследования важно учитывать людей, оценки
которых попадают в широкий диапазон.
Ограничение диапазона
одной или обеих
переменных снижает корреляцию. Подобный эффект показан на рис. 9.6. Предпо
ложим, вы изучаете взаимосвязь между оценками
SAТ
(американский школьный
тест проверки способностей) и успеваемостью в колледже (последняя оценивает
ся по средним баллам, полученным первокурсниками в конце года). На рис. 9.6, а
показано, каким может быть график рассеяния при исследовании 25 студентов.
Коэффициент корреляции равен +0,70. Допустим далее, что вы решили изучить эту
взаимосвязь на примере студентов, получивших 1200 и более баллов по тесту
SAT
На рис. 9.6, б выделены точки графика рассеяния для таких студентов — как пока
зано на рис. 9.6, в, по ним можно построить отдельный график. Если вы теперь срав
ните рис. 9.6, а и 9.6, в, вам станет ясно, что для 9.6, в корреляция ниже. Действи
тельно, она падает до +0,26.
Этот пример имеет интересное следствие для колледжей, которые не учитыва
ют студентов, чьи суммарные оценки теста
SAТ
меньше 1200 баллов. Различные
исследования (например, Schrader, 1971) показали, что общая корреляция между
оценками
SAT и
баллами, полученными в конце первого курса, равная приблизи
тельно +4,0, является статистически значимой, но не высокой. Корреляцию нахо
дили, используя студентов с самыми разными оценками теста
SAT.
Если диапазон
оценок
SAT
ограничен 1200 баллами и выше, то корреляция заметно снижается.
Существуют особые процедуры для «коррекции» корреляции с учетом проблемы
ограничения, но необходимо осознавать, что ограничение диапазона непосред
ственно влияет на возможность строить предположения о дальнейших событиях.
Учебные заведения, проводящие строгий отбор и отсеивающие абитуриентов с ре
зультатами теста
SAT
ниже 1200 баллов, без сомнения получат хороших студентов,
но их возможность предсказать учебную успеваемость на основании оценок
SAT
будет не такой высокой, как у заведений, не предъявляющих таких высоких требо-
Rорреляция и регрессия: основы 3 1 9
ваний к абитуриентам. В вузах, имеющих меньше ограничений по отбору студен
тов, корреляция оценок
SAT и
академической успеваемости будет выше, чем в учеб
ных заведениях со строгими ограничениями.
Рис. 9.6. Эффект ограничения диапазона
Достарыңызбен бөлісу: |