3 2 2 Глава 9. Корреляционные исследования
Из рис. 9.7 также видно, как строить предположения с помощью линии регрес
сии. Поскольку между временем, отведенным на учебу, и средним баллом суще
ствует взаимосвязь, можно спросить, какой средний балл стоит ожидать у студен
та, который проводит за учебой по 40 часов в неделю. Чтобы представить процесс
наглядно, проведем пунктирную линию от оси
X
к линии регрессии, а затем повер
нем влево на 90° и проведем линию до пересечения с осью
Y.
Значение точки на
оси У и будет предполагаемым значением (помните, что правильность предполо
жения зависит от силы корреляции). Таким образом, по времени учебы, равному
40 часам, можно предсказать средний балл, равный 3,5, а по бесполезно потрачен
ным 40 часам — средний балл чуть выше 2,1. С помощью формулы регрессии мож
но вычислить более точные значения: 3,48 и 2,13 соответственно, и сделать более
точные предсказания. Еще раз см. приложение
С.
Будьте уверены, что регрессионный анализ применяется в большинстве иссле
дований, о которых вы узнаете из средств массовой информации. К примеру, вам
может встретиться отчет об исследовании «факторов риска для инфаркта», в кото
ром на основании значимой корреляции, скажем между курением и сердечными
заболеваниями, сделан вывод, что у людей, злоупотребляющих курением, больше
вероятность развития сердечно-сосудистых заболеваний, чем у некурящих. Это зна
чит, что курение является основанием для предсказания развития болезней серд
ца. На основании другого исследования, посвященного изучению «портрета же
стокого супруга (супруги)», может быть сделан вывод о том, что вероятность по
явления подобного поведения увеличивается, если виновник — безработный. Это
следует из наличия корреляции между безработицей и склонностью к оскорби
тельному поведению. На основании наличия корреляции с помощью регрессион
ного анализа, зная первое, можно сделать предположение насчет второго.
Последнее замечание по поводу регрессионного анализа касается и практиче
ской, и этической сторон дела. Предположения могут распространяться только
на тех людей, чьи оценки попадают в диапазон, на котором основана корреляция.
Например, если уравнение регрессии, предсказывающее хорошую успеваемость в
колледже, основано на исследовании, проведенном с участием белых испытуемых,
живущих в провинции, принадлежащих к среднему классу и имеющих оценки, ва
рьирующиеся от 1000 до 1400, то на основании этого уравнения нельзя предсказать
успеваемость других абитуриентов, не принадлежащих к данной популяции.
Достарыңызбен бөлісу: