Корреляция и регрессия: основы 3 1 3
Рис. 9 . 1 . Таблица, построенная Гальтоном, чтобы показать корреляцию роста
родителей и детей - прототип графика рассеяния
Во-вторых, Гальтон заметил, что когда «корреляция» была неполной, начинала проявляться
одна закономерность. У родителей с ростом выше среднего были высокие дети, но довольно
часто они были не такими высокими, как мать и отец. У родителей с ростом ниже среднего
дети были низкие, но не настолько. Это означает, что рост у детей имеет тенденцию сме
щаться, или регрессировать, в сторону среднего арифметического значения в популяции.
Феномен «регрессии к среднему», который, как вы уже знаете, представляет угрозу внутрен
ней валидности исследования, является одним из самых выдающихся открытий Гальтона.
Третье наблюдение Гальтона состояло в том, что график, построенный по значениям среднего
арифметического для каждого столбца таблицы рассеяния, дает более или менее прямую линию.
По сути, он представляет собой разновидность «линии регрессии», с которой вы скоро познако
митесь. Таким образом, Гальтон открыл основные характеристики корреляционного анализа.
Прочитав о работе Гальтона, Карл Пирсон - молодой британский ученый, занимающийся
статистикой, - продолжил изыскания в этой области и разработал формулу для вычисления
коэффициента корреляции. Он обозначил коэффициент буквой «r», что значит «регрессия», в
честь сделанного Гальтоном открытия регрессии к среднему. Вслед за Гальтоном Пирсон
считал, что корреляционный анализ подтверждает идею о наследуемости многих свойств,
обнаруживающих себя в отдельных семьях. Как вы вскоре узнаете, делать выводы о наличии
причинно-следственных связей на основании корреляционного анализа (как поступили Галь
тон и Пирсон) - весьма рискованное занятие.
Достарыңызбен бөлісу: