Руководство по анализу данных с помощью самой мощной и популярной


Глава 24.  Логистическая регрессия 348



Pdf көрінісі
бет264/304
Дата10.10.2024
өлшемі8,54 Mb.
#206058
түріРуководство
1   ...   260   261   262   263   264   265   266   267   ...   304
Байланысты:
А. Наследов - SPSS 19. Профессиональный статистический анализ данных - 2011

Глава 24. 
Логистическая регрессия
348
«нет». Помимо того что зависимая переменная 
польза
в файле 
helpLR.sav
представ-
лена в дихотомическом виде, в него добавлена еще одна категориальная переменная 
условия
. Эта переменная обозначает одно из трех условий, в которых моделирова-
лось оказание помощи: 1 — на работе, 2 — на улице в людном месте, 3 — в лесу, при 
встрече «один на один». Данные для файла 
helpLR.sav
подбирались искусственно для 
того, чтобы проиллюстрировать рассматриваемый тип статистического анализа.
Математическое описание 
логистической регрессии
С логистической регрессией связаны такие математические понятия, как вероят-
ность, шанс и натуральный логарифм шанса. Вероятность — это ожидаемая от-
носительная частота некоторого события. Шанс представляет собой отношение 
вероятности того, что событие произойдет, к вероятности того, что событие не 
произойдет. Так, если вероятность дождя равна 0,2, то вероятность отсутствия до-
ждя равна 0,8, следовательно, шанс, что дождь все-таки прольется, равен 0,2/0,8 =
= 0,25. Обратите внимание, что шанс, в отличие от вероятности, не ограничен мак-
симальным единичным значением; если, к примеру, вероятность дождя составляет 
не 0,2, а 0,8, то получаем шанс 0,8/0,2 = 4. Единичное значение шанса соответству-
ет ситуации, когда вероятности появления и не появления события равны.
Ключевым параметром логистической регрессии является логит. Логит равен нату-
ральному логарифму шанса. Например, логит вероятности в 20 % равен –1,386...
Уравнение регрессии, используемое в главе 18, имеет следующий вид:
помощь
B
0
B
1
×
симпатия
B
2
×
агрессия
B
3
×
польза
Согласно этому уравнению величина оказываемой помощи равна сумме константы 
(В0) и значений трех переменных (отражающих симпатию, агрессивность и поль-
зу), умноженных на соответствующие коэффициенты регрессии. Несмотря на то 
что в логистическом анализе оценивается полезность или бесполезность помощи, 
а не ее величина, уравнение логистической регрессии похоже на уравнение мно-
жественной регрессии:
ï î ì î ù ü
ï î ì î ù ü
ln
1
P
P







B
0
B
1
x
1
B
2
x
2
B
3
x
3
.
Здесь P
помощь
— вероятность оказания помощи, x
1
x
2
и x
3
— значения переменных 
симпатия

агрессия
и 
польза
.
Можно избавиться от натурального логарифма в левой части и преобразовать 
уравнение к виду:
0
1 1
2 2
3 3
ï î ì î ù ü
ï î ì î ù ü
1
B
B x
B x
B x
P
e
e
e
e
P
=
+
+
+

.
помощь
помощь
помощь
помощь


Пошаговые алгоритмы вычислений
349
Это уравнение, в свою очередь, можно преобразовать к следующему:
0
1 1
2 2
3 3
ï î ì î ù ü
1
1
B
B x
B x
B x
P
e
e
e
e




=
+
×
×
×
.
Вероятно, подобные формулы не дают интуитивного представления о зависимо-
сти, которую они отражают, но на первых этапах это вполне нормально, поскольку 
интуиция всегда приходит с опытом. Тем не менее следует проявить максимум 
внимания к интерпретации модели логистической регрессии, поскольку выбор мо-
дели требует ее ясного теоретического понимания.
Поскольку данный раздел статистики весьма непрост для изучения, мы рекомен-
дуем перед проведением логистического регрессионного анализа почитать допол-
нительную литературу.


Достарыңызбен бөлісу:
1   ...   260   261   262   263   264   265   266   267   ...   304




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет