11 Часть I. Компоненты 14 Глава Компьютерная

жүктеу/скачать 4,29 Mb.

бет	81/197
Дата	19.03.2022
өлшемі	4,29 Mb.
	#136225
түрі	Литература

1 ... 77 78 79 80 81 82 83 84 ... 197

Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж

Наивный байесовский классификатор
Наиболее простой статистический метод — наивный байесовский классификатор (naive Bayes classification). В его основе лежит формула Байеса (она же — теорема Байеса) названая так в честь своего открывате-

ля — английского математика и пресвитерианского священника XVIII века Томаса Байеса.

В своей базовой форме теорема Байеса доказывается очень просто с использованием совместной вероятности р(АВ), то есть вероятности того, что произойдут два события: А и В. Если эти события независимы, то их совместная вероятность равна произведению вероятностей каждого из этих событий по отдельности: р(АВ) = р(А)*р(В).
Но если события А и В зависят друг от друга, то их совместную веро- ятность можно посчитать двумя способами: либо как вероятность события А, умноженную на вероятность события В при условии события А, либо, наоборот, как вероятность события В, умноженную на вероятность собы- тия А при условии события В. Запишем это в виде формулы:

p(А В) = p(А)×p(В|A) = p(B)×p(A|В)

Тогда p(A|В) = ^p(А ^В)
p⁽B⁾
₌p(А)×p(В|A)
p(B)

А это и есть формула Байеса:

_p(A|В)₌p(А)×p(В|A)
p(B)

Рассмотрим теперь, как эта формула применяется к практическим за- дачам.

Пусть объект 𝑥 определяется набором параметров ⁽ƒ₁ … ƒ_𝑛⁾. Тогда по теореме Байеса можно вычислить, с какой вероятностью объект ⁽ƒ₁ … ƒ_𝑛⁾принадлежит класса 𝑦_i:
_р(𝑦_|ƒ_,_…_ƒ₎₌р⁽𝑦_i⁾р(ƒ₁, … ƒ_𝑛|𝑦_i)

i 1 𝑛
р⁽ƒ₁, … ƒ_𝑛⁾

Ясно, что предпочтителен класс, для которого эта вероятность макси- мальна. Знаменатель у всех дробей одинаков, поэтому достаточно макси- мизировать числитель. Если предположить, что набор признаков 𝑦₁, … , 𝑦_𝑛 независим, то поскольку

Эта величина легко рассчитывается по выборке. 𝑃⁽𝑦_i⁾— количество элементов в обучающей выборке класса 𝑦_i деленное на общее количество элементов, р⁽ƒ_i^|𝑦_i⁾— количество элементов класса 𝑦_i, имеющих признак ƒ_i, деленное на общее число элементов класса 𝑦_i и т. п.

Независимость признаков — очень сильное предположение, которое значительно упрощает расчеты, именно поэтому классификатор получил название наивного. Конечно, в реальных задачах это требование выполне- но далеко не всегда. Например, при классификации текстов с использова- нием данного алгоритма строится модель мешка слов (bag-of-words model): предполагается, что текст — множество случайных слов из слова- ря, выбор которых друг от друга не зависит. Таким образом, пропадает информация о связях между словами.

Линейные методы классификации

i=1
Линейные методы определяют принадлежность объекта к одному из двух классов 𝑌 = {−1, +1}, но могут быть расширены на общий случай, когда объект следует отнести к одному из нескольких классов. Сущность их заключается в построении гиперплоскости, разделяющей множество объектов на две части. Пусть каждый элемент 𝑥 описывается набором признаков (ƒ₁⁽𝑥⁾, … , ƒ_𝑛⁽𝑥⁾), a ⁽w_0:𝑛⁾— некоторые веса этих признаков. Веса используются для оценки «вклада» каждого признака в определение класса, к которому относится объект. Так, чтобы определить морфологи- ческую характеристику слова русского языка, чаще важен его суффикс, а не приставка, хотя и последняя может иметь значение в некоторых случа- ях. Тогда принадлежность к классу определяется выражением

i=1
sign ^(∑𝑛
w_iƒ_i⁽𝑥⁾− w₀⁾, причем выражение ^∑𝑛
w_iƒ_i⁽𝑥⁾= 0 определяет

жүктеу/скачать 4,29 Mb.

Достарыңызбен бөлісу:

1 ... 77 78 79 80 81 82 83 84 ... 197

11 Часть I. Компоненты 14 Глава Компьютерная

Линейные методы классификации