Метод парзеновского окна
Еще один элементарный метрический метод — это метод парзенов- ского окна (Parzen window classification). Для каждого элемента oi обу- чающей выборки рассматривается окрестность радиуса 𝑟, при попада- нии в которую объекта 𝑥 центр окрестности oi как бы голосует за отне- сение 𝑥 соответствующему классу.
Как и предыдущий, этот метод зависит от выбора радиуса окрестно- сти, который подбирается аналогичным способом. Если данные неодно- родны, можно использовать плавающий радиус, который определяется количеством элементов обучающей выборки, попавшим в соответствую- щую окрестность.
Срез выбросов
Зачастую из выборки полезно удалить так называемые выбросы (outliers) — объекты, не характерные для данного класса или находящиеся в окружении другого класса. Чтобы обнаружить эти объекты, надо клас- сифицировать каждый объект обучающей выборки, и если класс опреде- лен неверно, удалить данный элемент.
Эту «чистку» рекомендуется проводить, если выборка достаточно большая.
Статистические методы классификации
Статистические методы предполагают построение вероятностной мо- дели. Каждому классу 𝑦i сопоставляется некоторое распределение на множестве объектов X. Соответствующая плотность характеризует веро- ятность принадлежности объекта данному классу. Задача метода — по- строить эмпирическую плотность, чтобы рассчитать, к какому классу объ- ект принадлежит с наибольшей вероятностью.
Достарыңызбен бөлісу: |