11 Часть I. Компоненты 14 Глава Компьютерная



бет79/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   75   76   77   78   79   80   81   82   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж
Метод k-ближайших соседей
Метод k-ближайших соседей (k-Nearest Neighbours algorithm, k-NN)

  • это более устойчивая к выбросам модификация метода ближайших со- седей. Для объекта 𝑥 определяются k-ближайших соседей и относят его к преобладающему классу. Вспомним пример с оценкой тональности отзы- ва, и будем в качестве параметров рассматривать количество положитель- но и отрицательно окрашенных слов. В тестовом отзыве будет пять поло- жительно окрашенных слов (безупречность, нравится, лучше, ярче, чёт- че) и одно отрицательно окрашенное (проблемы) — очевидно, ближе всего к нему будут оба положительных отзыва.

Этот метод с одной стороны более устойчив к выбросам, но с другой стороны, тяготеет к большим классам, поэтому его не рекомендуется ис- пользовать, если объемы классов существенно отличаются. Классифика- ция существенно зависит от 𝑘. При 𝑘 = 1 совпадает с простым методом ближайших соседей, при 𝑘 близких к объему всего множества объектов приписывает класс наибольшего объема. Поэтому 𝑘 следует подбирать аккуратно. Рекомендуется такой способ проверки: необходимо, чтобы для

наибольшего числа объектов обучающей выборки принадлежность к клас- су определяется верно.


Если принадлежность к классу определяется неоднозначно (равное число ближайших соседей в каждом классе), то следует минимизировать суммарное расстояние до ближайших соседей класса.




Достарыңызбен бөлісу:
1   ...   75   76   77   78   79   80   81   82   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет