11 Часть I. Компоненты 14 Глава Компьютерная

жүктеу/скачать 4,29 Mb.

бет	84/197
Дата	19.03.2022
өлшемі	4,29 Mb.
	#136225
түрі	Литература

1 ... 80 81 82 83 84 85 86 87 ... 197

Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж

Обучение нейронных сетей
Математическая модель нейронной сети независимо от своей архи- тектуры может применяться в обучении, как с учителем, так и без него. Одним из наиболее распространенных алгоритмов обучения сети является метод обратного распространения ошибки (backpropagation). Он позво- ляет вычислить синаптические веса (веса связей) таким образом, что зна- чение функции потерь (величина ошибки) стабилизируется и становится достаточно небольшим. При этом каждый новый обучающий пример вно- сит свой вклад в изменение весов, когда на каждом этапе выходное значе- ние сравнивается с желаемым, и веса пересчитываются в обратном на- правлении — от выходного слоя к входному.
Одним из наиболее известных и признанных приложений нейронных сетей в компьютерной лингвистике являются нейросетевые модели языка. Для предсказания вероятности заданной последовательности слов или появления заданного слова при условии уже имеющейся последователь- ности входные значения строятся с помощью векторного представления текста. Затем используется сеть прямого распространения или рекуррент- ная сеть с сигмоидальной функцией активации, которая обучается мето- дом обратного распространения ошибки. Предполагается, что в отличие от обычной вероятностной языковой модели такая модель лучше работает с редкими словами и последовательностями, которые не встречались в исходном корпусе.
Искусственные нейронные сети были предложены в середине про- шлого века, однако в связи с развитием вычислительных технологий (на- пример, распределенных вычислений) сейчас наблюдается всплеск инте- реса к их приложениям. В компьютерной лингвистике они имеют место не

только в области языкового моделирования, но и в задачах автоматической кластеризации лексики (карты Кохонена), машинного перевода.

Кластеризация

Как уже было сказано, кластеризацией называется классификация объектов, когда их принадлежность к классам изначально не задана. Пусть имеется обучающая выборка X^𝑙 = {𝑥₁, 𝑥₂, … , 𝑥_𝑙} и функция расстояния между объектами 𝜌⁽𝑥, 𝑥^′⁾. Алгоритм кластеризации — это функция ƒ: X → 𝑌, которая любому объекту 𝑥 ∈ X ставит в соответствие кластер
𝑦 ∈ 𝑌. Число кластеров иногда известно заранее. Как и в случае с класси- фикацией необходимо задать функционал качества. Можно упомянуть, например, среднее внутрикластерное и межкластерное расстояния:

,
_𝐹₌∑_{i[𝑦_i=𝑦_j]𝜌(𝑥_i,𝑥_j)

⁰∑_{i[𝑦_i=𝑦_j]

.

_𝐹₌∑_i_<_j[𝑦_i❜𝑦_j]𝜌(𝑥_i,𝑥_j)

¹∑_i_<_j[𝑦_i❜𝑦_j]

Среди алгоритмов кластеризации можно выделить несколько групп:

графические, статистические, иерархические. Из упомянутых выше для кластеризации часто используется алгоритм k-средних.

жүктеу/скачать 4,29 Mb.
Достарыңызбен бөлісу:}}

1 ... 80 81 82 83 84 85 86 87 ... 197

11 Часть I. Компоненты 14 Глава Компьютерная

Кластеризация