11 Часть I. Компоненты 14 Глава Компьютерная

жүктеу/скачать 4,29 Mb.

бет	70/197
Дата	19.03.2022
өлшемі	4,29 Mb.
	#136225
түрі	Литература

1 ... 66 67 68 69 70 71 72 73 ... 197

Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Рис. 7. Архитектура системы распознавания речи с привлечением статистических методов

Акустико-фонетическая модель (англ. Phonetic Model) является центральным модулем любой системы распознавания, так как именно она хранит описание фонетических единиц языка (аллофонов или их фраг- ментов), т. е. шаблонов звуков, называемых акустическими моделями. В современных системах распознавания речи основной тип используемой фонетической модели соответствует трифону — контекстной реализации фонемы, которая учитывает непосредственный правый и левый контекст (например, ударный аллофон [o] после согласного [д] и перед сонантом [м]). Для построения трифонной базы привлекаются все возможные в языке сочетания звуков.

Помимо трифонов, в акустическую модель могут включаться и фоне- тические модели других речевых единиц — слогов, слов, словосочетаний, типовых фраз. Для построения этих моделей используются как собственно

акустические представления, так и вероятностные методы — чаще всего скрытые Марковские модели или нейронные сети. Фонетические модели строятся на этапе обучения распознающей системы. Для этого использу- ются акустико-фонетические базы данных, которые представляют собой большие массивы звучащей речи, записанной от многих дикторов.

жүктеу/скачать 4,29 Mb.

Достарыңызбен бөлісу:

1 ... 66 67 68 69 70 71 72 73 ... 197