11 Часть I. Компоненты 14 Глава Компьютерная



бет70/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   66   67   68   69   70   71   72   73   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Рис. 7. Архитектура системы распознавания речи с привлечением статистических методов

  1. Акустико-фонетическая модель (англ. Phonetic Model) является центральным модулем любой системы распознавания, так как именно она хранит описание фонетических единиц языка (аллофонов или их фраг- ментов), т. е. шаблонов звуков, называемых акустическими моделями. В современных системах распознавания речи основной тип используемой фонетической модели соответствует трифону контекстной реализации фонемы, которая учитывает непосредственный правый и левый контекст (например, ударный аллофон [o] после согласного [д] и перед сонантом [м]). Для построения трифонной базы привлекаются все возможные в языке сочетания звуков.

Помимо трифонов, в акустическую модель могут включаться и фоне- тические модели других речевых единиц — слогов, слов, словосочетаний, типовых фраз. Для построения этих моделей используются как собственно

акустические представления, так и вероятностные методы — чаще всего скрытые Марковские модели или нейронные сети. Фонетические модели строятся на этапе обучения распознающей системы. Для этого использу- ются акустико-фонетические базы данных, которые представляют собой большие массивы звучащей речи, записанной от многих дикторов.





  1. Достарыңызбен бөлісу:
1   ...   66   67   68   69   70   71   72   73   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет