Рис. 2. Принцип работы системы распознавания речи
Продемонстрируем принцип работы распознавателя речи на конкрет- ном примере. Возьмем простейшую задачу: попытаемся построить распо- знаватель речи, который будет понимать всего два слова — «да» или
«нет».
Для начала сформируем обучающий массив звукозаписей: прове- дем звукозаписи интересующих нас слов в произнесении нескольких го- ворящих. На рис. 3 показаны соответствующие спектрограммы для одного из голосов.
а)
б)
Рис. 3. Спектрограммы слов «да» (а) и «нет» (б) с выделенными областями взрывных элементов согласных
Определим, какие акустические признаки будет анализировать наша система. Для этого проанализируем полученные спектры. На спек- трограммах четко выделяются взрывные элементы согласных [д] и [т], покрывающие все видимые полосы частот (вертикальное затемнение спектра). При этом для слова «да» «взрыв» наблюдается в начале слова, а для слова «нет» — в конце. Поэтому наиболее простым критерием, разли- чающим спектры этих двух слов у самых разных говорящих, может быть положение взрывного согласного: если «взрыв» наблюдается в начале, то это слово «да», а если в конце, то «нет». Задав формальный критерий для сравнения акустических признаков, мы осуществили обучение системы.
Теперь можно проверить наш алгоритм на практике: попробуйте по спектру, представленному на рис. 4, угадать, какой ответ выдает наша сис- тема: это слово «да» или слово «нет»?
Достарыңызбен бөлісу: |