Синтез речи по правилам
Альтернативный подход к порождению синтезированной речи назы- вается параметрическим синтезом, или «синтезом по правилам». Это
«синтез» речи в бытовом понимании этого термина, то есть порождение
нового звукового сигнала «из ничего», примерно так, как порождается электронным синтезатором звук, имитирующий разные музыкальные ин- струменты. Здесь выделяются следующие основные технологии: фор- мантный, статистический, артикуляционный и некоторые другие.
В основе формантного синтеза лежат данные об акустических свой- ствах отдельных звуков и их сочетаний, которые формализуются в наборе правил. Считается, что для получения относительно естественной речи необходимо привлечение порядка 60-ти параметров, связанных с переда- точной функцией речевого тракта, которые могут влиять на частоту, ам- плитуду и ширину формант отдельных звуков. Дополнительно необходима формализация параметров, характеризующих динамическое изменение свойств голосовых и шумовых источников звука [Кодзасов, Кривнова, 2001].
В процессе работы синтезатора на основе акустических параметров генерируются цифровые сигналы, имитирующие результат работы шумо- вых и периодических источников звука. Затем эти сигналы модифициру- ются с помощью набора формантных фильтров, преобразующих речевой спектр в характерную для синтезируемого звука спектральную картину. Очевидно, что создание формантного синтезатора требует значительной подготовительной работы.
Синтезированную речь, порождаемую современными формантными синтезаторами, трудно спутать с человеческой речью: она имеет выражен- ный «роботоподобный» характер и часто сопровождается «механически- ми» артефактами, которые воспринимаются на слух как жужжание или гудение. Тем не менее, разборчивость речи, синтезированной по формант- ному методу, достаточно высока. Очевидным преимуществом формант- ных синтезаторов является тот факт, что с их помощью можно генериро- вать любые голоса и порождать искусственную речь разного темпа и ма- неры произнесения, а также разнообразить синтезированную речь эмо- циональными оттенками и мелодическими нюансами (правила для кото- рых, разумеется, необходимо предварительно описать). Кроме того, у форматных синтезаторов относительно небольшой цифровой размер, по- скольку они не обременены никакими базами данных. Поэтому именно они часто используются в тех устройствах, объем памяти которых ограни- чен: в мобильных приложениях, навигаторах, бытовых приборах и пр.
Достарыңызбен бөлісу: |