11 Часть I. Компоненты 14 Глава Компьютерная

жүктеу/скачать 4,29 Mb.

бет	61/197
Дата	19.03.2022
өлшемі	4,29 Mb.
	#136225
түрі	Литература

1 ... 57 58 59 60 61 62 63 64 ... 197

Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж

Устройство TTS-синтезатора речи
Модуль лингвистической обработки текста

Артикуляционный (артикуляторный) синтез исторически является первым видом синтеза, так как именно такой подход был реализован в механических «говорящих» машинах. В этом случае синтез речевого сиг- нала основывается на моделировании процесса речеобразования с учетом сведений об артикуляции звуков. Акустические свойства речевого сигнала рассчитываются с учетом геометрии речевого тракта человека, положения и движения органов, задействованных в порождении речи (голосовых свя- зок, челюсти, губ, языка и др.). Принимаются во внимание параметры ис- точника звука, формы речевого тракта и его резонансных характеристик. Речевой сигнал формируется на основе этих расчетных данных. Для соз- дания базы данных параметров артикуляторной модели в настоящее время исследуются нейрофизиологические, механические, аэродинамические и акустические аспекты речеобразования [Лобанов, Цирульник, 2008].
Современные системы артикуляторного синтеза в состоянии порож- дать вполне разборчивую синтезированную речь, однако естественность ее звучания также оставляет желать лучшего. Происходит это потому, что большинство задействованных моделей ориентируется на субъективные экспертные представления разработчиков о правилах порождения речи, а не на массив эмпирических данных. Кроме того, задействованные в таких системах модели формируются на основе анализа речи лишь единственно- го или, в лучшем случае, нескольких дикторов. По качеству синтезиро- ванной речи и скорости работы артикуляторные системы синтеза уступа- ют акустическим синтезаторам, поэтому на практике они используются редко.
Преимущество всех видов параметрического синтеза перед компиля- тивным состоит в генерировании фактически неограниченного набора голосов посредством изменения их тембральных и стилевых характери- стик. Но речь, порожденная методами параметрического моделирования, пока не очень похожа на естественную.
В литературе можно встретить и такое понятие, как корпусные методы синтеза. Сюда относятся все описанные методы, базирующиеся на ис- пользовании речевого корпуса (компилятивный синтез, синтез по техноло- гии выбора образца, статистический параметрический синтез) [Benesty et al., 2008].

Тенденцией последнего десятилетия стало появление разнообразных гибридных систем, которые объединяют в себе преимущества разных методов. Например, использование в синтезаторе метода конкатенации позволяет формировать качественно звучащие последовательности звуков, а последующая модификация генерируемого сигнала с помощью набора просодических правил дает возможность повысить естественность и ин- тонационно-просодическое оформление синтезируемой фразы.

Устройство TTS-синтезатора речи

В самом общем виде основные компоненты системы синтеза «текст- речь» можно представить в виде блок-схемы (см. рис. 1):

входной текст подается на модуль лингвистической обработки текста, который работает с символьной информацией. В результате орфогра- фическая запись преобразуется в транскрипционную согласно суще- ствующим в языке фонетическим правилам;
полученная фонетическая транскрипция передается на блок собст- венно синтеза, который и порождает звуковой сигнал по подготов- ленной транскрипционной записи.

Независимо от типа используемого синтезатором «движка» (акусти- ческого или артикуляторного), входной текст должен быть определенным образом лингвистически обработан. Рассмотрим более подробно этот этап.

Модуль лингвистической обработки текста

Главной задачей этапа предварительной лингвистической обработки является формирование по входному тексту размеченной фонетической транскрипции. Для получения такой транскрипции необходимо опреде- лить структуру документа, осуществить анализ разметки текста и его нормализацию, а также провести лингвистическую обработку. Завершает работу данного этапа просодический анализ, целью которого является мо- делирование правильной интонации, определение длительности сегмен- тов, расстановка пауз.

жүктеу/скачать 4,29 Mb.

Достарыңызбен бөлісу:

1 ... 57 58 59 60 61 62 63 64 ... 197

11 Часть I. Компоненты 14 Глава Компьютерная

Устройство TTS-синтезатора речи

Модуль лингвистической обработки текста