11 Часть I. Компоненты 14 Глава Компьютерная



бет57/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   53   54   55   56   57   58   59   60   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Синтез речи


Основная задача синтеза речи состоит в том, чтобы передавать чело- веку голосовое сообщение исключительно посредством устройства или

механизма, без участия оператора. Наиболее простую модель синтезатора речи можно слышать в вагонах метрополитена:


Станция «Гостиный Двор». <…>. Осторожно, двери закрыва- ются! Следующая станция «Василеостровская».
На каждой остановке названия меняются, но общая структура сооб- щения остается неизменной. Для реализации такого синтеза необходимы несколько шаблонных фраз («Осторожно, двери закрываются!»), фраг- менты фраз («Станция», «Следующая станция») и перечень всех станций метрополитена. Сначала все эти элементы должен под запись зачитать диктор, после чего они хранятся в виде оцифрованного сигнала в специ- альной базе данных. С помощью несложной программы и данных «борто- вого компьютера» электропоезда, знающем, на какой станции находится поезд, информационные сообщения формируются автоматически посред- ством «склейки» (конкатенации) этих речевых фрагментов.
Ученые и изобретатели издавна задумывались нам тем, как научить машину «говорить». Первые попытки создания «говорящих машин» отно- сятся к концу XVIII века. Устройства, разработанные В. Кранценштейном в России и В. фон Кемпеленом в Германии, представляли собой механиче- ские синтезаторы, имитирующие работу речевого тракта человека и умеющие «произносить» несколько отдельных звуков. Первым электрон- ным синтезатором стал вокодер Voder, разработанный американским ин- женером Х. Дадли, который был представлен общественности в 1939 г. Вокодер использовался для получения спектральных характеристик ис- ходного речевого сигнала, по которым этот сигнал мог быть воссоздан (ресинтезирован). Позднее развитие вычислительных машин и технологий позволило перейти от аналоговых сигналов к цифровым и использовать для синтеза речи численные методы анализа и преобразования звука, ко- торые открывают фактически неограниченные возможности для модифи- кации свойств выходного синтезированного сообщения.
Основным критерием качества систем синтеза речи является ее раз- борчивость, что означает, что синтезируемая речь должна быть абсолют- но понятна на слух. Другим важным требованием, выдвигаемым для мно- гих систем синтеза, является естественность генерируемой речи, то есть искусственная речь в идеале не должна отличаться на слух от норматив- ной человеческой речи (например, от речи дикторов телевидения или ра- дио).
По своему назначению, системы синтеза речи относятся к одной из двух групп: 1) предметно-ориентированные приложения и 2) системы синтеза «от текста к речи». Последние часто называются TTS- синтезаторы (от англ. Text-To-Speech). Предметно-ориентированная груп- па приложений использует ограниченный словарь и заранее заданные

шаблоны порождаемых сообщений, а задачей TTS-систем является озву- чивание любого текста по его письменному представлению. Естественно, что вторая задача является технически намного более сложной.




    1. Методы синтеза



      1. Достарыңызбен бөлісу:
1   ...   53   54   55   56   57   58   59   60   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет