11 Часть I. Компоненты 14 Глава Компьютерная



бет63/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   59   60   61   62   63   64   65   66   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Категории для замены

Фрагмент текста, тре- бующий нормализации

Нормализованный текст

Сокращения

См.

смотри

тел.

телефон

и др.

и другие/ое

Аббревиатуры

РФ

Российская Федерация




НТВ

эн тэ вэ

Числа и даты

в 1998 г.

в тысяча девятьсот девяно- сто восьмом году

+7 812 123–4567

плюс семь восемьсот двена- дцать, сто двадцать три, сорок пять, шестьдесят семь

Адреса

12-я линия В. О. д. 35

двенадцатая линия Василь- евского острова, дом три- дцать пять

Специальные символы, фор- мулы и другие обозначения

$ 100000

сто тысяч долларов

х2

икс в квадрате

Затем проводится ревизия пунктуационных знаков: в тексте оставля- ются только те из них, которые могут служить разграничителями для про- содической разметки. При этом часть знаков препинания снимается, ос-


тальные приводятся к общему виду. Например, многие системы синтеза используют только два символа — точку (как показатель конца фразы) и запятую (конец синтагмы). Для поиска и коррекции ошибок в написании слов, которые приводят к их неправильному прочтению, применяются спел-чекеры.





      1. Уровни лингвистического анализа текста

Лингвистический анализ текста может включать в себя несколько уровней: морфологический анализ словоформ проводится для определе- ния правильного места ударения в слове, синтаксический анализ необ- ходим для разрешения неоднозначностей письменного текста, правильной акцентировки и фразировки синтезируемого высказывания. Иногда для этой цели может привлекаться и семантико-синтаксический анализ. Результатом лингвистической обработки является специальным образом размеченный текст, который поступает на блок фонетического анализа.



      1. Фонетический анализ

Далее осуществляется фонетическое транскрибирование текста, зада- ча которого состоит в получении цепочки транскрипционных символов, каждый из которых обозначает определенный гласный или согласный звук. Специальные символы могут указывать на особенности этого звука, которые следует учесть при синтезе. Как правило, сначала осуществляется преобразование от букв к фонемам (обобщенным символьным обозначе- ниям звуков), затем — от фонем к конкретным звукам (аллофонам). Сте- пень детализации аллофонных вариантов и перечень используемых пра- вил в разных системах варьируют. Некоторые системы синтеза позволяют смоделировать даже разные стили произнесения.
Для фонетического транскрибирования используются заложенные ранее правила преобразования «от буквы к звуку» и фонетические слова- ри, описывающие произнесение нестандартных слов или определенных сочетаний звуков. Иногда привлекается этимологический анализ, с помо- щью которого можно понять происхождение неизвестных системе слов и предсказать особенности их произнесения.


2.3.4. Просодическая параметризация
Подготовленная по тексту фонемная транскрипция далее подвергает- ся просодическому анализу. Цель его состоит в определении необходимых для данного фрагмента высказывания интонации, темпа речи и громкости. Физическими коррелятами этих свойств является изменение частоты ос- новного тона, длительности сегментов и амплитуды сигнала. Интонаци- онный контур высказывания и его темпоральные характеристики, наряду с

информацией об акцентированности определенных слогов (синтагматиче- ского и фразового ударения), исключительно важны для создания пра- вильного ритмического рисунка фразы. Корректная просодическая пара- метризация не только облегчает восприятие синтезированного сигнала, но и позволяет акцентировать внимание слушающего на наиболее важных моментах, а также добавлять определенные семантические нюансы.


Расчет длительности составляющих высказывание сегментов являет- ся важным фактором правильного формирования просодии. Разработчики используют для этого два основных подхода. Традиционно применяется методика, основанная на заранее сформулированных правилах: по умол- чанию системой используется некая базовая средняя длительность еди- ниц, которая модифицируется для каждой конкретной фразы. В последнее время все чаще стал применяться подход, основанный на обучении систе- мы на материале большого речевого корпуса с привлечением большого количества контрольных факторов. Такой метод позволяет получить более разнообразные и естественно звучащие просодические структуры.
Наконец, осуществляется моделирование интонационного контура. Здесь следует учитывать, что супрасегментные просодические характери- стики, такие как диапазон изменения высоты голоса, деклинация (посте- пенное снижение интенсивности сигнала к концу высказывания) и ис- пользование различных средств выделения тех или иных фрагментов речи в большой степени зависят от стиля произнесения. На вход подается ин- формация в символьном виде, представленная в виде цепочки транскрип- ционных символов с указанием фразового и словесных ударений, а также длительности сегментов, и вычисляется последовательность значений для частоты основного тона. При этом могут использоваться как интонацион- ные шаблоны, заранее смоделированные для данного типа высказывания, так и модели, полученные на этапе обучения системы на реальном рече- вом материале.
Результатом лингвистического анализа текста является транскрипци- онная запись, снабженная контрольной информацией о длительности сег- ментов и частоте основного тона, которая передается далее в блок собст- венно синтеза (см. рис. 1). Озвучивание просодически параметризованной фонетической транскрипции, т. е. ее преобразование в оцифрованный зву- ковой сигнал, далее реализуется по одному из описанных выше методов синтеза — компилятивного, формантного, селективного и др.




  1. Достарыңызбен бөлісу:
1   ...   59   60   61   62   63   64   65   66   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет