«xxi ғасырдағЫ Ғылым және білім»


ЯКУБОВ М.С., ПАЯЗОВ М., ХУЖАКУЛОВ Т



Pdf көрінісі
бет208/236
Дата16.04.2022
өлшемі4,46 Mb.
#139665
1   ...   204   205   206   207   208   209   210   211   ...   236
Байланысты:
Сборник 3конф (1)

ЯКУБОВ М.С., ПАЯЗОВ М., ХУЖАКУЛОВ Т. 
(ТАШКЕНТ, УЗБЕКИСТАН) 
 
ПОВЫШЕНИЯ КАЧЕСТВА РЕЧЕВЫХ СИГНАЛОВ В 
РАСШИРЕННОМ ЧАСТОТНОМ ДИАПАЗОНЕ 
Идентификация и распознавания речи это самая распространенная речевая 
технология в нашей жизни. Для улучшение качества передачи речи нужна 
анализировать речи с помощью разных программных продуктов. Распознавание 
речи – это преобразование речевого сигнала в цифровую информацию. 


371 
Основном в звуковой речи участвуют шумы и тоны. По частотной 
характеристике шумы подразделяются на низкочастотные – 300 Гц, 
среднечастотный – 300-800 Гц и высокочастотный – 800 Гц. На сегодняшний 
день существуют эффективный метод для повышение точности и качества
восприятия речи на фоне шума и повышения разборчивости речи на разных 
устройствах с методами обработкой высокочастотных и низкочастотных фонем 
речи c методом анализа и исследования в расширенном частотном диапазоне 
[1]. 
Для достижения к этой цели анализированы составные части речевых 
сигналов - фонемы. Речевые сигналы рассматриваются в их фонетических 
компонентах. Каждая из этих фонем характеризуется определенным набором 
характерных частот, в которых сосредотачивается сила звука, причем каждый 
уровень частоты еще характеризуется определенной динамикой повышения и 
снижения. Метод позволяет получить результат на основе всестороннего и 
динамического анализа речевых сигналов в полном физиологически 
воспринимаемом человеком частотном диапазоне. Разработка решает проблему 
построения сигналов по адаптивной речевой базе данных с последующими 
алгоритмами для методов обнаружения соответствия текущих сигналов 
речевым образам. Как показывали исследования, за пределами используемого в 
целях связи урезанного частотного диапазона содержится определенная доля 
информации, необходимая для однозначного распознавания передаваемого 
речевого сигнала. В практике при передачи сигналов не рассматриваются более 
двух третьей физиологически воспринимаемого человеком частотного 
диапазона, а именно вся высокочастотная доля, которая, хоть и содержит 
меньшую долю акустической информации, но ответственная для акустического 
отображения ряда важных фонетических элементов. В практике отсутствие 
этой части сигнала компенсируется контекстными суждениями, при условии, 
что распознаваемая низкочастотная часть речевого сигнала позволяет этого с 
достаточной степени достоверности делать. Критическая ситуация может 
сложится в таких случаях, когда распознаваемая низкочастотная часть сигнала 
имеет несколько возможных решений по компенсации высокочастотной части. 
Эта ситуация многократно усугубляется в автоматизированных системах. 
Результат исследование предусматривает распознавание речевого сигнала 
путем экстракции необходимых для идентификации признаков и их сравнение с 
соответствующей базой образов (рис. 1).


372 
Рис.1. Алгоритм распознавания речевого сигнала 
При этом процесс распознавания осуществляется последовательно от 
фиксируемой совокупности признаков сигнала через проверяемую гипотезу 
предполагаемой информации до достаточно достоверно распознаваемого 
речевого сигнала (рис-2). 
Рис.2. Схема анализа и распознавания речевых сигналов
Восприятия речи с помощью определенных по каналам связи или других 
специальных устройств на примере слуховых аппаратов часто приведет 
непременно к искажением или к полному сбою информации [2].
Широко известны способы и методы нарушений слухового восприятия 
речевых сигналов, основанные на изменении громкости, фонемных 
составляющих, особенно высокочастотных или низкочастотных речевых 
сигналов соотношения сигнал/шум или сигнал/потеря иногда не дает точные 
адекватные результаты. Экспериментально доказано что в большинство 


373 
случаев при распознавании речи применяемые для сжатия данных речевые 
кодеры используют в качестве алгоритмов различные психики акустические 
модели в результате чего из речевого сигнала удаляются якобы 
несущественные компоненты амплитуды (силы звука) и частоты. Но для 
анализа и исследования разных речевых сигналов были использованы не 
компримированные никакими кодерами студийные аудиозаписи речевых 
сигналов в расширенном частотном диапазоне. 
С учетом вышеизложенного можно однозначно установить, что 
адекватного распознавания и идентификации речи необходимо обязательное их 
изучение в расширенном диапазоне частот и внедрять на практике.
Вместе с тем изобретения показывает, что с учетом поведения факторов 
речевого сигнала во время его звучания каждый фон характеризовался 
определенными численными значениями, которые с учетом некоторых 
отклонений образовал своего рода сигнатуру.
Этот обстоятельство подчеркивает принципиальную возможность, 
использовать для идентификации и распознавания речевых сигналов методы 
распознавания образцов, дающих более корректные результаты, чем 
используемые в настоящее время вероятностные рассмотрения 


Достарыңызбен бөлісу:
1   ...   204   205   206   207   208   209   210   211   ...   236




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет