388
Деректерді жинау. Жазылған мәтін
авторымен келісімшарт жасау, аудио немесе видео жазбаның
форматын таңдау, жазба жазу үшін құралдар мен материалдарын жасақтау, орын және жағдай дайындау
және т.б. Деректерді жинау процесі лабораториялық немесе табиғи жағдайда іске асады. Ал ауызша сөй-
леу мәтіндері ретінде радиобағдарламалардың, ресми құрылымдардың мәжілістерінің, радиопікір-
таластардың, ресми емес жеке сұхбаттардың, радиосұхбаттардың, университет дәрістерін алуға болады.
Транскрипция жасау – аудио немесе видеожазбаларды транскрипциямен синхрондау. Транскрипция
–
белгілі бір тілдегі дыбыстарды дәл бейнелеп көрсету үшін пайдаланылатын шартты белгі. Жазуда бір
фонема түрлі әріптермен таңбалануы мүмкін, ал транскрипцияда ол бір таңбамен белгіленеді. Транскрип-
цияның негізгі қызметі сөздің дыбыстық немесе фонемалық
құрамын дәлме-дәл көрсету, онда сөздің
дыбыстық жағына ғана назар аударылады. Бір әріп ыңғайына қарай түрлі фонемаларды белгілесе,
транскрипциялық таңба бір ғана мағынаға ие болады. Транскрипция екіге бөлінеді: фонематикалық және
фонетикалық. Фонематикалық транскрипция сөздердің дыбысталуындағы өзгерістерді ескермей, тек
фонемаларды жазады, дыбыстар сөздің айтылуына жуықтап беріледі. Мысалы, ору [орұу], қи [қый], шикі
[шійкі].
Фонетикалық транскрипцияда сөздердің айтылуындағы дыбысталу ерекшеліктері дәлме-дәл
көрсетіледі: қазан қап [Қазаңғап], ортан бел [ортамбел], сейсенбі [сейсембі]. Әрбір жеке тілдің фонемалық
жүйесін айқындауда фонемат. Транскрипция жұмсалса, ал фонетикалық Транскрипция барлық тілдердегі
дыбыстық ерекшеліктерді түгел көрсету үшін қолданылады. Оқу барысында
көбіне фонематикалық
транскрипцияға жүгінуге тура келеді, яғни сөздер мен сөз тіркестерін, тұтас мәтінді айтылуына біршама
жуықтатып жазу қажеттігі туындайды. Жеке дыбыстар мен әріптердің айтылуы мен жазылуындағы
айырмашылықтар, көрші дыбыстардың бір-біріне әсері ескеріліп отырады. Қазіргі қазақ тілінде
қолданыста жүрген и, у, ю әріптерінің әрқайсысы екі-үш тіпті онан да көп дыбыстарды құрайды: у – ұу-
ұшу [ұшұу], үу- жүру [жүрүу]; и – ый- сиқыр [сыйқыр]; ю – йұу-құю [құйұу], т.б.
Транскрипция бойынша (арқылы) бөгде сөздің дыбыстық формасы қайта жасалынды, ал
транслитерация арқылы сөздің графикалық формасы (әріптік құрамы) қайта жасалынады. Сөйленім
синтезінде жасау барысында шеттілдік сөздердің транскрипциялануы қиындық тудыратынын айтқымыз
келеді: твит(т)ер, фе(э)йсбук немесе Facebook, twitter.
Сөйленім синтезінде ауызша мәтінге метабелгіленім жасау маңызды. Метабелгіленім арқылы ауызша
мәтіннің авторы, жынысы,
аудиотаспаға жазылған уақыты, стиль түрін анықтай аламыз. Төменде
көрсетілген метабелгіленім компьютерлік бағдарламалар арқылы жүзеге асатын шартты таңбалардан
тұрады.
Сөйленім синтезінің метабелгіленімінің параметрлері:
<Белгілеуші > (белгілеушінің аты-жөні) <\Белгілеуші >
<Диктордың немесе автордың аты-жөні> <\ Автордың аты-жөні >
<Диктордың немесе автордың жынысы> әйел <\Автордың жынысы>
<Диктордың немесе автордың туған жылы> <\Автордың туған уақыты>
<Аудиотаспаға жазылған мерзімі (жазылған уақыты)> <\Мерзімі (жазылған уақыты)>
<Сөзформа саны> <\Сөзформа саны>
<Стиль> <\Стиль>
<Мәтін формасы> <\Мәтін формасы>
<Аудитория жасы> <\Аудитория жасы>
<Синтезге енгізілу уақыты> <\Корпусқа енгізілу уақыты>
<Мәтін хронотопы> <\Мәтін хронотопы>\
Қорыта айтқанда, сөйленім база немесе сөйленім корпусы тіл ресурстарын ең маңызды түрі болып
табылады. Сөйленім базасын жасау барысында дыбыстардың әртүрлі реңктері, аллофондарын ғылыми
тұрғыдан айқындау ең күрделі жұмыс болып табылады. Сөйленім корпусы – сөйленім бөлігінің
бағдарламалық жиынтығы. Сөйленім бөлігі базалық бірлік тәрізді сөйленім
сигналдарының цифрлық
базалық блок болып табылады. Фонетикалық корпусты қалыптастыру үшін сөйленім синтезінің әдістері
негізге алынады.
Достарыңызбен бөлісу: