Г. Комантай, Б. З. Андасова, А.Ә. Шәріпбаев Қазақ мәтінін бір графикадан екінші графикаға түрлендіру



Дата15.09.2017
өлшемі244,47 Kb.

Г. Комантай, Б.З. Андасова, А.Ә. Шәріпбаев


Қазақ мәтінін бір графикадан екінші графикаға түрлендіру


(Л.Н.Гумилев атындағы Еуразия ұлттық университеті, Астана қаласы)
Жұмыста төте жазумен жазылған қазақ тіліндегі мәтінді кирилл графикасына және керісінше түрлендіру мәселесі қарастырылып, түрлендіру ерекшеліктері сипатталады. Екі әліпби әріптерінің арасындағы бірмәнді емес түрлендіру мәселесін шешу аралық әліпбиді қолдануға негізделеді.

Дүние жүзіндегі қазақтар бірнеше түрлі жазу үлгісін қолданып отыр, атап айтқанда:



  • Қазақстан Республикасында — кирилл жазуы негізіндегі әліпбиді, ресми түрде Қазақстанның бүкіл аумағында және Моңғолияның Баян-Өлгей аймағында, көршілес Қырғызстан, Ресей, Түрікменстан және Өзбекстан елдерін бірыңғай мекендеген қазақ жұрты пайдаланады, сонымен бірге басқа ыдыраған КСРО республикаларында да пайдаланылады.

  • Қытай Халық Республикасында — араб жазуы негізіндегі Ахмет Байтұрсынұлы (төте жазу) әліпбиі, ресми түрде Шынжаң Ұйғыр Автономиялы Районындағы (ШҰАР) Іле Қазақ Автономиялық Облысында, сондай-ақ Ауғанстан, Иран және Пәкістан елдеріндегі қазақ диаспорасы да пайдаланады.

  • Түрік Республикасында — қазақ диаспорасы ресми емес түрде латын жазуы негізіндегі түрік әліпбиін пайдаланады. Сонымен бірге, Алмания, АҚШ және тағы басқа да батыс елдерінде қазақ диаспорасы әртүрлі қалыпты емес латын жазуын пайдаланады [1].

Әртүлі жазу негізіндегі әліпбилердің қолданысы әр түрлі мемлекеттерде тұрып жатқан қазақтардың бір-бірімен ақпарат алмасуына, мәдени қарым-қатынасына кедергі келтіріп, өз әсерін тигізеді.

Ресми деректер бойынша, Қытайда 1,8 миллиондай қазақ тұрады. Бұл елдегі қазақ диаспорасының қазақ тілі Ахмет Байтұрсынұлы ыңғайлаған төте жазу әліпбиіне негізделгендіктен біз пайдаланып жүрген кирилл графикасы түріндегі жазуларды оқу оларға көп қиындық тудырады.

Қытайдағы таза қазақ тілінде жарық көретін «Іздену», «Ұлттар ынтымағы» сияқты мемлекеттік деңгейдегі саяси журналдар, «Ғылым бұлағы», «Көкжиек», «Шұғыла» сынды ШҰАР-дың орталығынан шығатын жалпы саны 20-ға тарта газет-журналдар басылымдары түгел төте жазу түрінде жазылады. Сонымен қатар, Қытайда көптеген төте жазу түріндегі қазақша интернет сайттары жұмыс істейді. Қытайда қазақстандық баспасөз өнімдеріне деген сұраныс өте жоғары, алайда Қытай қазақтары қолданатын төте жазу Қазақстанмен ақпараттық байланысқа көп кедергі жасауда. Ең қарапайымын айтсақ, осы кирилл графикасын білмегендіктен Қытайдағы Қазақстан елшілігінің тиісті аймақтардағы консулдық мекемелерінде виза алу барысында қазақ азаматтары көптеген қиындыққа тап болып отыр.

Сонымен бірге, Қытайдағы компьютерлік құрылғылар мен интернетті пайдалану бағасының арзан болғандықтан, ол елдегі қазақтардың көп бөлігі аймақ пен аудандардың өзінде ғаламторды кеңінен шарлайтын мүмкіндікке ие болып отыр. Бұл орайда, әдетте, олардың ең алдымен іздейтіні – атажұрттың, Қазақстанның жаңалықтары болып келеді. Сондықтан да, әртүрлі графикада жазылған қазақ мәтінін өзара бір-біріне түрлендіру мәселесі бүгінгі таңда ұлт бірлігін сақтау үшін де, ұлттық құндылықтарымызды сақтау үшін өзекті болып табылады.

Осы аталған жағдайларды ескере отырып жасалған «Қазақ мәтінін бір графикадан екінші графикаға автоматты түрлендіру» жүйесікелесі мүмкіндіктерді береді:



  • бір жағынан, Қазақстанға жаңадан қоныс аударған, әрі латын немесе төте жазу әліпбилерінің жазуымен сауат ашқан, кирилл графикасын білмейтін қандастарымызға, мектеп оқушыларына, жоғары оқу орындарындағы студенттерге өздеріне үйреншікті төте, латын жазуы түрінде ақпаратпен танысу мүмкіндігін беру арқылы оқу процесін тиімділесе,

  • енді бір жағынан, Қытай Халық Республикасында өмір сүріп жатқан қазақтардың тіршілік-тынысымен, салт-дәстүрімен, әдебиеттегі жаңалықтарымен, мәдениетімен танысқысы келген алаш азаматтарының төте, латын жазулары түрінде ашылған интернет сайттарына жол алуына жеңілдік жасайды,

  • сондай-ақ, шалғай өңірдегі ата жұртына аңсары ауып отырған Қытайдағы қандастарымызға қазақ жерінде, елімізде болып жатқан болмыстардан интернет арқылы болса да ақпарат алу мүмкіндігін береді.

«Қазақ мәтінін бір графикадан екінші графикаға автоматты түрлендіру» жүйесінің негізгі мақсаты: кирилл, латын және Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерімен жазылған қазақ тіліндегі мәтінді өзара бір-біріне автоматты түрде түрлендіруді жүзеге асыру болып табылады. Түрлендіруді жүзеге асыру үшін аталған әліпбидердің ерекшеліктері талданды..

Ахмет Байтұрсынұлы (төте жазу) әліпбиінің ерекшеліктері

ХХ ғ. басында халқымыздың ұлы перзентi, ғұлама ғалым Ахмет Байтұрсынұлы ескi қазақ жазба тiлiн күллi қазақ халқының игiлiгiне айналдыру идеясын ұсынды. Басқаша айтқанда, жазу-сызуды демократияландыру арқылы күллi халықты сауаттандыру iсiне бар бiлiмiн, күш-жiгерiн салды. Халықты жаппай сауаттандыруды, бiлiм берудi тезiрек қолға алмаса, қазақ қоғамының заман ағымына iлесе алмай, қалып қоятынын терең түсiне бiлген ғалым жүйесi аса күрделi ескi қазақ жазба тiлiне түбегейлi реформа жасады [1].



Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерінің ерекшеліктерін түсіну үшін оның ерекшелігін бірнеше жақтан қарастырайық [2]:

  1. Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерінің құрамы. Ахмет Байтұрсынұлы (төте жазу) әліпбиінің құрамында 29 әріп және бір белгіше бар. (ء) — «жоғарғы һәмзә», бұл белгіше бүкіл сөздегі Ә(ءا), Ө(ءو), Ү(ءذ), І(ءئ) жіңішке дауысты дыбыстарын белгілеу үшін, сөздің басына ғана қосылады. Мейлі бұл дауысты дыбыстар сөздің ортасына келседе осы белгіше(ء) тек қана сөздің басында тұрып, осы сөзді жіңішкертіп тұрады. Мысалы, «іңір» сөзі «ﻇﺜﺌﺮ» түрінде («ﻇﺜﻈﺮ» емес), «түн» сөзі «ءﺗﺈﻥ» түрінде («ءﺈﻥ» емес), т.с.с болып жазылады. Бірақ, жіңішке дауысты дыбыстармен әрдайым үйлесетін К, Г және Е әріптері бар жерге осы белгіше(ء) қосылмайды. Басқаша айтсақ, осы дауысты дыбыстармен қатар сөз ішінде К, Г және Е әріптері де жалғасып келсе, онда осы белгіше(ء) алынып тасталады, яғни, осы дауысты дыбыстардың орнына, осы дауысты дыбыстардың жұп дыбыстары қолданылады. (Ә(ءا)—А(ا), Ө(ءو)—О(و), Ү(ءذ)—Ұ(ذ), І(ءئ)—Ы(ئ)). Мысалы, «әке» сөзі «اﻛﺔ» түрінде («ءاﻛﺔ» емес), «гүл» сөзі «ﮔﺈﻝ» түрінде («ءﮔﺈﻝ» емес), «үйрек» сөзі «ﺇﻳﺭﺓﻙ» түрінде («ءذﻳﺭﺓﻙ» емес), т.с.с болып жазылады [2].

  2. Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерінің жазылу бағыты. Ахмет Байтұрсынұлы (төте жазу) әліпбиінің жазылу әдісі араб, парсы мәнеріне негізделінген. Жазылу бағыты оңнан солға қарай болып келеді.

  3. Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерінің бейнеленуі. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде әрбір әріптің бейнеленуі сөз ішіндегі орнына байланысты әртүрлі болып келеді. Мұнда А, Ә, В, Д, Е, З, О, Ө, Р, У, Ү, Ұ, Һ әріптері сөз ішінде «сөзбасы» және «сөз соңы» деген 2 түрлі жағдайда келсе, қалған Б, Г, Ғ,Ж, Й, К, Қ, Л, М, Н, Ң, П, С, Т, Ф, Х, Ч, Ш, Ы, І әріптері сөз ішінде «сөз басы», «сөз ортасы», «сөз соңы» және «жеке тұрғаны» деген 1-ші кестеде көрсетілгендей 4 түрлі жағдайда кездеседі.

  4. Ахмет Байтұрсынұлы (төте жазу) әліпбиінің әріптеріндегі ерекше жағдайлар. Ахмет Байтұрсынұлы (төте жазу) әліпбиінің маңызды бір ерекше жағдайы Л әрпінің соңынан А әрпінің жалғасып келуі болып табылады. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде Л әрпінің соңынан А әрпі жалғасып «ЛА» түрінде келсе, кестеде көрсетілгендей сөз басындағы «Л()» әрпіне сөз аяғындағы «А()» әрпі жалғасып келеді де «ЛА ()» түрінде жазылады.

  5. Ахмет Байтұрсынұлы (төте жазу) әліпбиінің әріптері мен кирил жазуы әліпбиінің әріптері арасындағы айырмашылықтар. Жоғарыда айтып өткеніміздей, Ахмет Байтұрсынұлы (төте жазу) әліпбиінің құрамындағы 29 әріп және бір белгіше(ء), сондай – ақ, Ә(ءا), Ө(ءو), Ү(ءذ), І(ءئ) жіңішке дауысты дыбыстарын қосқанда жиыны 33 әріптің бейнесін кестеден көре аламыз. Ал қалған 9 әріп (Ё, И, Ц, Щ, Ъ, Ь, Э, Ю,Я) Ахмет Байтұрсынұлы (төте жазу) әліпбиінде жоқ.

Ахмет Байтұрсынұлы (төте жазу) әліпбиінде жоқ осы 9 әріпке (Ё, И, Ц, Щ, Ъ, Ь, Э, Ю,Я) жеке тоқталайық:

  1. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде И(ي) әрпі біреу ғана болады да ол дауысты дыбыстан кейін келсе дауыссыз дыбыс рөлін, ал дауыссыз дыбыстан кейін келсе дауысты дыбыс рөлін атқарады.

Кесте 1 – Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптері мен кирилл әліпбиі әріптерінің салыстырмалы кестесі



Әріп

Сөз басы

Сөз орта-сы

Сөз соңы

Жеке тұрғаны


Әріп

Сөз басы

Сөз орта-сы

Сөз соңы

Жеке тұрғаны


А - ا

ا






ا

П- پ







پ

Ә- ءا

ءا






ءا

Р- ر








ر

Б- ب







ب

С- س







س

В-











Т- ت







ت

Г- گ







گ

У- ؤ

ؤ









Ғ- ع







ع

Ұ- ذ








ذ

Д- د

د






د

Ү- ءذ

ءذ






ءذ

Е- ة

ة






ة

Ф- ف







ف

Ё













Х- ح









Ж- ج







ج

Һ- ه











З- ز








ز

Ц













И













Ч-









Й- ي







ي

Ш ش







ش

К- ك







ك

Щ













Қ- ق







ق

Ъ













Л- ل







ل

Ы ئ







ئ

М- م







م

І ءئ







ءئ

Н- ن







ن

Ь













Ң- ث







ث

Э













О- و











Ю













Ө- ءو

ءو









Я
















  1. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде Ъ, Ь әріптері болмайды.

  2. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде Ё, Ц, Щ, Э әріптері болмайды да, сәйкес орындарда Ц – С(س) немесе СС(ﺳﺲ), Щ – Ш(ش) немесе ШШ(ﺷﺶ) мысалы, ащы (ашшы), тұщы (тұшшы), Э – Е(ة) болып келе береді.

  3. Ахмет Байтұрсынұлы (төте жазу) әліпбиінде Ё, Ю, Я әріптері болмағандықтан, сәйкесінше Ё әрпі – Й() әрпі мен О() әрпінің қосындысы ЙО(ﻳﻮ) түрінде, Ю әрпі – Й() әрпі мен У() әрпінің қосындысы ЙУ(ﻳﺆ) түрінде (мысалы, аю – айу(اﻳﺆ)), Я әрпі – Й() әрпі мен А() әрпінің қосындысы ЙА(ﻳﺎ) түрінде (мысалы, ұя – ұйа(ﺇﻳﺎ) сая – сайа(ﺳﺎﻳﺎ)) келеді.

Жоғарыда 1-ші кестеде көрсетілгендей, Ахмет Байтұрсынұлы (төте жазу) әліпбиі құрамындағы әріптер саны мен кирилл графикасы әріптерінің саны сәйкес келмегендіктен, кирилл жазуын төте жазуға түрлендіру барысында бірмәнді емес түрлендіру мәселесінен қиындық туындайды.

Осы қиындықты болдырмау үшін «Қазақ мәтінін бір графикадан екінші графикаға автоматты түрлендіру» жүйесінt «өтпелі кирилл» деген атпен қазақ фонетикасы ережелері негізінде құрылған жаңа әліпбиді енгіілді.


Қазіргі кирилл әліпбиі әріптері мен өтпелі кирилл әліпбиі әріптері арасындағы айырмашылықтар:

Төмендегі 2-ші кестеде көрсетілгендей, қазіргі қазақ жазуында қолданылып жүрген кирилл әліпбиі 42 әріптен құралса, өтпелі кирилл әліпбиі 32 әріптің ( А, Ә, Б, В, Г, Ғ, Д, Е, Ж, З, Й, К, Қ, Л, М, Н, Ң, О, Ө, П, Р, С, Т, У, Ұ, Ү, Ф, Х, Ч, Ш, Ы, І) жеке тұруымен және олардың өзара бірлесіп келуінен (ЙО, ЫЙ, ІЙ, ҰУ, ҮУ, ШШ, ЙА, ЙҰУ, ЙҮУ) құралып тұр.

Өтпелі кирилл әліпбиіндегі 32 әріптің бейнесін кестеден көре аламыз. Ал қалған 10 әріп (Ё, И, Һ, Ц, Щ, Ъ, Ь, Э, Ю, Я) өтпелі кирилл әліпбиінде жоқ.

Кесте 2 – Қазіргі кирилл әліпбиі әріптері мен өтпелі кирилл әліпбиі әріптерінің салыстырмалы кестесі



Қазіргі

Өтпелі

Қазіргі

Өтпелі

Қазіргі

Өтпелі

А

А

Қ

Қ

Ф

Ф

Ә

Ә

Л

Л

Х

Х

Б

Б

М

М

Һ

Қ

В

В

Н

Н

Ц

С

Г

Г

Ң

Ң

Ч

Ч

Ғ

Ғ

О

О

Ш

Ш

Д

Д

Ө

Ө

Щ

ШШ

Е

Е

П

П

Ъ



Ё

ЙО

Р

Р

Ы

Ы

Ж

Ж

С

С

І

І

З

З

Т

Т

Ь



И

ый (ій)

У

У, Ұу (үу)

Э

Е

Й

Й

Ұ

Ұ

Ю

Йу

К

К

Ү

Ү

Я

Йа

Өтпелі кирилл әліпбиінде жоқ осы 10 әріпке (Ё, И, Ц, Һ, Щ, Ъ, Ь, Э, Ю,Я) жеке – жеке тоқталсақ:



  1. Өтпелі кирилл әліпбиінде И әрпінің орнына сөздегі буын үндестігіне байланысты «ый» немесе «ій» қолданылады (мысалы, қиын – қыйын, иман – ыйман, биік – бійік, киім – кійім).

  2. Өтпелі кирилл әліпбиінде Ъ, Ь, әріптері болмайды.

  3. Өтпелі кирилл әліпбиінде Ц, Щ, Һ, Э әріптері болмайды да, сәйкес орындарда Ц –С (мысалы, цемент – семент, абзац – абзас), Щ – ШШ (мысалы, ащы – ашшы, тұщы – тұшшы), Һ – Қ (мысалы, гауһар – гауқар, қаһарман – қақарман), Э – Е (экономика – економика, электр – электр, поэма – поема) болып келе береді.

  4. Өтпелі кирилл әлпбиінде Ё, Ю, Я әріптері болмағандықтан сәйкесінше, Ё = Й+О, Ю = Й+ҰУ немесе Ю = Й+Ү+У (мысалы, аю – айұу, ою – ойұу, күю – күйүу), Я = Й+А (мысалы, ұя – ұйа, сая – сайа) болып келеді.

  5. Өтпелі кирилл әліпбиінде У әрпінің орнына сөздегі буын үндестігіне байланысты «Ұу» немесе «Үу» қолданылады (мысалы, буын – бұуын, сурет – сүурет, оқытушы – оқытұушы, көру – көрүу).

Осылайша, бірмәнді емес түрлендіру мәселесін шешу үшін енгізілген өтпелі кирил әліпбиі арқылы Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптері мен кирилл графикасындағы әріптер санын теңестіріп аламыз да, ары қарай кирилл графикасы түріндегі мәтінді ең алдымен өтпелі кирилл түріне келтіріп, содан соң сол өтпелі кирилл түріне келтірілген мәтінді төте жазу түріне оңай түрлендіре аламыз. Бұл әдіс керісінше түрлендіру процесіне де, яғни кирилл графикасы түріндегі қазақ тіліндегі мәтінді латын жазуы түріндегі мәтінге түрлендіруге де жеңілдік жасайды.
ӘДЕБИЕТ
1. Ескеева М. Қазақ жазуының негіздері/Оқу құралы. – Астана.: ЕҰУ, 2002. - 120 б.

2. Байтұрсынұлы А. Тіл тағылымы. – Алматы.: Алаш, 1992.


Шарипбаев А.А., Андасова Б.З., Комантай Г.

Преобразования казахского текста с одной графики на другую

В работе рассматривается проблема преобразования казахского текста с арабской графики на кириллицу и обратно, описываются особенности преобразований. Решение проблемы неоднозначного преобразования между символами двух алфавитов основавано на применении переходного алфавита.


A.A. Sharipbaev, B.Z. Andassova, G.Komantai

Transformations of the kazakh text from one drawing on another

In article the problem of transformation of the Kazakh text from the Arabian drawing on Cyrillics and back is considered, singularities of transformations are described. A solution of a problem of ambiguous transformation between symbols of two alphabets is based on application of the transitive alphabet.


Достарыңызбен бөлісу:


©engime.org 2017
әкімшілігінің қараңыз

енгізу | тіркеу
    Басты бет


материалдарды жүктеу