автоматты аударма
жасау процесінде ондай
тәсіл бөліктері міндетті түрде орын алуы қажет.
АНАЛИЗ СИНТЕЗ
(талдау) (жинақтау)
«Х»-ті өзгерту «Ү»-ті өзгерту
Сызба.
Автоматты аударма процесінің
идеалдық құрылымы
Ал сызбадағы «өзгерту» топтамасының қажеттілігі ең
қарапайым жағдайда да айқын байқалады. Мысалы, аударуға
қажетті «Х» тілінің сөздік бірлігі мағыналық жағынан екінші тілдің
(«Ү») сөздік бірлігімен және екі тілдің («Х» пен «Ү») синтаксистік
құрылымдары да бір-бірімен сәйкес келіп тұрған жағдайда да
(тіпті сөздердің орналасу тәртібіне дейін) тиісті өзгерістердің
жасалатыны белгілі. Негізінен алғанда, сөздердің грамматикалық
тұлғалары мен аударма баламасының сөйлем ішінде дұрыс
орналасу тәртібі өзгертуді қажет етеді.
Бірақ жоғарыда қарастырылған жайт идеалды жағдаятына
сай және тілдің шектеулі сөздік бөлігі мен синтаксисіне тән
Ауызша аударма
Жазбаша аударма
Ілеспе аударма
Ізбе
-
із аударма
Көркем аударма
Аөпараттыө аударма
Параөтан аудару
Абзацты
-
фразалы аударма
«Х» тіліндегі
бастапқы мәтін
«Ү» тіліндегі
нәтижелік мәтін
«Х» тілініө ішкі тілдік
көрінісіндегі мөтін
«Ү» тілінің ішкі тілдік
көрінісіндегі мәтін
Мәтіннің мән
-
мағынасы
(мазмұны)
96
болып келеді. Сонымен бірге мұндай жағдаят тек әрбір нақты
тілдер жұбы үшін ғана ұтымды деуге болады. Әзірше екі тілдің
лексикалық бірліктері мен синтаксистік құрылымдары бойынша
басым көпшілік тілдерге жоғарыда аталғандай тұспа-тұс сәйкестік
жайлы айту қиын. Оған себеп – әртүрлі тілдердегі көп мағыналы
сөздер көлемінің сәйкес келмеуі. Лексикалық сәйкестіктің ең соңғы
бұзылу жағдайы – қайсыбір тілдерде баламасыз лексиканың болуы.
Әдетте, олар тұрмыстық бұйымдарды, мәдениетті сипаттайтын
сөздердің екінші (аударуға қажетті) тілдің лексикалық қорынан
орын алмайды. Мұндай жағдай лексикалық элементті сипаттау
немесе калькалау үшін оның мәнін дұрыс түсінуді қажет етеді.
Басқаша айтқанда, мағынаға сәйкес келтіру үшін қажетті деген
өзгертулерді (өңдеулерді) жүргізу керек болады.
Егер аударма мәселесін,
автоматты аударманы
қоса
есептегенде, тіларалық сәйкестіктің бұзылуы тұрғысынан
қарастырсақ, онда оның мақсатын екі тіл жұбы мәтіндерін
мағыналық сәйкестікке келтіру деп ұғыну қажет. Яғни екі тіл
арасындағы әртүрлі элементтердің (сөздік, құрылым, сөздер
тәртібі және т.б.) мазмұнды ашу құралдарын сәйкестікке келтіру
деп түсіну керек болады. Мұндай сәйкестікке келтіру мәселесін
шешу жоғарыда көрсетілген сызбадағы топтамалар қызметінің
барлық машиналық аударма жүйесінде орындалуын қажет етеді.
Сәйкестікке келтіру мүмкіндігі және аударманың принциптік
жақтарының барлық тілдерге ортақ болуы тілдің сызықтық және
таңбалық сипаттарына негізделеді (Ф. де Соссюр). Ал таңбалық
қасиеттің негізінде (мағыналық тұрғыда) барлық халықтардың
ойлау қызметін таңбалау мен қоршаған ортаның физикалық ортақ
қасиеттерінің жататыны белгілі.
Машиналық аударманың «өмірге келуіне», біріншіден, ХХ
ғасырдың екінші жартысынан бастап әр елдерде (континенттерде)
бірнеше тілдегі ақпарат ағымының қарқындап өсуі, екіншіден,
ғылыми-техникалық прогресс үшін оларды меңгеру қажеттігіне
қатысты әлеуметтік себептер негіз болды. Осыған байланысты
машиналық (автоматты) аударма жұмысының даму барысына
қатысты кейбір жайттарға тоқталайық.
Аталған әлеуметтік себептер аударма мәселесінің шешімін
табуды және оның ұтымды жолдарын іздестіруді қажет етті. Бұған
97
ең алдымен аудармашының тілдік қызметінің ерекшеліктері ішінен
шеттілдік мәтіннің құрылымын зерттеудегі таза формалды талдау
жолын жатқызуға болады [21]. Мысалы, аудармашыға мәтіннің
грамматикасы және лексиканың көмекші сөздері мен есімдік
сөздері және басқа да осы сияқты функционалды грамматиканың
элементтері белгілі болғанымен, салалық мәтіннің арнайы
лексикасы таныс болмауы мүмкін.
Шеттілдік мәтінді аударудағы оның тұрпаты (формасы)
бойынша мән-мағынаны ашу ерекшеліктерін модельдеу, ең
алдымен, аудармашының іс-әрекетін зерттеу нысаны ретінде алуға
бірден-бір себепші болды. Сонымен, мұндай модельдеу шеттілдік
мәтінді аударуда тілдің ақиқат деректерін «шеттетіп», тілдің
семантикасын арнайы талдамай-ақ, формалды тұрғыда аударма
баламасын табуға мүмкіндік жасайды.
Автоматты аударма жасаудың бастамасы ретінде ресми түрде
1949 жыл саналады. Тілді формалды тұрғыда қарастыра отырып,
электронды-есептеу техникасының көмегімен аударманы жүзеге
асырудан бұрын оны механикалық машиналар жолымен іске асыру
идеясы аталған мезгілден де көп бұрын бастама алғаны белгілі.
Мысалы, А.Кахердің ойлап тапқан аударма-жазба машинасы
жайлы мәлімет «Үава таа» газетінде 1924 жылдың 24 ақпанында
шағын хабарлама ретінде жарық көрген болатын [22]. 1933 жылы
Кеңес Одағында П.П.Смирнов-Троянскийге бір тілден екінші
тілге аудару машинасын ойлап шығарғаны үшін арнайы патент
тапсырылғаны да жұртшылыққа мәлім [23].
Аударма жасауда екі немесе одан да көп тілдердің
бірліктері арасындағы мағына сәйкестігін анықтау үшін
алғашында механикалық тәсілдер қолданылды. Сондықтан
аударма жұмыстарының жетістіктері әлемдік ғылымға тек
ХХ ғ. 50-жылдарында ғана белгілі бола бастады. Ең алғашқы
машиналық аударма жүйелері АҚШ-та пайда болды. Тарихи
тұрғыдан қарастырғанда машиналық аударма жүйесін құрастыруға
жалпытілдік көзқарастағы криптография (шартты белгілермен
жазылған құпия жазу) саласының теориясы мен практикасы негіз
болды.
Екінші дүниежүзілік соғыс кезінде әр елдерде, әсіресе Англия
мен АҚШ-та құпия хаттардағы шифрлы жазуды үйреншікті жазуға
98
ауыстыру (дешифровка) жұмысын машинасыз да және машинамен
де әрекет ету арқылы көптеген нәтижелерге қол жеткені
белгілі. Мысалы, гитлерлік басқару орындарының шифрланған
бұйрықтары мен хабарларын жай жазуға айналдыратын «Ультра»
атты дешифровалды машинаның құрастырылғанын айта кетуге
болады.
Лингвистикалық тұрғыдан қарастырғанда, шифрланған (код-
талған) хабарды дәстүрлі жазуға келтіру дегеніміз, ол лексикалық
қоры белгісіз және грамматикалық ережелері әлі анықталмаған
шет тілінде жазылған мәтінді аудару жағдаятымен барабар деуге
болады. Мұндай аударма жұмысы бір кодтағы жүйеден екінші
кодтағы жүйеге ауыстыру әрекетімен бірдей келеді.
Дешифровщиктер мамандардың пайымдауынша, шифрланған
(кодталған) хабарды жай жазуға келтіру әрекетіне қарағанда бір
табиғи тілдегі мәтінді екінші табиғи тілге аудару әрекеті жеңіл деп
бағаланады. Себебі, қазіргі табиғи тілдерді сипаттайтын көптеген
сөздіктер мен грамматикалардың негізінде тілдің өзіне ғана тән
лексикалық, морфологиялық және синтаксистік ерекшеліктері
алдын ала белгілі деуге болады. Ал есептеу техникасы ондай
сөздіктер мен грамматикаларды қалаған тәртіпте, бағдарламаға
сай өз жадында орналастыра алады.
1946-1947 жылдары ЭЕМ арқылы машиналық аударма жасау
идеясы Принстонның ғылыми-зерттеу институтында арнайы
мәселе ретінде талқыланады (У.Уивер, А.Л.Бут және т.б.). Ең алғаш
бұл идея дешифровка ісінің америкалық маманы Уоррен Уивердің
меморандумында бірізді шешімге келтірілді. Ал 1949 жылдың
15 шілдесінде атақты ғалым өз меморандумында көтерілген
мәселелерді тіл және есептеу техникасы мен дешифровка
салаларындағы екі жүзден астам мамандарға жария етті.
У.Уивер машиналық аударманың принциптік мүмкіндігін
мүлде бөлек тілдердің ұқсас қасиеттерімен және әр тілдің өзіне
ғана тән формалды сипатта болуымен байланыстырады. Қорыта
айтқанда, У.Уивердің пікірі бойынша, қытайша жазылған кітапты
қытайша шифрланған (кодталған) ағылшынша немесе басқа
ұлттық тілдердегі кітап деп түсінген жөн [24, 33-45-бб.].
Сонымен машиналық аударманың өзінше бөлек ғылыми бағыт
ретіндегі даму кезеңі Уивердің меморандумынан бастама алады.
99
Бұл бағытты, шартты түрде, негізгі үш кезеңге бөліп қарастыруға
болады [25; 19; 26; 27]. Мысалы, ол хронологиялық жағынан
былайша айырым табады:
1-кезең: 1949 жылдан бастап 60-жылдардың ортасына дейін;
2-кезең: 60-жылдардың ортасынан 70-жылдардың аяғына
дейін;
3-кезең: 80-жылдардан қазіргі кезеңге дейін.
Мұндай үш кезеңге бөлуге негіз болған ғылым мен техниканың
дамуындағы қол жеткен нәтижелер екені белгілі. Міне, солардың
ішінен лингвистикалық, математикалық, техникалық машиналық
аударма жүйесін жабдықтау мәселелері айрықша орын алады.
1954 жылы АҚШ-та Джорджтаун университетінде проф. Леон
Е.Достердің жетекшілігімен GAT жүйесі негізінде құрастырылған
орыс тілінен ағылшын тіліне аударатын машиналық аударма
жүйесі жұртшылық назарына ұсынылды. Бұл бір тілден
екінші тілге ЭЕМ (IBM-701) арқылы орындалған ең алғашқы
аударма тәжірибесі болып саналады. Ғылымда бұл тәжірибе
Достарыңызбен бөлісу: |