Аударманың Өзекті мәселелері алматы, 2015



Pdf көрінісі
бет48/120
Дата04.09.2022
өлшемі2,17 Mb.
#148709
түріБағдарламасы
1   ...   44   45   46   47   48   49   50   51   ...   120
Байланысты:
audarmanyng ozektigi Kulmanov

Тікелей бинарлық
аударма машиналық аударманың «ескі» 
жүйелерінен орын алса да, сол қалыпта машиналық аударманың 
көптеген практикалық жүйелерінің негізгі стратегиясына 


117
айналып отыр. Мұндай тәсіл нақты тілдік жұпқа, яғни қос 
тілдерге бағышталады (GAT, SYSTRAN жүйелері және олардың 
дереваттары Бүкілодақтық аударма орталығында
 
зерттелген 
АРМАС жүйесі). Бинарлық аударма әрекеті кезінде сегменттердің 
шекарасын анықтау мен омонимияны мәнмәтінге қатысты ажырату 
негізінде сөйлемдерге қарапайым өзгертулер (трансформация) 
жүргізіледі.
Бұрынырақ зерттелген машиналық аударма жүйесін құрастыру 
тәжірибесі мен оны пайдалану тиімділігі, олардағы аса күшті 
сөздіктер қоры мен арнайы түзету (редакциялау) тәсілдерінің 
негізінде деуге болады. Оған Джорджтаун университетінің 
GAT жүйесі мен оның түрлі варианттық жүйелері мысал бола 
алады. Бірақ жеке лексика-морфологиялық және семантика-
синтаксистік ішкі құрылымдар (подструктуры) негізінде іске 
асатын тікелей бинарлық сәйкестендіру жүйенің лингвистикалық 
және программалық жабдықталуын тек нақты тілдер жұбының 
ерекшеліктеріне ғана бағыштап қоймай, сонымен бірге ішкі 
тілдердің (подъязык) айырым-белгілеріне де қатаң түрде көңіл 
бөлуді қажет етеді. Егер тіл жұптарының бір сыңары басқа бір тілге 
ауыстырылса, іле-шала лингвистикалық, ал кейбір жағдайларда 
программалық жабдықтауларды да қайта құру қажет болады. 
Трансформациялық машиналық аударма
(трансфер 
арқылы аударма) әдісі де машиналық аударма дамуының екінші 
кезеңінде қолданылып, сынақтан өтті. Трансферді пайдаланатын 
бұл стратегияны қолдану – түрлі тілдердің мәтіндеріне тікелей 
қатысы бар жазбаларды жүзеге асырудың мүмкін еместігі 
жөніндегі теориялық болжамға негізделеді. Мұндай байланыс 
түрі әртүрлі деңгейдегі жалғас жұмсалымдар жолымен анықталуы 
мүмкін: лексикалық, морфологиялық, синтаксистік құрылымдар 
деңгейінде (конфигурациялық және реляциондық синтаксис 
терминдерімен) және синтаксис деңгейінде сипаттау. Түрлі 
деңгейдегі талдаулар кезінде «кіретін» сөйлемнің құрылысын 
сипаттайтын трансферді пайдалану бағыныңқы таралымнан 
базалық грамматикалық бірліктер ретіндегі басты астырт 
құрылымға (к глубинной ролевой структуре) біртіндеп өтуді 
көздейді және одан әрі «шығатын» бағыныңқы таралымға өтеді. 
Мұндай кезде тек белгілі бағыныңқы таралымға қатысты қайта 


118
құру әрекеті сөйлемнің толық түсінігінің моделін құрастырмай-ақ 
машиналық аударма жасауға мүмкіндік тудырады. Бұл мәселенің 
шешімін табу машиналық аударма кезінде міндетті емес, өйткені 
астырт (глубинной) семантикалық-синтаксистік құрылымдарға 
түсініктеме беру тұтынушының үлесіне қалдырылады, яғни 
ЭЕМ-нан шыққан аудармамен әрі қарайғы жұмыс істейтін маман 
аудармашының үлесіне тиеді. Трансферді қолданудың мұндай 
тәсілі көптеген шетел ұжымдарымен бірге машиналық аударма 
жүйесін қолданатын бірқатар ресейлік ұжымдарға да тән болып 
келді. 
Аталған жүйелерде аударманың негізгі үш сатысын бөліп 
айтуға болады: талдау (анализ), трансфер және жинақтау (синтез). 
Әрбір саты жүйелі субпроцестер түрінде орындалады. Мәселен, 
жоғарыда аталған SUSY атты жүйеде талдау әрекеті 8 субпроцесті 
қамтиды. Нәтижесінде талдауға қатысты «кіретін» сөйлемнің 
таралымы құрастырылады және «шығатын» сөйлемнің таралымы 
жайлы мәлімет 8 субпроцессордан тұратын трансфер түрінде 
көрініс табады. Талдау кезеңінде бұл таралым үш субпроцестің 
өзара әрекеттесуінің нәтижесінде аралық-тілдегі сөйлем түріне 
қайта келтіріледі. Осыған ұқсас тәсілдер трансфермен әрекет ететін 
басқа да жүйелер түрлерінде қолданылады: CADA, GETA, TAUM-
METEO, жапон жүйесі, EUROTRA жүйесі, Ресейдегі СИЛОД 
(MULTIS) жүйесі, А.И.Герцен атындағы РГПУ-да зерттелген 
ФРАП, АРАП, ЭТАП, ЭТАП-2, STYLUS және т.б.
Еуропалық экономикалық бірлестіктің айрықша комиссиясы 
жанында 1982 жылы машиналық аударманың дамуының үшінші 
кезеңінде ұсынылған EUROTRA жүйесінің негізі қаланды. Аталған 
жүйенің тілдері: ағылшынша, французша, немісше, итальянша, 
испанша, португалша, голландша, датша, жаңагрекше. Бұл жоба 
БЭЖ (ЕЭС) елдерінің тоғыз ресми тілі үшін машиналық аударма 
жүйесін құруды және 72 тілдің жұбы бойынша аударма жасау 
қарастырылды. 
Аталған тілдердің қайсысын болса да аударуға қажетті талдауда 
интерфейстік көрініс деп аталатын синтаксистік қатынастардың 
семантикалық түсінігі беріледі. Мәтін семантикалық бағының-
қылықтардың түзілістері арқылы көрініс табады. Мысалы, олар 
астырт септігі типінде (типа глубинных падежей) болуы мүмкін. 


119
Бұл жерде арнайы атап кетуге тұрарлықтай жайт – бір тілдің 
интерфейстік құрылымының басқа тілдегі осындай құрылыммен 
сәйкес келмеуі және осыған қарамай трансферді қолдануға қажетті 
мүмкіндіктің туатындығы. Сонымен, ана тілінің аясында аударма 
жасайтын әрбір маман талдау мен жинақтау тәсілдерінен басқа 
трансфердің 8 түрлі процедурасын да құра білуі қажет.
Жобаның мақсаты – өндірістік машиналық аударма жүйесінің 
бастапқы үлгісін жасау. EUROTRA жүйесінде іске асатын 
трансфердің ерекшелігі, оның қадамдап әрекет етуі. Әрбір 
қадамды жасаудан бұрын алдыңғы қадамдағы әрекеттердің бұрыс 
нәтижелері «тазартылады». 
Трансферді пайдаланатын жүйелерге ЭТАП-2 атты жүйе де 
жатады [27]. Бұл жүйе ағылшынша-орысша машиналық аударма 
жасай алады. Бұл идеологиялық тұрғыдан қарастырғанда 
ИНФ-ЭЛ жүйесінің жетілген түрі және айрықша сөздіктермен 
жабдықталған – нақты бір пәндік салаға арналған, ұластыруға 
негізделген (комбинаторлық) автоматты сөздік. Зерттеушілер 
мұндай «тәуелсіздік» мүмкіндігін тілдік модельдің жан-жақты 
зерттелуімен байланыстырады. 
Трансфердің барлық ережелері жүйе ішінде 


Достарыңызбен бөлісу:
1   ...   44   45   46   47   48   49   50   51   ...   120




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет