Фазылжанова Анар Мұратқызы
филол.ғ.к., А. Байтұрсынұлы ат. Тіл білімі институты директорының орынбасары
тел.: +77023712360, e-mail: nar20@bk.ru
Мейрбекова Ақерке Жаңабекқызы
әл-Фараби ат. Қазақ ұлттық университетінің филология және әлем тілдері факультетінің лингвистика мамандығының 2 курс магистранты
тел.: +77479646639, e-mail: akerkezhanabekqyzy@gmail.com
Қазақ тіліндегі омоформалардың (“Жалпы білім берудегі қазақ тілінің жиілік сөздігі” материалы бойынша) түрлері.
Түйін. Мақалада тіл білімінің жаңа саласы болып табылатын корпустық лингвистиканың күрделі мәселелерінің бірі омонимия құбылысы қарастырылады. Автор омонимдерге таптастырылым жасап, оны тілдік корпуста омонимдерді ажырату үдерісінде қалай пайдалануға болатыны туралы сөз қозғайды.
Резюме. В данной статье рассматривается вопрос омонимии в корпусной лингвистике, в новом направлении языкознания. Автор предлагает свою классификацию омонимов и пути использования ее в процессе снятия омонимии в языковом корпусе.
Summary. This article is dedicated to the problem of homonymy in corpus linguistics, in a new direction of linguistics. The author proposes his classification of homonyms and ways of using it in the process of removing homonymy in the linguistic corpus.
Омоним (гр. homos – біркелкі, onyma – есім) – шығуы жағынан да, мағына жағынан да басқа-басқа, айтылуы және жазылуы бірдей сөздер[1]. Омонимия мәселесі – теориялық лингвистикаға ғана емес, қазіргі кездегі қоғам сұранысына қарай it-қосымшалардың тілдік базасын жасайтын қолданбалы лингвистика, атап айтсақ, компьютерлік лингвистика, корпустық лингвистика саласындағы ізденістер үшін де кезек күттірмей шешімін табу керек күрделі проблема болып отыр.
Корпус – әр тілдегі электронды пішінге келтірілген, яғни бір басқару орталығынан автоматты түрде жұмыс істейтін, лингвистикалық ақпараттарды қамтитын аннотацияланған электрондық мәтіндер жинағы[2, 13]. Корпустың жай мәтіндер жинағынан басты айырмашылығы оның аннотациялануында. Демек қандай корпус болмасын, оны жасауда ең алдымен морфологиялық белгіленім қою мәселесі шешіледі. Морфологиялық деңгейде аннотацияланған корпус сөзформаның қандай бөлшектерден тұратынын айқындауды мақсат етеді. Міне осы жерде омоним сөздер мәтіндер корпусын морфологиялық деңгейде толықтай аннотациялауда едәуір қиындық келтіретін “проблемалық аймаққа” жатады. Оған себеп компьютер формалды құрылымдарды ғана түсінеді, ал сөзформаларды мағыналық жағынан ажырата алу әзірге тек адамның қолынан келеді. Корпус үлкен массивті мәтіндер жинағы болғандықтан кездескен барлық омонимдерді қолдап, адамның қатысуымен ажырату өте ұзақ уақыт алады, көп қол күшін талап етеді, сондықтан мұны шешудің бірден-бір жолы компьютерді омонимдерді ажырата алуға “үйрету” болып табылады.
Біздің зерттеуіміз – корпустық лингвистикада омонимдерді ажырату мәселесіне арналған тырнақалды ізденістің бірі. Бұл мәселені шешу үшін ең алдымен омонимдердің түрлерін анықтап, олардың таптастырылымын жасау керек. Қазақ тіліндегі омонимдерді жан-жақты зерттеген ғалым К. Аханов түрлі критерийлерге байланысты оларды өзінше таптастырды. Мәселен, омоним болатын сөздерді құрамына қарай түбір және туынды деп екіге бөледі: “Құрамын ажыратып әрі қарай бөлшектеуге келмейтін сөздерден (түбірлерден) жасалған омонимдерді түбір омонимдер деп, ал құрамын ажыратып қарауға болатын, яғни түбірге жұрнақ жалғану арқылы жасалған омонимдерді туынды омонимдер деп атауға болады”[3, 97].
Түбір омонимдерге мысал келтірсек:
Достарыңызбен бөлісу: |