85
Өткен ғасырдың өзінде үндіеуропа тіл білімінде кең тараған статистикалық әдіс
түркітануда, соның ішінде қазақ тілінде тек ХХ ғасырдың 60-жылдарынан бастап жүйелі
және ғылыми тұрғыда қолданыла бастады. Бірақ бұдан бұрын да аталған әдіс ішінара
қолданыс тауып, тілдің әр деңгейіндегі бірліктердің сандық және пайыздық ара-салмағын
анықтаумен шектеліп келген болатын.
Түркі тіліндегі мәтіндерді статистикалық тәсілмен зерттеу – бұл тілдің ішкі табиғатына,
яғни агглютинативті құрылымына негізделеді. Мамандардың пайымдауынша,
кітаби және
сөйлеу тіліндегі түрлі типті сөздердің әр ыңғайдағы қолдану жиілігін анықтайтын мұндай
тәсіл тілдің құрылымдық-грамматикалық, кейде стильдік-семантикалық айырым белгілерін
ажырата отырып, осы стильдерге тән қасиеттерді анықтауға мүмкіндік жасайды. Сонымен
бірге грамматикалық категорияларды сандық тәсілмен талдау әдеби тілдің барлық
аясындағы функционалдық салмағын көрсетуде де маңызды.
Белгілі филолог-статист Р.Г.Пиотровский түркі тілдерін сандық деңгейде зерттеудің
негізі олардың ішкі құрылымдық табиғатына тєн екендігін айта келе, бұл тілдерге үндіеуропа
тіліне тән екпінді ассимиляция мен редукциялар және осы сипатты қасиеттер жат екенін баса
көрсетеді. Бұл жағдай тілдік деректердің жай кезде қиындық
туғызатын кейбір тұстарын
математикалық әдіспен тіркеу мен тануда аса маңызды деп саналады.
Қолданбалы тіл білімінің «Статистикалық лингвистика» деп аталып жүрген жаңа
саланың бастауында профессор Құдайберген Қуанұлы Жұбановтың тұрғаны жайында белгілі
тілші-статист ғалымдар – Қ.Б.Бектаев, С.Мырзабеков т.б. қазақ тілінің статистикасы туралы
зерттеулері мен мақалаларында арнайы атап көрсеткен болатын. Ғалымның сол кездің
өзінде-ақ тіл білімінде сандық деректерді пайдаланудың қажеттілігіне ерекше ден қойғаны
байқалады.Бүгінде тіл білімінің бір саласына айналып отырған лингвистикалық
статистиканы ғалым Қ.Жұбанов сол кездің өзінде-ақ тани білген. Тілдің сандық сипатынан
байқалатын сапалық қасиеттерін оны зерттеуде пайдалануға болатын тиімді әдіс көздерінің
бірі екенін де байқаған. Сөйтіп, ол сандық деректердің негізінде тілге қатысты бірсыпыра
жайларды (дыбыстар, буындар, сөздер, сөйлем мүшелерінің орны т.б.) нақты анықтап, кейбір
тың тұжырымдар жасаған. Бұлардың маңыздылығы сонда – олар қазіргі кезде бұл саладағы
ізденуші-зерттеушілерге үлгі-тірек, бағыт-бағдар болып отыр.
Қазақ тілінің нормативті курсын жүйелеу жұмысына проф. Қ.Жұбановтан кейін белгілі
тілші-ғалымдар: Н.Т.Сауранбаев, І.К.Кеңесбаев, М.Б.Балақаев, А.Ы.Ысқақов және т.б.
ғалымдар атсалысты. Бастауыш және жоғары сыныптарға және педучилищелерге арналған
қазақ тілі оқулықтарының авторлары
тілдің буындық құрылымын, дыбыс физиологиясын,
тілдің акценттік және екпіндік және т.б. мәселелеріне қатысты зерттеулерінде сан мен
сапаны бөлмей бірге қарастырады. Мәселен, І.К.Кеңесбаев қазақ тіліндегі буын типтерінің,
М.Б.Балақаев қазақ тіліндегі синтаксистік сөз тіркестерінің табиғатын зерттеуде көптеген
нақты мәтіндік материалдарды сандық қатынастар көмегімен қарастырған. Арнайы сандық
талдауларды профессор Ғ.Мұсабаевтың зерттеулерінен де кездестіруге болады. Әрине,
ғалымдардың мұндай ізденістері, яғни сандық қатынасқа көңіл бөлуі саналы түрдегі
ықыластан гөрі тілдің ішкі табиғатына (сырына) қатысты туындаған деп пайымдауға болады.
Осы кезеңде қазақ тілінің грамматикалық форманттарын статистикалық жолмен
зерттеуге айрықша көңіл бөліне бастаған болатын. Қазақ лексикографтары сандық деректі
ұлы ақын Абай тілінің сөздігін түзу кезінде жүйелі түрде толық пайдаланды.
Тұңғыш рет
қазақ тіл білімінің тарихында бір ғана автордың (Абайдың) жазба түріндегі шығармалар тілі
толық қамтылып, әр сөзі мен сөз тіркесінің қолдану жиілігіне көңіл бөлінді. Яғни Абайдың
тіл байлығы, саны мен сапасы жайлы жайттар тілшілердің арнайы зерттеу нысанына
айналды. Сөйтіп, орыстың ұлы ақыны Пушкин тілі сөздігі тәріздес – «Абай тілі сөздігі»
жасалды. Бұл сөздікті әрі түсіндірме сөздік, әрі әліпби-жиілік сөздік деуге болады. Сөздердің
қолдану жиілігін көрсету сөздік түзудің негізгі мақсаттарының бірі болып саналды.
Шығармадағы сөздердің жиілігін ескеру дәстүрлі картотека жасау жолымен іске асты.[3,
209б]
86
Статистикалық
лингвистика саласына қатысты зерттеулерден ең алдымен
байқайтынымыз, мұндағы зерттеу аясының (нысанының) кеңдігі және бұл әдістің
әмбебаптық сипаты. Басқа түркі тілдерін айтпағанда, қазақ тілінің көптеген кезек
күттірмейтін мәселелері, мәселен лексикография саласы бойынша компьютерлік қор (база)
жасау, қазақ тілінен басқа тілге, не керісінше компьютерлік аударма жасау,
ақпарат
мазмұнынан қысқаша реферат, аннотация алу және қолданбалы лингвистика саласының
басқа да мәселелері өз шешімін күтуде.
Қазақ тілінің жазба түріне қатысты зерттеулерде ең көп қолданыс тапқан тармағы –
статистикалық лингвистика. Дәстүрлі әдіспен тілді зерттейтін тілші-ғалымдардың бәрі
бірдей статистикалық әдіс-тәсілдерді қолдай бермейді, бірақ өз ізденістерінде осы саланың
көп, аз, мол, жиі, сирек, өнімді, өнімсіз
тәрізді терминдерін барынша пайдаланады және
олардың статистикалық ғылым саласына қатыстылығын көп жағдайда аңғара бермейді.
Статистикалық лингвистика тілді зерттеудің тек әдісі не тәсілі болып қана қалмай, қазіргі
кездегі тілтануда өзінше бір бөлек ғылыми пән дәрежесіне көтеріліп отыр. Бұл пән тілдік
бірліктердің сапалық және сандық (мөлшерлік) мәліметтерін
тілдің табиғатына сай
қарастыруды жөн санайды.
Статистикалық лингвистика, негізінен, математикалық статистика әдістемесіне сүйенеді.
Зерттеу барысында ондай әдістемені қолдану қатынас құралы ретіндегі «тілді» белгілі бір
жүйе деп қарастырудан туындайды. Шынында да, «тіл» дегеніміз ақиқат болмыста өмір
сүретін көп өлшемді және белгілі бір ішкі заңдылықтардың негізінде топталған (реттелген)
табиғи құбылыс деуге болады. Ал тілдік жүйе математикалық статистика заңдылықтарына
бағыну үшін ондағы бірліктер тобы қайталанып отыратын және кездейсоқтық сипатта
болатын тілдік элементтерден тұруы қажет. Бұл жерде айта кететін жайт, тіл қызметі кезінде
(яғни тілдік қарым-қатынас кезінде) дыбыстар, сөздер, сөз тіркестері, сөйлемдер және одан
да үлкен бөліктер қайталанбайтын сипатта болса, адамдар арасындағы тілдік қатынас
бұзылып, ақпарат таратушы мен қабылдаушы арасында түсінбестік пайда болған болар еді.
Сондықтан да тілдік бірліктердің қайталануы олардың тілімізге тән болуынан,
олардың
қолдану сипатына
жиі, сирек
деген ұғымдардың да тән екендігінен туындайды.
Табиғи ортадағы элементтер арасындағы қайталану сипатының негізінде математикалық
статистика мен ықтималдық теория атты ғылым салаларында тілдік бірліктердің
статистикалық заңдылықтары қалыптасады. Зерттеуге алынған бірліктің (единица, элемент)
ондай заңдылыққа бағыну не бағынбауын айқындау үшін алынатын ортаның аумағы
(мәселен мәтін көлемі) барынша мол болғаны жөн.
Тілге тән заңдылықтарды статистика тәсілімен анықтау негіздемесі мынада:
1) сандық (мөлшерлік) құбылыс тіл табиғатына әуелден-ақ тән болуы;
2) тіл құрылымындағы сандық және сапалық сипаттардың өзара байланыста болуы;
3) тілдің әр түрлі бірліктері сөйлеу ағымында статистикалық заңдылықтардың ең
болмағанда біреуіне бағынуы тиіс деп ұйғару керектігі.[4, 280б]
Тіл зерттеу тәжірибесіне статистикалық әдіс-тәсілді ең алғаш ұсынған ғалым орыстың
көрнекті математигі В.Я.Буняковский 1847 жылдың өзінде-ақ ықтималдық жіктеудің
мүмкіншіліктерін аса бір білгірлікпен (көрегендікпен) атап, ол істің сәтті болуы үшін
филологтар мен математика мамандарының бірлескен одағының қажеттігін айтқан болатын.
Статистикалық лингвистиканың кейбір өзекті мәселелерін сөз етерде аса көрнекті ғалым
Бодуэн де Куртенэнің: «Тіл білімінде сандық, математикалық
ойлауды жиі қолданып, оны
мейілінше нақты ғылымдарға жақындату керек» деген пікірін және Р.М.Фрумкинаның
«Статистические методы при заведомо неполной информации об объектах исследования
предоставляют возможность делать выводы об этих объектах с заданной точностью и
надежностью» – деген тұжырымға статистикалыќ ғылыми баға беріп, олардың дұрыс-
бұрыстығын тексеруге болатындыѓын ұстаным етіледі.
87
Тіл саласындағы кез келген статистикалық зерттеуде мынадай үш мәселенің басын ашып
алған жөн:1) Тілдің қай бірлігін, нені санау (есептеу) керек
2) Таңдалып алынған
бірліктерді неге санау (есептеу) керек
3) Тілдік бірліктерді қалай санау (есептеу) керек?
Яғни зерттеушінің:
Достарыңызбен бөлісу: