таңбамен бслгілсп отырдық. Бүл сөз таптарының классификациясына негізделді. Қазіргі тіл біліміндс создер негізгі үш белгісінс қарай таптастырылуда: лсксикалық магынасы, морфологиялық қүрылымы және синтаксистік қызмсті [41,182]. Осы үш белгілсрін салыстыра отырып, әрбір сөзді белгілі топқа қатысты белгілермсн таңбаладық. Бүл жерде сөздерді индекстсу мен оларға морфологиялық талдау жасауда кері алфавитті-жиілік создіктерді де пайдаландық [42,17]. Сөздерді бүлайша лексика-грамматикалық топтарға бөлу кезіндс кейбір қиындықгар байқалды. Атап айтканда, омонимдерді ажырату кезінде әрбір сездің мағынасы тек контекстс қарастырганда ғана анықгалды. Бүл омонимдерді ажыратуға септігі тигенімен, бір соз табынан ішіндегі омонимдерді ажыратуда сөз топтарына қарасты таңбаларға қосымша цифрлар белгілеуге мәжбүр болдық (8,10-кестелер). Сонымен, сөздердің белгілі бір лексика-грамматикалық топқа қатыстылығы мына төмендегіше белгіленді: з - зат есім, с сын есім, а - сан есім, е - етістік, ү - үстеу, л - еліктеу сөздер, м -есімдік, ш - шылау, о - одағай, д - модаль сөздер (әртарап, бейтарап сөздер), к - көмскші есімдер. Ал снді лексикалық омонимдерді ажыратуда 2- кісі аттары, 4- қысқарған сөздер, 5 - ойын аттары, 6 -газет-журналдар, оқулықтар, коркем шығармалар мсн ғылыми еңбектердің аттары, 7 - географиялық атаулар, 8 - ру, тайпа, үлт аттары, 9 - жануарлардың аттары деп алынды (3-6-кестелер).
Әдсгте жиілік сөздіктері алынатын мәтіндерді зерттеудің екі түрі белгілі: мәтіндердің барлығын түтас қарастыру жәнс тандамалы зерттеу. Мәтіндерді түтасымен зерттеу кезіндс бізді қызықтырған нысанадаҮы лексикалық бірліктің барлық қолданыстары түгел қамтылуы тиіс. Ал таңдама (выборка) арқылы зерттеуде белгілі бір мақсатқа сәйкес әр түрлі көлемдегі тандамалы мәтіндер сараланып. таңдалып шіынады. Мүнда сң аз мөлшердегі минималды таңдама мәтін көлемі шамамен алғанда 1000 сөз қолданыстағы мелшер болып табылады. Зерттеу барысында бүл ею әдістің ішінде мәтівді түтасымен қарастыру түрін қолданғанымызбен, кеіібір эксперименттсрде тандама мәтін арқылы зерттеу одісін де пайдаланып отырдық. Егер жиілік сөздік таңдама одісі арқылы алынатың болса, онда алынған статистикалық модсль түпнүсқасының ерекшеліктсрін қаншалықты қамти алатындығы жайлы сүрақ туындайды. Мүндай жағдайда алынған мотіншн (таңдаманың) өз түпнүсқасына сәйкестілігі болса, онда бүл таңдаманың дүрыс алынгандығын көрсетеді. Алынған жиілік сөздіктің сапасын көрсететін екінші бір жағдай - тізімге (рссстргс) алыиған -өздердің әлі зерттелмеген, жаңа мәтіндерде қаншалықты кездссіп отыратындығы.
^ерттеуімізге негіз етіп алынган 50 жылдардағы БСО мөтіндерін У/0-2000 жылдардағы БСО жонс БӘ мотіндсрімен салыстыруда осы
23
жағын да ескердік. Алфавитті-жиілік сөздікте белгілі бір зерттеугс алынған мәтін көлеміндсгі сөздердің не олардың түлгаларының қодданылу жиілігі көрсетілс отырып, алдыңғы әріптсрі бойынша кдтаң әліпби тәртібімен берілсді. Жиілік сөздіктің бул түрі зерттеугс кджет болған лексикалық топтарды оңай ажыратуға, ондагы ксрек сөздерді тез тауып алуға, қаралып отырған мәтіннің стильдік сапасын тандауға, зерттеугс алынған шығарма тілінің лексикалық байлығы мен оны жазған автордыд соз қолданысындағы тілдік срскшсліктерді сонымен бірге шеберлігн білуғс, дублст сәздердің кай нүсқаларының жиі, ал қай нүскдларының сирек қолданылатындығын білу арқылы олардың орныкдылығын аныктауға, жарыса қолданылатын сездердің кдй нүсқаларының әдеби нормадан шығатындығын аныктауға жәрдемдеседі [16; 17; 76,143]. Жиілік сөздік белгілі бір зерттеугс алынған мәтіндегі сөздердің, не" оның түлғаларының қолданылу жиілік санына қарай қатаң кемімелі тәртіппен орналасқан тізбесі болып саналады. Егер мунда сөздер мен оның түлғаларының қолданылу жиілік саны бірдей болып келсе, онда олар алфавитті-жиілік сөздіктегідей алдыңғы оріптері бойынша қатаң оліпби тәртібімен беріледі. Ал снді ксрі алфавитті-жиілік сөздіктер бслгілі бір зерттеу ыысанасындагы мәтін қүрамындағы сөздердің, оның түлғаларының соңғы оріптері бойынша қатаң әліпби тортібімен берілетін, мәтіндегі жиілігі қоса көрсетілетін түрі екені белгілі [16; 17; 76,144]. Жиілік сөздіктің бул түрі зерттеушіге сәздің негізғі бөлшектерін ажыратып тануға және ол бөлшектердің қолданылуына талдамалар жасауға мүмкіндік береді.
1-кесте - 1950-2000 ж.ж. БСО мен БӘ мәтіндері бойынша пайдаланылған материалдар
Сонымен бірге ол мәтіндердегі сөз тудырушы және сез түрлендіруші қосымшаларды қиындықсыз тез тауып алуға көмектеседі. Бүларға қоса, кері алфавитті-жиілік сөздіктегі сөз тұлғаларының соңғы әріптеріне қарай бірыңғайласып тәртіппен орналасуы зерітеушіге омонимдес қосымшалардың сыңарларын бір-бірінен ажырата білугс де септігін тигізеді. Ал, олардың мәтіндегі қолданысын керсстетін жиілік көрсеткіштері ол қосымшалардың тұрақгы-тұрақсыздығы, өнімді-өнімсіздігін, нормалану жағдайындағы ерекшелік сипатын анықтауға жәрдсмі тиеді.
2-кестс — 50-70 ж.ж. БСО мәтіндерінің орбір пән бойынша сөзбен қамтылу статистикасы
к/с
Окулықгардың аты
Абсолютті жиілік
70 жылдардағы оқулықтар
Ғс/қ
Ғс/ф
Ғсоі
1
Балалар әдебиеті
100000
25365
10077
2
Әліппе, 1975.
2536
1588
992
3
Қазақ тілі (1 сынып, 1972)
8910
2867
1454
4
Ана тілі (1 сынып, 1972)
11865
5081
2236
5
—
6
_Математика (1 сынып, 1972)
17399
2443
1044
Қазақтілі (2 сынып, 1973)
13993
4649
1926
7
Ана тілі (2 сынып, 1973)
4?777
13561
5632
8
Математика (9 сынып, 1979)
99495
3394
1221
! 9 10 11
- —
12 13
—■
_Табиғат тану (2 сынып, 1972)
14289
5265
2332
^Сдзақтілі (3 сынып, 1975)
20857
6076
2730
_Ата_тілі (3 сынып, 1975)
51462
15360
7495
і^атематика (3 сынып, 1972)
22899
3668
1297
_іабиғат тану (3 сынып, 1974)
17758
6221
2775
^У_жылдардағы оқулықтар
-&за]ітш_(1 сынып, 1953)
6314
2480
1024
^Шіфметика (1 сынып, 1959)
7391
2080
721
25
" 16
Ана тілі (1 сынып, 1957)
10680
3814
1381
17
Қазақ тілі (2 сынып, 1952)
8035
3794
1938
Т8
Арифметика (2 сынып, 1958)
11058
2822
827
~~Т9
Ана тілі (2 сынып, 1953)
25032
6269
3748
20
Қазақ тілі (3 сынып, 1951)
12524
5219
2009
21
Арифметика (3 сынып, 1959)
13021
3028
915
22
Ана тілі (3 сынып, 1953)
47509
9131
4092
23
Тарих (3 сынып, 1958)
15139
4319
127^
24
Табиғат тану (3 сынып, 1952)
29258
4021
2010
1-кестеден көрініп түрғандай, 50 және 1970-2000 жылдардағы БСО мәтіндері мен БӘ әр түрлі көлемдегі сөздер мен сөз формаларының және сөз қолданыстардың шамасын аңғартады. 50 жылдардағы оқулық мотіндерінде 1970-2000 жылдардағы мәтіндерге қарағанда сөздер мен сез қолданыстар және сөз формалары аз қолданылған. Бүдан байқайтынымыз, таңдама көлсмі үлгайған сайын, мәтіннің сөзбен қамтылу коэффициенті де осіп отырады. Агглютинативті тілдерде одстте бүл коэффициент 90% шамасында болады [16,44].
2-кестегс қатысты деректерге келсск, 50 жәнс 70 жылдардагы БСО мәтіндерінің әрбір сыныпқа қатысты пәндері боііынша сөз, сөз формасы мен сөз қолданыстармен қамтылуының көрсеткіштері берілді. Мүндағы әрбір сыныптагы пәндер арасында лексикалык түлғалармен қамтылуы жағынан 50 жоне 70 жылдар оқүлықтары арасында айтарлықтай айырмашылықтарды көреміз.
3-кесте - 50 ж. БСО мәтіндеріндегі лексика-грамматикалық топтардың қамтитын үлесі