Бұл келтірілген мәліметтерден 90-жәнене 2000 жылдардағы оқулықтардың мәтіндеріндегі сөз таптарының ара салмағы жоғарыда келтірілген деректерге ұқсас екендігін байқаймыз: 90 жылдардағы оқулықтарда зат есімдердің қолдануы 39,14% болса, 2000 жылдардағы оқулықтарда 38,61%. Сол сияқты етістіктердің қолдануын салыстыратын болсақ, 50 жылдардағы оқулықтарда олардың үлесі 30,16%шамасында (1 сыныпта 32,26%,2 сыкыпта 31,17% 3 сыныпта 29,35%) болса, 90 жылдарда 29,02% 2000 жылдарда 29,01%. Мұнда тіліміздегі сөз таптарының ішіндегі ең күрделі және қарымы ең кең граматикалық категория ретіндегі етістіктердің біз қарастырған оқулықтардағы қолданылуы әр жылдардағы оқулықтармен шамалас деңгейді көрсетеді. Бұл да біз қарастырған мәтіндердегі сөз таптарының қолданысындағы өзіндік сөз ерекшелік дер едік.
17
II. Оқулық мәтіндерінің жиілік құрылымының
ерекшеліктері.
Алдыңғы зерттеулер көрсеткендей мәтіндерінің статистикалық жағынан нақты бір жиіліктегі сөздермен қамтылуы зерттелініп отырған мәттіннің көлеміне байланысты. Статистикалық жағынан едәуір аз мағлұмат беретінсөздерді көлемі шағын оқулықтар береді. Жиілік сөздіктің бастапқы (едәуір жиі кездезсе) аумақтарында ақпарат көлемі онша болмайды. Өйткені бір ғана «ол» есімдігінің жиілігі 3609 (50ж БСО)
Зертелініп отырған оқулықтардағы мәтіндердің едәуір жиі кездесетін лексикалық единицалармен қамтыпуы өте төмен. 50 жылдар оқулықтарында 40,77%, 70 жылдар оқулықтарында 39,96% БСО 30,51% , 90ж оқулықтарында 40,28% , ал 2000 жыл оқулықтарында 40,13% .
Жиі қолданыстағы сөздердің статистикалық сипаттамасы.
Жиілік сөздіктер
|
Мәтін көлемі N
|
Түбір сөз L
|
Ғ>4
|
Пайыздық vneci fF>4 %)
|
|
Балалар әдебиеті
|
97260
|
11068
|
3376
|
30,51
|
|
50ж оқулықтары
|
185961
|
І0298
|
4199
|
40,77
|
|
70ж оқулықтары
|
241984
|
12281
|
4908
|
39,96
|
|
90ж оқулықтары
|
226374
|
12813
|
5162
|
40,28
|
|
2000ж оқулықтар
|
368965
|
13869
|
5566
|
40,13
|
|
Абай шығармалары
|
49819
|
6017
|
3877
|
64,43
|
Нақтылы бір жиіліктегі және бір нақты синтаксистік апараты бар түрлімөлшердегі сөздерді анықтау барысында, әр сыныпқа тиісті жиі кездесетін, яғни жиілігі Ғ>4 болатын мәтіннің 30-40%-ын қамтитын лексиалық бірліктерді таңдап
18
алдық. Енді осындай жиіліктегі сөздердің үзіндісін көрейік. Біздің ойымызша абсалютті жиілігі 4-ке тең немесе одан артық сөздердің әрбірі қайталана қолданылу нәтижесінде бала жадында ұзақ сақталады да, бұл сөздерді толық меңгереді деп айтуымызға болады. Мысалы, ағай Сөзі 50ж оқушылықтарында 36 рет, 70 ж оқулықтарында 40 рет, ал Б.Ә 60 рет қолданылған. Алайда мұндай сөздердің көптігі оқушыға берілетін ақпарат көлемінің азаюына жағдай туғызады. Демек, сөздердің қолдану жиілігі мен мәтіндердің ақпараттық қызметі арасында кері қатынас бар деп айта аламыз. Өйткені, оқушы бір ғана сөзді қайталай бермей, оның орнына мәтінде бурын кездеспеген жаңа мәнге ие сөздерді шеретін болса ғана оның танымдық көкжиегі кеңи түседі. Сонымен бірге мұндай сөздердің тек сандық тұрғыда ғана емес, сапалық тұрғыда меңгерілуін, яғни оқушының белсенді сөздік қорына болуын да ескерген жөн.
Сонда ғана олардың тіл байлығы молайып, білім дәрежесі артады. Өйткені сездің лексикалық мағыналары талай рет қайталана қолданылуы нәтижесінде санамызға сіңіп қалыптасады. Мұнда олар сол сөз берілетін зат, не құбылыс тың белгілі бір қасиеттеріне негізделіп, ол сөз аталғанда Санамызда сол қасиеттер мағынаның басты көрсеткіштері, яғни мәндері ретінде көрінеді. Енді қарастырған оқулықтардағы жиі қолданысқа ие сәздерге назар аударсақ, салыстырылушы мәтіндер арасында сөздердің қолданылымдағы мынандай ерекшіліктерді
19
аңғарамыз:
Жалпы жиілігі Ғ>4 болатын 50-70 жылдардағы 1-3 сынып оқулықтарының жиілік сөздігінен көрініс.
№
|
Сөз(жиілігі Ғ>4)
|
БСО мәтіндері
|
БӘ
|
Ғі(50ж)
|
Ғі(70ж)
|
Ғі 60-70 ж.
|
1
|
ағай-з
|
36
|
40
|
60
|
2
|
ағайынды-с
|
9
|
8
|
6
|
3
|
ағар-е
|
9
|
8
|
5
|
4
|
ағыз-е
|
10
|
15
|
5
|
5
|
адам -з
|
529
|
673
|
289
|
6
|
адас-е
|
21
|
10
|
9
|
7
|
аз-д
|
120
|
136
|
48
|
8
|
азық-з
|
55
|
39
|
4
|
9
|
ақық-түлік-з
|
8
|
10
|
2
|
10
|
аида-е
|
39
|
29
|
32
|
11
|
айдын-з
|
32
|
27
|
112
|
12
|
айқайла-е
|
46
|
36
|
3
|
13
|
айкас-з
|
19
|
14
|
11
|
14
|
айна-з
|
6
|
11
|
13
|
15
|
айнадай-с
|
5
|
6
|
|
16
|
айналдыр-е
|
43
|
28
|
9
|
17
|
айрыл-е
|
19
|
21
|
20
|
18
|
ақтер-е
|
4
|
5
|
11
|
19
|
ақыл-з
|
23
|
62
|
|
20
|
алайда-ш
|
32
|
10
|
|
21
|
ар-з
|
11
|
13
|
4
|
22
|
араба-з
|
47
|
17
|
|
23
|
аса-ү
|
43
|
9
|
|
Әр түрлі тілдердің жиілік сөздіктерін салыстыра отырып.зерттеу нәтежесінде мынаған көзіміз жетті: түрлі тілдері мәтіндеріндегі сирек қолданылатын бірліктердің негізгі бөлігінің жиілігі 1және 2-ге төң болатындай сөздерді қамтиды. Мәтіннің көлемі ұлғайған сайын, мұндай сөздердің де абсолютті шамасы артқанымен, түрлі тілдердегі олардың жиынтық қатынасты жиілігі 0,60% шамасында болады. Сонымен бірге аз қолданыстағы сөздердің молдығы, жазушы,
20
немесе ақын тілінің байлығы немесе оның өзіндік ерекшелігін көрсетеді деп есептелінеді. Бірақ бұл тұжырым таңдама әдісі арқылы алынған мәтіндердің көлемі бірдей болған жағдайда ғана дұрыс деп тануымыз керек. Салыстырылып отырған 1950-2000 жылдардағы оқулық мәтіндері мен БӘ. сонымен бірге орыс тіліндегі жиілік сөздіктер және Абай шығармаларынан байқайтынымыз таңдама көлем ұлғайған сайын, аз кездесетін сөздердің үлесі азаяды.
Егер БСО мәтіндерінің жиілік сөздігін бірнеше аумақтарға: бірінші аумаққа алғашқы 100-ге дейінгі, екінші аумаққа 500-ге дейінгі, үшінші аумаққа 1000-ға дейінгі, төртінші аумаққа 2000-ға дейінгі, бесінші аумаққа алғашқы 3000-ға дейінгі жиі кездесетін лексикалық бірліктерді бөлсек, онда әр жылдардағы оқулық мәтіндері мен жиілік сөздіктерінің әрбір аумаққа қатысты сөзбен қамтылу ерекшеліктерін талдау барысында мынадай нәтижелерді аламыз.
21
1950-2000 жылдардағы БСО мен БӘ жиі қолданыстағы сөздермен қамтылуы.
Жиілік сөздіктер
|
N
|
L
|
1-500
|
1-500
|
1-1000
|
1-2000
|
1-3000
|
1. Балалар эдебиеті
|
97260
|
1106 8
|
25,1
|
47,5 4
|
59,4
1
|
72,04
|
80,00
|
2. 50 ж. БСО
|
185961
|
1029 8
|
38, 51 5
|
66,1
7
|
77,57
|
87,07
|
91.38
|
3. 70 ж. БСО
|
241984
|
1228 1
|
41,8
7
|
70,5
|
83,29
|
88,76
|
90,08
|
4. 90 ж. БСО
|
226374
|
1281
3
|
39,4 1
|
68,1
1
|
79,51
|
84,17
|
91,12
|
5. 2000ж.БСО
|
386965
|
1386 9
|
38,6
2
|
70,8 4
|
81,63
|
82,61
|
93,33
|
6. Абай жолы (1-4 т.)1
|
465591
|
1718 8
|
39,2 0
|
68,0
2
|
71,55
|
79,92
|
84,00
|
7. Газеттер(публ и-цистикалық)
|
146764
|
1242 3
|
31,4 0
|
59,7 4
|
72,85
|
83,88
|
88,88
|
8. Өзбек көркем' эдебиеті
|
95550
|
8052
|
44,8 1
|
68,1 8
|
77,83
|
—
|
|
9. Өзбек тіліндегі газетгер
|
209485
|
1299 6
|
35,1 9
|
62,9 8
|
75,14
|
85,47
|
—
|
10. Орыс эдебиеті (Пушкин)
|
544777
|
2119
7
|
■
|
|
70,00
|
|
|
11. Орысша сөздік (Засорина, 1966)
|
120843
|
1420 6
|
28,8 9
|
47,6 1
|
58,00
|
69,01
|
76,50
|
Егер 1000-ға дейінгі аумақта БӘ жиі кездесетін лексикалық бірліктер мәтіннің 59% үлесін қамтыса , 50 жылдардағы оқулықтарда 78%, 70 жылдардағы оқулықтарда 83%, 90 жылдардағы оқулықтарында 79% 2000 жылдардағы оқулықтарда 82%, өзбек тілінде 68% үлесті қамтыса, ал флективті орыс тілінде бұл аумақтағы лексикалық бірліктөр мәтіннің 58%-ын құрал, агглютинативті тілдердің көрсеткіштеріке шамалас деңгейден көрінеді. Бұл жерде мәтіннің сөзбен қамтылуындағы айырмашылық тілдердің типтік белгілеріне қарай емес, стилі мен тақырыптық
22
айырмашылықтарына байланысты. Мысалы, 50ж.және 70ж. Мектеп оқулықтарына қарағанда сөздік қоры бай БӘ бұл аумақтағы лексикалық бірліктермен қамтылуы өте төмен (59,41 %). Бұған керісінше, онымен салыстырғанда сөздік қоры жұтаңдау болып келетін 1950-2000ж.ж. БСО мәтіндері жиі кездесетін сөздермен қамтылудың өте жоғары дәрежесін көрсетеді (78%-83%).
2. Барлық тілдер бойынша алынған мәтіндердің жілік сөздіктері түрлі аумақтар бойынша сөзбен қамтылудың шамамен алғанда бірдей дәрежедегі өсу қарқынын байқатты. Қазіргі таңдағы статистикалық ақпараттың тәжірибесі мәтіннің статисикалық құрылымы жайында алынған нәтижелерді дәлелді түрде бағалауға мүмкіндік беретін көптеген әдістерге бай екені белгілі.
Әдетте статистикалық құрылымы ретінде мәтіндегі сөздер саны мен олардың мәтінде көрінетін жиілігі арасындағы қарым-қатынасты айтатыны белгілі. Мәтіннің статистикалық құрылымының моделі ретінде сөздік тізіміндегі сөздің рангісі мен оның жиілігі арасында кері тәуелділік қалыптасатын жиілік сөздіктерді санауымызға болады. Аталған тәуелділікті дәлелдеу бағытындағы зерттөудің бастыларының бірі - Эсту-Ципф-Мандельброт заңы. Бұл заңның негізін қалаушы француз ғалымы Эсту 1916 жылы стенографияны жетілдірумен айналысу барысында ранг-жиілік тәуелділігін байқады. Кейінрек бұл заң ЦИПФ, Мандельброт тағы басқа ғалымдармен дәлелденіп, толықтырылып "Эсту-Ципф-
23
Мандельброт заңы" деген атқа ие болды.
Рангіден заң параметрінің функциональды тәуелділігін анықтау міндеті В.Калинин мен Э.Макаев еңбектерінде шешімін тапты. Бұл заң сөздің жиілігі мен жиілік тізіміндегі оның рангісі арасында кему жиілігі бойынша байланысты қалыптастырады және берілген рангі бойынша мәтіннен кездойсоқ алынған сөздің пайда болу ықтималдығын шамалап есептеуге мүмкіндік береді, яғни, сөз бен оның берілген реттік нөмірі арасындағы пропорцияны анықтауға жағдай жасайды. Заңның параметрлерін есептеу Ғі=І\ІК(і+р)~7 формуласымен өрнектеледі, мұндағы Ғ1 - тізімдегі сөздің (сөз формасының) абсолютті жиілігі, і -тізімдегі сөзфрдің (с/ф) реттік нөмірі, N - сөз қолданыстармен алғандағы таңдама көлемі; к,р,ү - заңның параметрлері.
К,р,ү - шамаларының тұрақты мәндерін анықтау арқылы зерттеуімізде БСО мен БӘ сөздердің қолданылу жиілігін оның рангісі бойынша және кері тәуелділік бойынша анықтап, оқулық мәтіндері мен БӘ статистикалық құрылымының ерекшеліктерін айқындадық. Ципф заңының параметрін (К) мына формулалармен анықтауға болады
К= Ітіп Fi /N
Мұндағы Ғі, — сөздің абсолютті жиілігі, imin минималды ранг, N - таңдама көлемі. Мандельброт заңының параметрін (ү)мына формула бойынша анықтауға болады:
ү = imax/ Fi m
24
Мұндағы Ғ^ - сөздің абсалютті жиілігі, осы жиіліктеп сөздердің (сөз формаларының) саны, I - максималды ранг. Параметрлерді есептеу Ғі = NK (і+р)ү формуласы бойынша ЭЕМ-да іске асырылды.
|
50 ж.
|
БСС
|
) мәтіндерінің жиілік
|
құрылымы.
|
Сөз
|
f
|
"1
|
№ қ/с
|
Сөз
|
|
ғ1
|
1. ол-м
|
3609
|
|
26
|
жат-е
|
|
751
|
2. де-е
|
3374
|
|
27
|
жаттығу-з
|
|
749
|
3. Бол-е
|
3142
|
|
28
|
ал-ш
|
|
747
|
4. да-ш
|
2301
|
|
29
|
қандай-м
|
|
747
|
5. Бір-а
|
2024
|
|
30
|
кет-е
|
|
742
|
6. бала-з
|
1769
|
|
31
|
ме-ш
|
|
742
|
7. е-е
|
1510
|
|
32
|
және -ш
|
|
726
|
8. Кел-е
|
1462
|
|
33
|
жаз-е
|
|
720
|
9. неше-м
|
1371
|
|
34
|
бар-е
|
|
717
|
10. Күн-з
|
1270
|
|
35
|
екі-а
|
|
710
|
11. ал-е
|
1256
|
|
36
|
үй-з
|
|
710
|
12. Сез-е
|
1120
|
|
37
|
екінші-а
|
|
684
|
13. тур-е
|
1124
|
|
38
|
ағаш-з
|
|
654
|
14. бар-д
|
1066
|
|
39
|
қой-е
|
|
647
|
15. не-м
|
1007
|
|
40
|
қара-е
|
|
615
|
16. бер-е
|
954
|
|
41
|
су-з
|
|
615
|
17. жүр-е
|
945
|
|
42
|
мына-м
|
|
601
|
18. біз-м
|
934
|
|
43
|
сан-з
|
|
596
|
19. бүл-м
|
902
|
|
44
|
жер-з
|
|
596
|
20. мен-м
|
870
|
|
45
|
оқы-с
|
|
596
|
21. сал-е
|
818
|
|
46
|
үшін-ш
|
|
584
|
22. айт-е
|
802
|
|
47
|
көр-а
|
|
580
|
23. шық-е
|
801
|
|
48
|
сал-е
|
|
563
|
24. де-ш
|
779
|
|
49
|
керек-ш
|
|
544
|
25. өз-м
|
760
|
|
50
|
жол-з
|
|
539
|
Онда жоғарыдағыдай ранг-жиілік тәуелділігінің кестесі берілді.
Бұл кестелер 50,70 жылдардағы БСО мен БӘ мәтіндерінің статистикалық құрылымын сипаттайтын негізгі кестелер
25
болып табылады. Эсту-Ципф-Мандельброт заңының параметрлерін салыстыру 50-70 жылдардағы салыстырмалы түрдегі ұқсастықтарды анықтауға мүмкіндік береді.
70- ж. БСО мәтіндерінің жиілік сөздіктері бойынша құрылымынан үзінді
Сөз
|
Ғі
|
№ қ/с
|
Сөз
|
Ғі
|
1. ол-м
|
4982
|
26
|
неше-м
|
1125
|
2. бол-е
|
3736
|
27
|
де-ш
|
1102
|
3. де-е
|
2935
|
28
|
қал-е
|
'1083
|
4. бір-а
|
2188
|
29
|
қой-е
|
1075
|
5. е-е
|
2029
|
30
|
не-м
|
1072
|
6. сан-з
|
1965
|
31
|
ал-е
|
1033
|
7. шығар-е
|
1804
|
32
|
жүр-е
|
997
|
8. жаз-е
|
1798
|
33
|
біз-м
|
972
|
9. сөз-з
|
1707
|
34
|
мен-ш
|
970
|
10. кел-е
|
1705
|
35
|
екі-а
|
964
|
11. да-ш
|
1681
|
36
|
осы-м
|
926
|
12. және-ш
|
1677
|
37
|
оқы-е
|
922
|
13. бала-з
|
1445
|
38
|
сол-м
|
893
|
14. түр-е
|
1423
|
39
|
қандай-м
|
863
|
15. шық-е
|
1400
|
40
|
қанша-м
|
832
|
16. жаттығу-з
|
1315
|
41
|
ескінші-а
|
831
|
17. күн-з
|
1269
|
42
|
су-з
|
820
|
18. жер-з
|
1263
|
43
|
кет-е
|
792
|
19. бар-д
|
1250
|
44
|
екінші-а
|
787
|
20. бүл-м
|
1249
|
45
|
көр-е
|
792
|
21. бер-е
|
1208
|
46
|
үй-з
|
768
|
22. қара-с
|
1185
|
47
|
әр-м
|
744
|
23. айт-е
|
1162
|
48
|
сөйлем-з
|
729
|
24. мен-н
|
1154
|
49
|
отыр-е
|
728
|
25. өз-м
|
1145
|
50
|
ал-ш
|
691
|
Достарыңызбен бөлісу: |