21
1950-2000 жылдардағы БСО мен БӘ жиі қолданыстағы сөздермен қамтылуы.
Жиілік сөздіктер
|
N
|
L
|
1-500
|
1-500
|
1-1000
|
1-2000
|
1-3000
|
1. Балалар әдебиеті
|
97260
|
1106 8
|
25,1
|
47,5 4
|
59,4
1
|
72,04
|
80,00
|
2. 50 ж. БСО
|
185961
|
1029 8
|
38, 51 5
|
66,1
7
|
77,57
|
87,07
|
91.38
|
3. 70 ж. БСО
|
241984
|
1228 1
|
41,8
7
|
70,5
|
83,29
|
88,76
|
90,08
|
4. 90 ж. БСО
|
226374
|
1281
3
|
39,4 1
|
68,1
1
|
79,51
|
84,17
|
91,12
|
5. 2000ж.БСО
|
386965
|
1386 9
|
38,6
2
|
70,8 4
|
81,63
|
82,61
|
93,33
|
6. Абай жолы (1-4 т.)1
|
465591
|
1718 8
|
39,2 0
|
68,0
2
|
71,55
|
79,92
|
84,00
|
7. Газеттер(публ и-цистикалық)
|
146764
|
1242 3
|
31,4 0
|
59,7 4
|
72,85
|
83,88
|
88,88
|
8. Өзбек көркем' әдебиеті
|
95550
|
8052
|
44,8 1
|
68,1 8
|
77,83
|
—
|
|
9. Өзбек тіліндегі газетгер
|
209485
|
1299 6
|
35,1 9
|
62,9 8
|
75,14
|
85,47
|
—
|
10. Орыс әдебиеті (Пушкин)
|
544777
|
2119
7
|
■
|
|
70,00
|
|
|
11. Орысша сөздік (Засорина, 1966)
|
120843
|
1420 6
|
28,8 9
|
47,6 1
|
58,00
|
69,01
|
76,50
|
Егер 1000-ға дейінгі аумақта БӘ жиі кездесетін лексикалық бірліктер мәтіннің 59% үлесін қамтыса , 50 жылдардағы оқулықтарда 78%, 70 жылдардағы оқулықтарда 83%, 90 жылдардағы оқулықтарында 79% 2000 жылдардағы оқулықтарда 82%, өзбек тілінде 68% үлесті қамтыса, ал флективті орыс тілінде бұл аумақтағы лексикалық бірліктөр мәтіннің 58%-ын құрал, агглютинативті тілдердің көрсеткіштеріке шамалас деңгейден көрінеді. Бұл жерде мәтіннің сөзбен қамтылуындағы айырмашылық тілдердің типтік белгілеріне қарай емес, стилі мен тақырыптық
22
айырмашылықтарына байланысты. Мысалы, 50ж.және 70ж. Мектеп оқулықтарына қарағанда сөздік қоры бай БӘ бұл аумақтағы лексикалық бірліктермен қамтылуы өте төмен (59,41 %). Бұған керісінше, онымен салыстырғанда сөздік қоры жұтаңдау болып келетін 1950-2000ж.ж. БСО мәтіндері жиі кездесетін сөздермен қамтылудың өте жоғары дәрежесін көрсетеді (78%-83%).
2. Барлық тілдер бойынша алынған мәтіндердің жілік сөздіктері түрлі аумақтар бойынша сөзбен қамтылудың шамамен алғанда бірдей дәрежедегі өсу қарқынын байқатты. Қазіргі таңдағы статистикалық ақпараттың тәжірибесі мәтіннің статисикалық құрылымы жайында алынған нәтижелерді дәлелді түрде бағалауға мүмкіндік беретін көптеген әдістерге бай екені белгілі.
Әдетте статистикалық құрылымы ретінде мәтіндегі сөздер саны мен олардың мәтінде көрінетін жиілігі арасындағы қарым-қатынасты айтатыны белгілі. Мәтіннің статистикалық құрылымының моделі ретінде сөздік тізіміндегі сөздің рангісі мен оның жиілігі арасында кері тәуелділік қалыптасатын жиілік сөздіктерді санауымызға болады. Аталған тәуелділікті дәлелдеу бағытындағы зерттөудің бастыларының бірі - Эсту-Ципф-Мандельброт заңы. Бұл заңның негізін қалаушы француз ғалымы Эсту 1916 жылы стенографияны жетілдірумен айналысу барысында ранг-жиілік тәуелділігін байқады. Кейінрек бұл заң ЦИПФ, Мандельброт тағы басқа ғалымдармен дәлелденіп, толықтырылып "Эсту-Ципф-
23
Мандельброт заңы" деген атқа ие болды.
Рангіден заң параметрінің функциональды тәуелділігін анықтау міндеті В.Калинин мен Э.Макаев еңбектерінде шешімін тапты. Бұл заң сөздің жиілігі мен жиілік тізіміндегі оның рангісі арасында кему жиілігі бойынша байланысты қалыптастырады және берілген рангі бойынша мәтіннен кездойсоқ алынған сөздің пайда болу ықтималдығын шамалап есептеуге мүмкіндік береді, яғни, сөз бен оның берілген реттік нөмірі арасындағы пропорцияны анықтауға жағдай жасайды. Заңның параметрлерін есептеу Ғі=І\ІК(і+р)~7 формуласымен өрнектеледі, мұндағы Ғ1 - тізімдегі сөздің (сөз формасының) абсолютті жиілігі, і -тізімдегі сөзфрдің (с/ф) реттік нөмірі, N - сөз қолданыстармен алғандағы таңдама көлемі; к,р,ү - заңның параметрлері.
К,р,ү - шамаларының тұрақты мәндерін анықтау арқылы зерттеуімізде БСО мен БӘ сөздердің қолданылу жиілігін оның рангісі бойынша және кері тәуелділік бойынша анықтап, оқулық мәтіндері мен БӘ статистикалық құрылымының ерекшеліктерін айқындадық. Ципф заңының параметрін (К) мына формулалармен анықтауға болады
К= Ітіп Fi /N
Мұндағы Ғі, — сөздің абсолютті жиілігі, imin минималды ранг, N - таңдама көлемі. Мандельброт заңының параметрін (ү)мына формула бойынша анықтауға болады:
ү = imax/ Fi m
24
Мұндағы Ғ^ - сөздің абсалютті жиілігі, осы жиіліктеп сөздердің (сөз формаларының) саны, I - максималды ранг. Параметрлерді есептеу Ғі = NK (і+р)ү формуласы бойынша ЭЕМ-да іске асырылды.
|
50 ж.
|
БСС
|
) мәтіндерінің жиілік
|
құрылымы.
|
Сөз
|
f
|
"1
|
№ қ/с
|
Сөз
|
|
ғ1
|
1. ол-м
|
3609
|
|
26
|
жат-е
|
|
751
|
2. де-е
|
3374
|
|
27
|
жаттығу-з
|
|
749
|
3. Бол-е
|
3142
|
|
28
|
ал-ш
|
|
747
|
4. да-ш
|
2301
|
|
29
|
қандай-м
|
|
747
|
5. Бір-а
|
2024
|
|
30
|
кет-е
|
|
742
|
6. бала-з
|
1769
|
|
31
|
ме-ш
|
|
742
|
7. е-е
|
1510
|
|
32
|
және -ш
|
|
726
|
8. Кел-е
|
1462
|
|
33
|
жаз-е
|
|
720
|
9. неше-м
|
1371
|
|
34
|
бар-е
|
|
717
|
10. Күн-з
|
1270
|
|
35
|
екі-а
|
|
710
|
11. ал-е
|
1256
|
|
36
|
үй-з
|
|
710
|
12. Сез-е
|
1120
|
|
37
|
екінші-а
|
|
684
|
13. тур-е
|
1124
|
|
38
|
ағаш-з
|
|
654
|
14. бар-д
|
1066
|
|
39
|
қой-е
|
|
647
|
15. не-м
|
1007
|
|
40
|
қара-е
|
|
615
|
16. бер-е
|
954
|
|
41
|
су-з
|
|
615
|
17. жүр-е
|
945
|
|
42
|
мына-м
|
|
601
|
18. біз-м
|
934
|
|
43
|
сан-з
|
|
596
|
19. бұл-м
|
902
|
|
44
|
жер-з
|
|
596
|
20. мен-м
|
870
|
|
45
|
оқы-с
|
|
596
|
21. сал-е
|
818
|
|
46
|
үшін-ш
|
|
584
|
22. айт-е
|
802
|
|
47
|
көр-а
|
|
580
|
23. шық-е
|
801
|
|
48
|
сал-е
|
|
563
|
24. де-ш
|
779
|
|
49
|
керек-ш
|
|
544
|
25. өз-м
|
760
|
|
50
|
жол-з
|
|
539
|
Онда жоғарыдағыдай ранг-жиілік тәуелділігінің кестесі берілді.
Бұл кестелер 50,70 жылдардағы БСО мен БӘ мәтіндерінің статистикалық құрылымын сипаттайтын негізгі кестелер
25
болып табылады. Эсту-Ципф-Мандельброт заңының параметрлерін салыстыру 50-70 жылдардағы салыстырмалы түрдегі ұқсастықтарды анықтауға мүмкіндік береді.
70- ж. БСО мәтіндерінің жиілік сөздіктері бойынша құрылымынан үзінді
Сөз
|
Ғі
|
№ қ/с
|
Сөз
|
Ғі
|
1. ол-м
|
4982
|
26
|
неше-м
|
1125
|
2. бол-е
|
3736
|
27
|
де-ш
|
1102
|
3. де-е
|
2935
|
28
|
қал-е
|
'1083
|
4. бір-а
|
2188
|
29
|
қой-е
|
1075
|
5. е-е
|
2029
|
30
|
не-м
|
1072
|
6. сан-з
|
1965
|
31
|
ал-е
|
1033
|
7. шығар-е
|
1804
|
32
|
жүр-е
|
997
|
8. жаз-е
|
1798
|
33
|
біз-м
|
972
|
9. сөз-з
|
1707
|
34
|
мен-ш
|
970
|
10. кел-е
|
1705
|
35
|
екі-а
|
964
|
11. да-ш
|
1681
|
36
|
осы-м
|
926
|
12. және-ш
|
1677
|
37
|
оқы-е
|
922
|
13. бала-з
|
1445
|
38
|
сол-м
|
893
|
14. түр-е
|
1423
|
39
|
қандай-м
|
863
|
15. шық-е
|
1400
|
40
|
қанша-м
|
832
|
16. жаттығу-з
|
1315
|
41
|
ескінші-а
|
831
|
17. күн-з
|
1269
|
42
|
су-з
|
820
|
18. жер-з
|
1263
|
43
|
кет-е
|
792
|
19. бар-д
|
1250
|
44
|
екінші-а
|
787
|
20. бұл-м
|
1249
|
45
|
көр-е
|
792
|
21. бер-е
|
1208
|
46
|
үй-з
|
768
|
22. қара-с
|
1185
|
47
|
әр-м
|
744
|
23. айт-е
|
1162
|
48
|
сөйлем-з
|
729
|
24. мен-н
|
1154
|
49
|
отыр-е
|
728
|
25. өз-м
|
1145
|
50
|
ал-ш
|
691
|
Кестелерден көрінгендей, таңдама көлемі 185961 сөз ріданыс, 10298 сөзді қамтитын 50 жылдардағы БСО жиілігі ең жоғары ол, неше, не, біз, бұл, мен, өз, қандай, мына есімдіктері барлық таңдаманың 28, 20%-ын қамтитын 52448
26
сөз қолданыстағы реестрдің ең жоғарғы жағына орналасқан 50 сөздің 20,58%-ын қамтыса, етістіктердің ішінде де, бол, е, кел, ал, тұр, бер, жүр, қал, айт, шық, жат, кет, жаз, бар, қой, қара, оқы, көр, сал тұрғысындағы жиі қолданыстар 42,19%-ын, зат есімдердің ішінде күн, сөз, жалығу, үй, ағаш, су, сан, жер, жол тұлғасындағы жиі қолданыстар 13,05%-ын қамтиды. Көмекші сөздердің ішінде ең жиі қолданылатындары де, ал мен, және, үшін, керек шылаулары 12,24%-ын қамтыған. Ал бар атты Әртарап мағынаны білдіретін сөз 2,03%-ын алып тұр.
Бұл мысалдар арқылы 50 жылдардағы оқулық мәтіндерінің құрылымындағы берілген жиіліктегі сөз бөн оның рангісі арасындағы пропорцияны көреміз. Осы кестемен салыстыру мақсатында 70 жылдардағы оқулықтардың мәтіндеріндегі ең жиі қолданыстағы 50 сөзді алып, оларды жиілігі бойынша орналастырсақ, олардың жиілік қурылымындағы мынадай ерекшеліктерді байқаймыз:
Таңдама көлемі 241984 сөз қолданыс, 12281 сөзге тең 70 жылдардағы оқулық мәтіндеріндегі барлық сөздіктің 27,74%-ын қамтитын 67136 сөз қолданысқа тең 50 сөздің 22,17%-ын ол, мен, бұл, өз, неше, не, біз, осы, сол, қандай, қанша, әр есімдіктері, 39,21 %-ын бол, де, е, шығар, жаз, кел, тұр, шық, бер, айт, қал, қой, ал, жүр, оқы, кет, көр, отыр, етістіктері, 18,04%-ын сан, сөз, бала, жаттығу, күн, жер, есеп, су, үй, сөйлем секілді зат есімдер құраса, қалған 9,11%-ын да, және , де, мен, ал шылаулары, 5,86%-ын бір, екі, екінші сан есімдері, 5,86%-ын Өртарап мағынаны білдіретін бар сөз құрайды. Бұл
27
мысалдар 70 жылдардағы БСО мәтіндерінің лексикалық бірліктермен қамтылуындағы өзіндік ерекшелігін көрсетеді.
Демек, өзге сөз таптарына қарағанда өмірдің түрлі саласындағы қат-қабат қолданысы айқын білінетін етістіктер алғашқы орында тұрса, баланың алғашқы сөйлеу әрекетіндегі негізгі сөздік қорын құрайтын есімдіктер одан кейінгі екінші орында, ал жалпы мәтіннің көлемі бойынша сөз қолданыс жөнінен алғашқы орындағы зат есімдер келтірілген үзіндіде үшінші орында тұр.
Өйткені, етістіктер лексика-семантикалық ерекшелігі жағынан, түбір тұлғасы мен оған үстелетін грамматикаліьіқ категорияларының қат-қабаттағы жағынан өте күрделі сөз тобының бірі. Енді осы лексикалық спектордың кестесін келтірейік
БӘ мәтіндерінің жиілік сөздіктері бойынша құрылымынан
үзінді.
Сөз
|
Ғі
|
№ қ/с
|
Сөз
|
Ғі
|
1. бол-е
|
1786
|
26
|
айт-е
|
389
|
2. сөз-з
|
1769
|
27
|
шық-е
|
374
|
3. де-ш
|
1702
|
28
|
көз-з
|
369
|
4. ол-м
|
1278
|
29
|
Отыр-е
|
362
|
5. бір-а
|
1231
|
30
|
Қара-е
|
350
|
6. кел-е
|
1107
|
31
|
Біл-е
|
337
|
7. да-ш
|
1028
|
32
|
өт-е
|
336
|
8. ал-е
|
1011
|
33
|
|
329
|
9. е-е
|
920
|
34
|
бер-е
|
326
|
10. тур-е
|
752
|
35
|
бар-д
|
320
|
11. де-ш
|
728
|
36
|
не-м
|
315
|
12. мен-м
|
700
|
37
|
он-а
|
311
|
13. жүр-е
|
597
|
38
|
мен-ш
|
304
|
14. өз-м
|
596
|
39
|
бас-з
|
291
|
28
15. күн-з
|
592
|
40
|
адам-з
|
289
|
16. бұл-м
|
536
|
41
|
ат-з
|
282
|
17. сол-м
|
514
|
42
|
біз-м
|
278
|
18. бар-е
|
468
|
43
|
алд-к
|
274
|
19. жер-з
|
467
|
44
|
Көп-д
|
173
|
20. көр-е
|
439
|
45
|
Көл-з
|
268
|
21. жат-е
|
436
|
46
|
ғой-ш
|
267
|
22. барынша-ү
|
411
|
47
|
Қой-е
|
266
|
23. кет-ө
|
399
|
48
|
Сал-е
|
250
|
24. осы-м
|
396
|
49
|
Соң-ш
|
250
|
25. жоқ-д
|
391
|
50
|
Жыл-з
|
247
|
Осы оқулықтардың мәліметтерін БӘ мәтіндерінің жиілік құрылымын көрейік. БӘ еңжиі қолданылатыфн 27901 сөз н;олданыстағы лексикалық бірліктердің ішінде таңдаманың 26,68%-ын алатын 50 сөздің 7,3%-ын ол, мен, өз, бұл, сол, ссы, не. біз есімдіктері қамтыса, 45,14%-ын бол, кел, ал, е, тур, жүр, бар, де, көр, жат, кет, айт, шық, отыр, қара, біл, өт, бер, қой, сал етістіктері, 15,33%-ын де, да, мен, ғой, соң шылаулары, 17,57%-ын сөз,күн, жер, көз, үй, бас, адам, ат, көл, жыл секілді зат есімдер, 5,52%-ын жоқ,бар,көп сөздері, 0,98%-ын алд көмекші есімі, 1,47%-ын барынша үстеуі қамтиды.
50 жылдардағы оқулықтардың жиілік сөздігіндегі сөздердің қатар саны мен абсалютті жиілік шамасы арасындағы қатынасты білдіретін кесте көрінісі.
Абсалютті
ЖИІЛІК (Ғі)
|
Қатар саны (ранг)
|
Абсалютті жиілік
|
Қатар саны (ранг)
|
Абсал жиілік^) ютті
|
Қатар саны (ранг)
|
Абсалютті жиілік (Ғі)
|
CNJ
|
1
|
CNJ
|
1
|
CNJ
|
1
|
2
|
1. 3609
|
14
|
1066
|
27
|
749
|
40
|
615
|
2. 3374
|
15
|
1007
|
28
|
747
|
41
|
615
|
29
3. 3142
|
16
|
954
|
29
|
747
|
42
|
601
|
4. 3609
|
17
|
945
|
30
|
742
|
43
|
596
|
5 3374
|
18
|
934
|
31
|
742
|
44
|
596
|
6 3142
|
19
|
902
|
32
|
726
|
45
|
594
|
7 2301
|
20
|
870
|
33
|
720
|
46
|
584
|
8 2024
|
21
|
818
|
34
|
717
|
47
|
580
|
9 1769
|
22
|
802
|
35
|
710
|
48
|
563
|
10 1510
|
23
|
801
|
36
|
710
|
49
|
544
|
11 1462
|
24
|
779
|
37
|
684
|
50
|
539
|
12 1371
|
25
|
760
|
38
|
654
|
|
|
13 1270
|
26
|
751
|
39
|
647
|
|
|
Қарастырылған сапыстырулар нәтижесін тіліндегі жиілігі ең жоғары сөздердің ішінде табиғаттағы заттар мен қубылыстарды, олардың арасындағы байланыстарды және солардың жай-күйін білдіретін жіктеу есімдіктері, зат есімдер мен етістіктердің және көмекші сөздердің үлесі басым екенін көреміз. Осы категорияларды бір-бірімен байланыстыру арқылы оқушылардың тілінде грамматикалық ерекшеліктер дамып, қалыптасады. Оқулық мәтіндеріндегі жоғары жиілікте қолданылған осы лексикалық тұлғаларға талдау жасай отырып, болашақга оқулық мәтіндерін түзу барысында сирек қолданыстағы мағыналық қүндылығы жоғары сөздергө де назар аударылып, олардың танымдық маңызы, жаңа ұғым, түсініктерді берудегі мүмкіндігі ескерілсе дейміз.
Енді белгілі бір жиіліктегі сөз бен оның жиілік қурылымдағы реттік нөмірі, яғни рангісі арасындағы байланыстың бар - жоқтығын тексеріп көрейік: Жоғарыда көрсетілген 16-кестені түсінідіретін болсақ, 50 жылдардағы оқулықтардың жиілік сөздігі мәліметтері бойынша мәтіннің жиілік
30
құрылымының үзіндісі (мұндағы) і - ранг, Ғі - абсалютті жиілік, мәтін көлемі N=185961; түбірісөздің көлемі L=10298; Ғтах=3609) рангі мен жиілік сөздік арасындағы белгілі бір тәуелділікті білдіреді.
70 жылдардағы оқулықтардың жиілік сөздігіндегі сөздердің қатар саны мен абсалюттік жиііпік шамасы арасындағы қатынасты білдіретін кесте көрінісі.
Қатар Саны
(ранг)
|
Абсалютті
ЖИІЛІК(Ғ-і)
|
Қатар саны (рані)
|
Абсалютті жиілік (Ғі)
|
Қатар саны (ранг)
|
Абсалютті жиілік
(Ғі)
|
Қатар саны (рані)
|
Абсалютті жиіпік (Ғі)
|
1
|
2
|
1
|
2
|
1
|
2
|
1
|
2
|
1
|
4982
|
14
|
1423
|
27
|
1102
|
40
|
832
|
2
|
3736
|
15
|
1400
|
28
|
1083
|
41
|
831
|
3
|
2935
|
16
|
1315
|
29
|
1075
|
42
|
820
|
4
|
2188
|
17
|
1267
|
30
|
1072
|
43
|
792
|
5
|
2029
|
18
|
1263
|
31
|
1033
|
44
|
787
|
6
|
1965
|
19
|
1255
|
32
|
997
|
45
|
785
|
7
|
1804
|
20
|
1249
|
33
|
972
|
46
|
768
|
8
|
1798
|
21
|
1208
|
34
|
970
|
47
|
744
|
9
|
1707
|
22
|
1185
|
35
|
964
|
48
|
729
|
10
|
1705
|
23
|
1162
|
36
|
926
|
49
|
728
|
11
|
1681
|
24
|
1154
|
37
|
922
|
50
|
691
|
12
|
1677
|
25
|
1145
|
38
|
993
|
|
|
13
|
1445
|
26
|
1125
|
39
|
863
|
|
|
Яғни, сөздердің рангі өсуіне қарай, оның жиілігі кеми береді. Мысалы, 50 жылдардағы оқулықтарды ең төменгі рангіде жоғарғы жиіліктегі "ол" есімдігі тұр, Сол секілді 70 жылдардағы БСО ранг-жиілік тәуелділігінің кестесін салыстырсақ, мұнда да жоғарыда келтірілген сөздердің кему жиілігі бойынша орналасу реті мен оның жиілігі арасында кері
Достарыңызбен бөлісу: |