1.96' (I- 0,0004)
н 90()00
0,33
2 -0,00004
Әйтсе дс біздің карастырғанымыз таңцамалы колем емсс, мәтіндерді түтастай зерттеу болғандықган, 200 000 сөз қодданыс мөлшері жеткілікті келем болып табылады. Бірақ зерттеу мақсатына сәйкес БСО мәтіндерімен езара салыстырылатын әр түрлі
тандамаларды ескере отырып, бүлардың барлығын, яғни, БСО мәтіндерін де шартты түрде "таңдама" дсп атауды үйғардық.
Демек, жеткілікті мөлшсрдсгі мәтін көлсмі бақылаудың жіберілуі ықгимал қатынасты және абсолютті қатсліктері, берілген сснімділік. алдын-ала анықгалған мәтіннің сөзбен қамтылуы және онымен байланысты нақгы жиіліктің томенгі шсгі секілді шамаларга байланысты болады [16,33]. Бүл барлық шамалар бір-бірімен өзара тығыз байланысты жәнс тілдің қүрылысы мсн мәтіннің лингвистикалық қүрылымына тоуслді. Анықталған тандама негізіндс 50 жылдардағы БСО мәтіндеріндегі сөздер мсн сөз формаларыныц жиілік сөздігі (ЖС), алфавитті-жиілік создігі (АЖС) жоне ксрі алфавитті-жиілік создіктері (КАЖС) алынды (1,2-кестелер).
Қазақ мәтіндеріне статистикалық талдау жасау кезінде
қиындықтар кездесті.
Атап айтқанда, түрақты тіркестерді ажырату.
күрделі сөздер мен терминдерді жскс қарастыру т.б. Сондықтан да
шартты түрдегі критерийлер белгілеу жолымсн бүл қпындықтарды
жеңіддетуге тырыстық. Мәтін бірлігі ретіндс "сөз қолданыс" деген
атауды қолдандық. Мәтінге статистикалық зерттеу жүргізу кезіндс
сыртқы формалары бір-біріне сойксс
келетін сөз қолданыстары
көптеп кездеседі, бүларды "со:з формасы" деп алдық. Бүл сөз
формалары алфавитті-жиілік сөздіктің бірлігі рстінде де қолданылады.
Негізгі лексикалық мағыналары өзара жақын сөз формаларыныц
жиыны "сөз" деп аталатын лексикалық бірліктсрді қүрайды. Жиілік
сездіктегі әрбір сөз бастапқы негізге немесе түбірге кслтірілді,
Мысалы,
барды, барып, барган, барма, барамын т.б. сөз
формаларының негізі ретіндс
бар сөзі алынды. Зерттеу жүргізілген
мәтііідерімізде бастапқы негіз немесе түбір ретінде есім сөздер үшін
жекеше түрдсгі атау септігі формасы, ал етістіктер үшін П-жак
"Үйрық рай формасы алынды. Себебі, кейбір сөздіктерде алынып
келген түйық рай
формасы сөз топтарын ажыратуда, яғни сөздерді
белгілі бір топқа жатқызуда қиындық келтіретін болды. Үстеу, одағай,
еліктеу сөздер мен көмекші сездер негізінен түбір формада кездесіп
Отьірғандықтан көбіне сол күйіндс қалдырылды.
Зерттсу барысында сөздср мен сөз формаларына арнайы *ндекстеу жүргіздік немесс орбір созді шартты түрдс алынған бір