2. Қауіп факторының бағалау. Орайластық кестелерін түрлендіру. Фишердің нақты критерийі


Дисперсиялық талдау. Бірфакторлық дисперсиялық талдауды жүргізу әдісі



бет7/18
Дата16.09.2022
өлшемі0,55 Mb.
#149684
1   2   3   4   5   6   7   8   9   10   ...   18
Байланысты:
БСТ РК2

7. Дисперсиялық талдау. Бірфакторлық дисперсиялық талдауды жүргізу әдісі.
Алғашында дисперсиялық талдауды ағылшын ғалымы, математик және генетик Рональд Фишер 1938 жылы дисперсиялық талдауға өзіндік анықтама берген болатын: Оның сөзінше дисперсиялық талдау-«бір себептерден болатын дисперсияны екінші бір себептерден болатын дисперсиядан айыру» деп түсіндірген болатын. Негізінде дисперсиялық талдаудың мақсаты зерттеліп отырған кездейсоқ шаманың мәніне әсер ететін, шама мәнінің тұрақсыздығын тудыратын факторларды анықтау болып табылады.
Дисперсиялық талдау деп – бұл екіден артық топтардың орта мәндерін салыстыру үшін, яғни бірнеше тәуелсіз топтардың бір бас жиынтыққа жататындығын немесе жатпайтындығын анықтау үшін қолданылатын талдау әдісі болып табылады. Оған орта мәндердің арасындағы айырмашылықтарды анықтау үшін дисперсиялар қолданылады. Сонымен, дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады. Дисперсиялық талдау негізіне зерттеліп отырған жиынтықтың барлық элементтерінің орта мәннен ауытқуын талдау жатады. Ауытқу өлшемі ретінде ауытқулардың орта квадраты – дисперсия алынады.
Дисперсиялық талдау міндеттеріне келетін болсақ:
Факторлық белгілер (фактор) – зерттелетін құбылысқа ықпал ететін белгілер.
Нәтижелік белгілер (факторға жауап) – факторлық белгілердің ықпалы нәтижесінде өзгеретін белгілер болып саналады. Бір фактордың ықпалы тексерілетін дисперсиялық талдау бірфакторлы деп аталады (ANOVA). Екі немесе одан да көп факторлардың ықпалын зерттеу үшін көпфакторлы дисперсиялық талдау (MANOVA – Multivariate ANOVA) қолданылады.
Дисперсиялық талдаудың бұл түрі зерттелетін фактордың тәуелді айнымалыға әсері туралы гипотезаны тексеруге мүмкіндік береді. Бір факторлы ANOVA математикалық моделі тәуелді айнымалының жалпы өзгергіштігінде оның екі құраушысын бөлуді қамтиды: өзгергіштіктің топаралық құраушысы фактордың әсерінен орташа мәндердің айырмашылығына байланысты; өзгергіштіктің топ ішіндегі құраушысы ескерілмеген себептердің әсерінен болады. Өзгергіштіктің осы екі құраушысының арақатынасы фактордың әсерінің статистикалық маңыздылығын анықтайтын негізгі көрсеткіш болып табылады.
Енді оның қате деңгейі 5% - дан жоғары немесе оған тең (яғни р≥0,05) анықталған кезде орташа мәндердің теңдігі туралы гипотеза расталады. Ал қате деңгейі 5% - дан аз болса (яғни p<0,05), кем дегенде екі орташа мән арасындағы айырмашылық туралы гипотеза расталады.
Негізі шешім қабылдаудың негізгі көрсеткіші болып Фишердің F-критерийі және оның сенімділік деңгейі болып саналады.
Егер фактор 2-ден астам градациядан тұрса, онда әр түрлі фактор градациялары үшін орташа мәндер бір-бірінен қалай ерекшеленетіні туралы қорытынды жасау үшін орташа мәндерді қосымша салыстыру қажет. Бұл бір факторлы ANOVA-ға ғана емес, сонымен қатар фактордың 2-ден астам градациясы болса, дисперсиялық талдаудың басқа түрлеріне де қатысты.
Негізі Дисперсиялық талдау жүргізу үшін сапалық белгілер (жыныс, профессия) де, сандық белгілер де (иньекция саны, аурулар саны) қолданылады. Таңдама деректерді әдетте кесте түрінде бейнелейді, К деңгейден тұратын А факторы үшін кесте берілетін болады.
Кестедегі таңдамалар, яғни бақылау топтары фактор деңгейлеріне сәйкес және баған түрінде орналасқан. Таңдаманың әрбір элементіндегі бірінші индекс –таңдамадағы элементтің нөмірін, ал екінші индекс – топ нөмірін көрсетеді.
Топтық орта мән – әр топтағы элементтердің орта арифметикалық мәні:
Хmon j = 1/nj*(x1j+x2j+…+xnj j)
nj саны j –ші таңдаманың көлемі, бақылаудың жалпы саны n = n1+n2+…+nk.
Жалпы алғанда, nj саны әртүрлі, алайда біз барлық таңдамалар көлемі тең болған жағдайды қарастырумен шектелеміз.
Дисперсиялық талдаудың негізгі идеясы таңдама дисперсияны екі компонентке (құрамдас бөлікке) бөлуге негізделген, олардың біреуі орта мәндердің өзгергіштігіне фактордың ықпал етуіне сәйкес келеді (факторлық дисперсия), ал екіншісі кездейсоқ себептерден туған және орта мәндердің өзгергіштігіне ықпал етпейтін дисперсия (қалдық дисперсия).
Топаралық дисперсия - фактордың таңдама орта мәндердің өзгергіштігіне ықпал етуінен туған дисперсия, оны факторлық дисперсия деп атайды және MSфактор (Mean Sqare) арқылы белгілейді.
Топішілік дисперсия – кездейсоқ себептерден туған және орта мәндердің өзгергіштігіне ықпал етпейтін дисперсия, оны қалдық дисперсия деп атайды және MSқалдық арқылы белгілейді.
Негізіндет оптық орта мәндердің теңдігі жөніндегі нөлдік жорамалда топаралық дисперсия топішілік дисперсияға ұқсас. Егер салыстырылып отырған топтар арасында айырмашылық бар болса, онда топаралық дисперсия топішілік дисперсиядан үлкен болады. Фишер критерийі осы екі дисперсияның қатынасына негізделген. ANOVA үшін Фишер критерийінің F статистикасы топаралық дисперсияның топішілік дисперсияға қатынасы арқылы анықтаймыз.
F=MSфакт/MSкалд
F статистикасы (к- 1) және (n- к) еркіндік дәрежелеріне сәйкес келетін Фишер таралуына бағынады. Факторлық дисперсия:
MS факт  r S2x
формуласы арқылы есептейтін боламыз.
Бұл жердегі S2x – k орта мәндерден тұратын таңдаманың ( ̅хтоп1, хтоп2, ...,хтопк ) таңдама дисперсиясы.
S2x =(1/k-1) ri=1(xmonj- x)2
X=1/k (хтоп1 + хтоп2 + ... + хтопк)
Қалдық дисперсияны есептеу формуласы
MSкалд =1/k (S12 + S22 +…+ Sk2)
Осындағы Si2 - i-ші таңдаманың дисперсиясы
Si2 = 1/r-1 ri=1 (xik- xmonj)2
MSфакт үшін еркіндік дәржесінің саны (к – 1), мұндағы к -топтар саны.
MSкалд үшін еркіндік дәрежесінің саны к·(r- 1), мұндағы r -әр топтағы мәндер саны, к - топтар саны,
Факторлық дисперсия - топтық орта мәндердің шашырауын сипаттайды. Қалдық дисперсия – топтардың ішіндегі шашырауды сипаттайды.
Дисперсиялық талдауды жүргізу әдісі
К тәуелсіз таңдамалар бар болсын және олардың әрқайсысы жеке топты анықтайды. Таңдамалар көлемдері - nі , орта мәндер хі және орта квадраттық ауытқулар. Si (i= 1,2,…,k) болсын.
Таңдамалардың жалпы көлемі: n = n1+n2+…+nk
Бірінші нөлдік және балама жорамалдарды анықтаймыз:
Н0: Бас жиынтықтың барлық топтық орта мәндері тең: х1 = х2 = ... =хк
Н1: Бас жиынтықтың барлық топтық орта мәндері тең емес, яғни ең болмағанда бір топтық ортаның басқалардан айырмашылығы бар болады.
Сосын қажетті деректерді K таңдамалардан алу. MSфакт мен MSқалд есептеу, егер MSфакт < MSқалд болса, онда Н0 қабылданады, егер MSфакт > MSқалд болса, онда F критерийін есептейміз.
Кейін критерий статистикасын есептейміз: Fбақ
Осылардан соң α мәнділік деңгейіне сәйкес (α = 0,05 немесе α= 0,01) Фишер таралуының сыни мәнін арнайы кестеден табатын боламыз.
Ал сосын F критерийінің статистикасын сыни нүктемен салыстырамыз
Содан соң Н0 жорамалға қатысты шешім қабылдаймыз: Егер Fбақ< Fсыни болса, онда берілген мәнділік деңгейінде нөлдік жорамал қабылданады.
Егер Fбақ > Fсыни болса, онда нөлдік жорамал жоққа шығарылады және фактордың ықпалы маңызды болып табылады.
Ең соғында нәтижелерге қорытынды жазамыз.
Дисперсиялық талдауды қолдануға қойылатын шарттарына тоқтала кетер болсам:
1. Әрбір таңдама басқа таңдамалардан тәуелсіз болып келеді.
2. Әрбір таңдама зерттелетін бас жиынтықтан кездейсоқ түрде алынады.
3. Бас жиынтық қалыпты таралған болады.
4. Топтардың бас дисперсиялары бірдей болады.
Ескере кететін болсақ: Бұл талаптарды орындау аса маңызды болып табылады. Сондықтан дисперсиялық талдауды жүргізбес бұрын алдымен барлық салыстырылатын топтардың таралуын қалыптылыққа тексеру және осы топтардағы дисперсиялардың теңдігін тексеру қажет. Бұл шарттардың ең болмағанда біреуі бұзылған жағдайда дисперсиялық талдауды қолдануға болмайды. Мұндай жағдайда бір факторлы ANOVA-ның параметрлік емес аналогы Крускал – Уоллис критерийін қолдану қажет.
Қорыта келгенде дисперсиялық талдау- бұл екіден артық топтардың орта мәндерін салыстыру үшін, яғни бірнеше тәуелсіз топтардың бір бас жиынтыққа жататындығын немесе жатпайтындығын анықтау үшін қолданылатын талдау әдісі. Дисперсиялық талдауды алғаш рет ағылшын ғалымы, математик және генетик Рональд Фишер 1938 ж. дисперсиялық талдауға мынадай анықтама берген: Дисперсиялық талдау-«бір
себептерден болатын дисперсияны екінші бір себептерден болатын дисперсиядан айыру». Крускал Уоллис критерийі дисперсиялық талдаудың бір факторлы параметрлік емес ұқсастығын тексеретін әдіс.
8. Дисперсиялық талдау көмегімен тексерілетін статистикалық жорамалдар. Фишердің F-критерийі.
Жалпы дисперсиялық талдауды ғылымға 20 ғасырдың 20-жылдарында Рональд Фишер деген ағылшын математигі сонымен қосы генетигі биология мен ауыл шаруашылығындағы бірқатар эксперименттік тапсырмалары үшін тағайындалған статистикалық әдіс топтамасын атайды.Енді,дисперсиялық талдауға сипаттама бере кетсем,бұл таңдамалы дисперсияларды талдау арқылы екі топтардығ белгілері арасындағы айырмашылықтардың маңыздылыған зерттеуге негізделген кездейсоқ түрде таңдалған әртүрлі топтардағы факторлық және нәтижелік белгілері арасындағы байланысты бағалаудың статистикалық әдістің бір түрі. Яғни,бірнеше тәуелсіз топтардың бір бас жиынтыққа жататындығы немесе керісінше жатпайтындығын анықтау үшін қолданылатын талдау әдісі. Ондағы орта мәндердің арасындағы айырмашылықтарды анықтау үшін дисперсиялар қолданылады.Осындағы зерттеліп отырған жиынтықтың барлық элементтерінің орта мәннен ауытқуын талдау жатады.Ауытқу өлшемі ретінде ауытқулардың орта квадраты – дисперсия алынады.Осы талдауды қолданар алынады міндетті мына шарттарды ескерген жөн:
-Әрбір таңдама басқа таңдамалардан тәуелсіз;
-Әрбір таңдама зерттелетін бас жиынтықтан кездейсоқ түрде алынған;
-Бас жиынтық қалыпты таралған;
-Топтардың бас дисперсиялары бірдей;
Дисперсиялық талдау принциптері бойынша 2-ге бөлінеді. Параметрлік және параметрлік емес деп. Параметрлік еместе Краскел-Уоллис критерийі қолданады.Ал,параметірлікте Фишер критерийі қолданылады.Фишер критериі осы 2 дисперсияның қатынасына негізделген:
-Топаралық депрессия- фактордың таңдама орта мәндердің өзгергіштігіне ықпал етуінен туған десперсия.Оны факторлық дисперсия деп атайды.Белгіленуі: MSфактор
-Топішілік дисперсия -кездейсоқ себептерден туған және орта мәндердің өзгергіштігіне ықпал етпейтін дисперсия.Оны қалдық дисперсия деп атайды.Белгіленуі: MSқалдық
Осы, топтық орта мәндердің теңдігі жөніндегі жорамалда топаралық дисперсия топішілік дисперсияға ұқсас.Ал,егер айырмашылық бар болса,онда топаралық дисперсия топішілік дисперсиядан үлкен болады.
ANOVA үшін Фишер критерийінің F статистикасы топаралық дисперсияның топішілік дисперсияға қатынасы арқылы анықталады.

Ал F статистикасы (к-1) және (n- k) еркіндік дәрежелеріне сәйкес келетін Фишер таралуына бағынады.
MSфакт= r∙S Факторлық дисперсия осы формула арқылы есептеледі.
Формулаға тоқтала кетейк,мұндағы S - к орта мәндерден тұратын таңдаманың (яғни,хтоп1, ͞хтоп2,…., ͞хтопк) таңдама дисперсиясы.

S =


͞x= (хтоп1, ͞хтоп2,…., ͞хтопк)
Қалдық дисперсияны есептеу формуласы
MSқалд= ( + ) бұл жердегі, -і-ші таңдаманың дисперсиясы.
=
MSфакт үшін еркіндік дәрежесінің саны (к-1), мұндағы к - ол топтар саны.
MSқалд үшін еркіндік дәрежесінің саны к*(r-1),мұндағы r- ол әр топтағы мәндер саны.
Факторлық дисперсия ол топтық орта мәндердің шашырауын қарастырса,қалдық дисперсия ол топтардың ішіндегі шашырауды қарастырады.
Қорытындылай келе, дисперсиялық талдауды тәуелсіз топтардың бір бос жиынтыққа жататындығын,жатпайтындығын анықтау үшін қолданылатын талдау әдістің бір түрі.Топтардағы қалыпты үлестірілген белгілерді талдау үшін Фишер критерийі қолданылады.



Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10   ...   18




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет