Деректердің графиктік түрде кескінделуі
Терең статистикалық талдау жасауға кіріспес бұрын деректерге алдын-ала талдау жасап алу аса маңызды. Бұл кезенде деректер жиынтығын ықшамдау және жүйелеу үшін графиктік әдістер қолданылады.
Графиктік әдісті деректер жиынтығының ерекшеліктерін бағалауға, ауытқушылықтарды анықтауға, деректерқұрылымын, оның ішінде күрт ерекшелінетін (выброс-outlier)
бақылаулар мен мәндердің көп жиналған (қоюланған) аймағын
танып- білу үшін қолданады.
Деректердің графиктік бейнеленуінің әртүрлі түрлері бар.Олардың ішінде кең қолданылатындары:
Дискретті немесе категориальды деректер үшін
бағаналы диаграмма;
айналма диаграмма;
сегментелген бағаналы диаграмма;
нүктелік график (диаграмма);
жиіліктер полигоны.
Үздіксіз деректер үшін:
гистограмма;
«жапырақты сабақша» диаграммасы (stem and leafs);
«мұртты жәшік» диаграммасы (вох and whiskers plot).
Аралас деректер үшін:
екі өлшемді шашырау диаграммасы.
Бағаналы диаграмма
Тік немесе көлденең бағандар қатарынан тұратын диаграмма.
Бағандар номинальды немесе реттік деректердің категорияларына сәйкес келеді. Бағанның ұзындығы категорияның жиілігіне пропорционал. Бағандар бір-бірімен жанаспайды, бұл мәндердің үздіксіз емес екендігін көрсетеді.
Айналма (секторлық) диаграмма
Дөңгелек секторларға бөлінеді, әрбір сектордың ауданы категорияның пайызбен (%) өрнектелген жиіліктеріне немесе үлестеріне пропорционал. Секторлар саны 3 пен 5 арасында болуы мүмкін.Барлық дөңгелек (360°) деректердің толық жиынын көрсетеді.Графиктің бұл түрін әр шаманың жалпы көлемге қатысты үлесін
көрсету керек болған жағдайда қолданған ыңғайлы. Мүмкіндігінше секторлар санының 5-ке дейін болғаны дұрыс, ең үлкен секторды 12-сағ. позицияда орналастырып, дөңгелектің қалған бөліктерін сағат тілімен толтыру керек, ең кіші сектор дөңгелек ең соңғы болуы керек. Бірде-бір сектор жалпы саннан 5%-дан кем құралмауы керек (18°бұрыш).
Нүктелік график
Нысандардың жеке мәндері бейнеленетін график. Оны бақылау саны 20-дан аз болатын үлкен емес деректер жиыны үшін қолданған орынды. Бір немесе бірнеше категориялар, дискретті айнымалының градациялары х осінде белгіленеді.
Бақыланған мәндердің диапазоны у осінде белгіленеді. Әр бақылаудың сандық мәні нүктемен бейнеленеді. Мәндері бірдей бақылаулар бір көлденең сызықтың бойында көрші орналасады.График деректердің орналасуы мен олардың өзгергіштігін
(құбылмалылығын) көрсетеді.
Гистограмма (Histogram)
Гистограмма - бұл деректердің жиілікті таралуының графиктік түрде кескінделуі. Ол бір-біріне іргелес орналасқан тіктөртбұрыштар түрінде белгіленеді. Әр тіктөртбұрыштың табанының ені топтау жиілігіне, яғни топтау аралығындағы бақылау санына пропорционал.Бір шыңнан тұратын гистограмма біртөбелі, екі шыңнан – екітөбелі (бимодальды), үш немесе одан көп шыңнан көп төбелі
(полимодальды) деп аталады.
«Жапырақты сабақша» диаграммасы (Stem and leafs)
Бұл диаграмма мен кестенің қоспасы және ол деректердің таралуын суреттейді. Диаграмма бойынша деректер жиынының симметриялылығы жөнінде жоруға болады. Деректердің біртектілік дәрежесін сипаттайды. Әдетте тік сабақша тұрғызылады, ол деректердің ретімен келтірілген бірнеше бірінші цифрларынан
тұрады.
«Мұртты жәшік» диаграммасы (box and whiskers plot) BDustt
Бұл екі параллель қабырғалары деректердің жоғарғы және төменгі квартильдеріне (25-ші және 75-ші процентильдер) сәйкескелетін тік немесе көлденең орналасқан тіктөртбұрыш. Жәшіктіңішіне көлденең жүргізілген сызық медианаға (50-ші процентиль) сәйкес келеді. Жәшік квартильаралық диапазонды қамтиды. Шеткі
нүктелер (мұрттар) ең төменгі (тіп) және ең жоғарғы (тах) мәндерді білдіреді. Барлық «шығарылып тасталған» (аномальды үлкен немесе кіші мәндер) мұрттардан әрі орналасады және бірыңғай аномальды мәндер кіші қашықтықта, ал төтенше аномальды мәндер үлкен қашықтықта орналасады.
Жиіліктер полигоны
Дискретті қатарларды графиктік түрде кескіндеу үшін жиіліктер полигоны қолданылады. Полигон - белгілердің мәндері мен олардың жиынтықтағы кездесу жиіліктері арасындағы сәйкестікті бейнелейді. Полигонды тұрғызу үшін абсцисса осіне зерттеліп отырған белгінің мәндері, ордината осіне жиіліктер
салынады және сәйкес нүктелер кесінділер арқылы қосылады,нәтижесінде кесінділерден тұратын сынық сызық пайда болады.Жиіліктер полигондарын бір-біріне үстемелеп салуға болады, ол екі немесе одан да көп деректер жиынын салыстыруға мүмкіндік береді.
Екі өлшемді шашырау диаграммасы (скаттерплот)
Бұл айнымалылар осьтері бір-біріне перпендикуляр орналасқан екі өлшемді график. Бір ғана нысанның жүп көрсеткіштері графикте координаталары х және у болатын нүктелермен бейнеленеді (мысалы,бір ғана пациенттің бойының ұзындығы - х, дене салмағы - у).Диаграмманы екі координатасы да үздіксіз өлшеу шкаласында
берілген екі өлшемді сандық шамалар үшін қолдануға болады.Диаграмма трендтерді, шамалар арасындағы тәуелділікті,шамалардың біреуінің немесе екеуінің де көп жинақталған орнын, біршаманың екінші шамаға қатысты шашырау өзгергіштігін байқауға мүмкіндік береді.
Достарыңызбен бөлісу: |