1.4 Data Mining әдістері
Data Mining әдістері ақпаратты талдаушыға жолығатын көптеген тапсырмаларды шешуге мүмкіндік береді.
Олардың ішінде негізгілері: классификация, регрессия, ассоциативті ережелерді іздеу және кластерлеу. Төменде мәліметтерді талдаудың негізгі міндеттерінің қысқаша сипаттамасы келтірілген (3 – сурет).
Сурет 3 Data Mining әдістері
Жіктеу (Classification) – деректер мен метадеректер туралы маңызды және өзекті ақпаратты алу үшін қолданылады. Деректерді интеллектуалды талдау әдісінің осы түрі әртүрлі класстағы деректерді жіктеуге көмектеседі.
Кластеризация (Clustering). Кластерлік талдау – бір-біріне ұқсас мәліметтерді анықтауға арналған Data Mining әдісі. Процесс деректер арасындағы айырмашылықтар мен ұқсастықтарды айырып ұғынуға көмектеседі. Әдіс талданатын мәліметтердің барлық жиынында тәуелсіз топтарды (кластерлерді) және олардың сипаттамаларын іздеуден тұрады. Бұл тапсырманы шешу деректерді жақсы түсінуге көмектеседі. Сонымен қатар, біртекті объектілерді топтастыру арқылы олардың санын қысқартуға, демек, талдауды жеңілдетуге мүмкіндік береді.
Регрессия (Regression). Регрессиялық талдау – айнымалылардың арасындағы өзара байланысты анықтау және талдау мақсатындағы Data Mining әдісі. Классификация әдісіне ұқсас, объектінің белгілі сипаттамалары бойынша оның кейбір параметрінің мәнін анықтауға мүмкіндік береді. Классификация міндетінен айырмашылығы параметрдің мәні кластардың соңғы жиыны емес, нақты сандардың жиыны болып табылады. Ол басқа айнымалылардың болуын ескере отырып, нақты айнымалының ықтималдығын анықтау үшін қолданылады.
Ассоциативті ереже (Association Rules). Деректерді болжалды талдаудың осы әдісі екі немесе одан да көп элементтер арасындағы байланысты іздейді. Ол деректер жиынтығындағы жасырын мәліметті анықтайды. Ассоциативті ережелерді іздеу кезінде объектілер немесе оқиғалар арасындағы жиі тәуелділікті (немесе ассоциацияларды) табады.
Шығарындыларды анықтау (Outer detection). Data Mining әдістерінің бұл түрі деректер жиынтығындағы дайын шаблонға сәйкес келмейтін деректер элементтерін қарастырады. Бұл әдіс басып кіру, табу, алаяқтық немесе ақаулықтарды табу және т.б. түрлі салаларда қолданылуы мүмкін.
Тізбекті паттерлер (Sequential Patterns) Деректерді интеллектуалды талдау әдісінің бұл тәсілі белгілі бір кезеңде ұқсас паттерлерді немесе транзакциялардың деректеріндегі үрдістерді анықтайды.
Болжау (Prediction). Деректерді интеллектуалды талдау әдістерінің басқа комбинациясын, сонын ішінде трендтер, дәйекті паттерналар, кластеризация, жіктеу және т.б. пайдаланды. Бұл тәсіл болашақты болжау үшін өткен оқиғаларды немесе даналарды рет ретімен жүргізу арқылы талдайды. Болжаe әдісі екі кезеңге бөлінеді. Бірінші кезеңде белгілі нәтижелері бар деректер жиынтығы негізінде модель құрылады. Екінші кезеңде ол жаңа мәліметтер жиынтығының негізінде нәтижелерді болжауға пайдаланылады. Бұл ретте, әрине, жасалған модельдердің барынша дәл жұмыс істеуі қажет. Берілген есептер түріне жіктеу және регрессия есептері жатады. Егер оның шешімінің нәтижелері кейбір оқиғалардың пайда болуын болжауға пайдаланылуы мүмкін болса, оған ассоциативті ережелерді іздеу міндетін жатқызуға болады
Достарыңызбен бөлісу: |