287
Классификацияның
мақсаты
оның
сипатымен
негізделетін
болады.Классификацияның мақсаты оның сипатымен негізделетін болады.
Айта кету керек, бұл жерде көптеген кластарды анықтауға болады.
Регрессияның мақсаты классификациядағыдай көптеген кластарға ие
болып, оған белгілі бір объект жатқызылуы мүмкін.Регрессияның мақсаты
классификацияның мақсатына ұқсап, белгілі бір сипаттар бойынша объектінің
параметрін анықтауға септігін тигізеді. Параметрдің мақсаты көптеген сандар
болып табылады.
Ассоциациялы ережелерді іздеген уақытты объектілер арасында
тәуелділерді табуға болады. Табылған тәуелділер ережелер түрінде табылып,
объектілер мен қызметтер арасында негізделуі де мұмкін.
Кластеризацияның мақсаты тәуелсіз топтарды іздеуде болып табылады.
Бұл мақсатты шешу ақпараттары түсінуге септігін тигізеді.
Осыдан бұрын,
объектілердің бірігуі олардың санын қысқартуға көмектигізеді.
Жалпы, классификациядағы кластардың саны екіден артық болуы мүмкін.
Мысалға, ондай кластардың саны 10 (саны бойынша сан ондық санау
жүйесінде) болуы мүмкін. Осының негізінде әрбір пикселдің түсі зерттелетін
объектінің саны болып табылады.
Data Mining классификациясының мақсатын, белігілі бір объектіні
анықтау ретінде қарастыратын болады. Ол тәуілсіз ауыспалылармен
негізделетін болады. Қарастырылған мысалдарда тәуелсіз ауыспалылар болып
табылады:
• Жалақы, жасы, балалар саны және т.б.;
• Белгілі бір сөздердің айтылу жиілігі;
• Матрицаның пикселінің түсінің мақсаты.
Тәуелді ауыспалылар осы мысалдарда болып табылады, тиісінше:
• Клиенттің жұмысқа қабілеттігі (ықтимал мәндер осы айнымалы —«иә»
және «жоқ»);
• Хат типі (ықтимал мәндер осы айнымалы — «spam» немесе «mail»);
• Бейне саны (ықтимал мәндер осы айнымалы —0, 1, ..., 9).
Барлық қарастырылып отырған мысалдардағы
көптік мағынаға көңіл
бөлу керек: [«ия», «жоқ»], [«spam», «mail»], [0, 1,..., 9]. Егер де
ауыспалылардың мағынасы тәуелсіз сандар болса, онда регрессияның мақсаты
болып табылады. Оның мысалы ретінде кредит мөлшерін анықтау болып
табылады.
Классификация мен регрессияның мақсаты екі этапта жүргізілетін
болады. Бірінші кезеңде оқыту таңдау бөлінеді. Оған тәуелсіз объектілер
кіртені болады. Осындай таңдамалылар болуы мүмкін:
• Клиенттер жөніндегі ақпарат;
• Хат қолды түрде спам немесе хат түрінде қабылданады;
• Бұрын анықталған сандардың матрицасы.
Алынатын жоспар негізінде ауыспалының мағынасы анықталатын
болады. Оның көбінесе регрессияның немесе классификацияның функциясы
деп атайды. Оған келесідей амалдар негізделетін болады:
288
• Таңдамалының құрамына кіретін объектілер үлкен болуы тиіс. Көп
объектілерінің нақты салынған оның негізінде
жіктеу функциясы немесе
регрессия;
• Таңдауға әртүрлі кластағы объектілер кіруі тиіс;
• Әрбір класс үшін жеткілікті объектілер болуы шарт.
Екінші
этапта
жасалған
модельді
объектілерге
(объектілерге
анықталмаған мәніне тәуелді айнымалы) қолданатын болады [2].
Электронды бизнес жүйесінде Data Mining технологиясы жиі клиенттерді
ұстау үшін немесе интернет-дүкендер үшін қолданылады. Тауарлар мен
қызметтер
көп
жағдайда
заңдылықтар
негізінде
жүзеге
асатын
болады. Статистика көрсетіп жатқандай, Amazon дүкенінің әрбір клиенті
«Customers who bought this book also bought: ...» не сатып алғанын қарайтын
болады. Клиенттердің персонализациясы , немесе автоматты түрде тану жоғары
маркетингтік саясатты жүргізуге септігін тигізеді. Қаншалықты электрондық
коммерцияда ақша және төлеу жүйелері, электрондық болғандықтан, пластик
карточкаларымен жұмыс істеу операцияларының қауіпсіздігін
қамтамасыз ету
маңызды тапсырма болып табылады. Себебі, электронды коммерцияда
төленетін ақша электронды болып табылады. Data Mining алаяқтарды
анықтауға септігін тигізетін болады. Электронды коммерция облысында
сондай-ақ әдеттегі маркетинг үшін жасалған Data Mining әдістемелері әділ
болып есептелінеді. Ол түсінік негізінен Web Mining түсінігімен байланысты.
Web Mining ерекшелігі web-түйіндерде бар ақпараттың көлемі бойынша
таратылған және маңызды, бірдей еместігін
талдауға арналған Data
Mining дәстүрлі технологияларын қолдануда.
Web Mining спецификасы Data Mining технологияларын қолдануда болып
табылады. Онда келесідей бағыттарды анықтап көрсетуге болады:Web Content
Mining және Web Usage Mining. Біріншісі жағдайда автоматты іздеу және
Ғаламтор желілерінен «ақпараттық шумен» жүктелген ақпараттан сапалы
ақпаратты алу, көбінесе қандай уақытта және қандай тұтынушылардың қандай
топтарымен қандай беттер екендігін анықтау туралы айтылады. Берілген
бағытты Text Mining деп атайды. Web Usage Mining қандай уақытша тiзбекте
қандай беттерi және қолданушылардың топтарымен сұрау салғандармен
табады [3].
Data Mining-бұл адами қызметінің әр түрлі саласында шешімдер қабылдау
үшін қажет шикізат деректердегі
білімдердің бұрын белгісіз, маңызсыз, іс
жүзінде пайдалы және қолжетімді интерпретациясын ашу процесі. Data Mining
менеджерлер мен талдаушылар үшін күнделікті қызметте үлкен құндылыққа
иеленеді. Іскер адамдар Data Mining әдістерінің көмегімен нақты бәсекелестік
артықшылықтарға ие болады.
Достарыңызбен бөлісу: