Сборник научных статей научно-практической конференции «Байтанаевские чтения-Х»


ӘOЖ 057.874   DATA MINING ДЕРЕКТЕРДІ ИНТЕЛЛЕКТУАЛДЫ ТАЛДАУ



Pdf көрінісі
бет148/301
Дата22.10.2023
өлшемі8,82 Mb.
#187405
1   ...   144   145   146   147   148   149   150   151   ...   301
Байланысты:
baytanaev 2022 zhinak 1 tom gotov

 
ӘOЖ 057.874 
 DATA MINING ДЕРЕКТЕРДІ ИНТЕЛЛЕКТУАЛДЫ ТАЛДАУ 
ТЕХНОЛОГИЯСЫНЫҢ НЕГІЗДЕРІ 
Ускенбаева С.Ж. , Есқара М.М. – 
1510-10 тобының студенттері
 
Ғылыми жетекші: Одаманова Г.П. – 
магистр оқытушы 
Оңтүстік Қазақстан мемлекеттік педагогикалық университеті, Шымкент 
 
Резюме 
В этой статье рассматриваются основы технологии интеллектуального анализа 
данных и цели интеллектуального анализа данных. Обсуждается практическое 
применение интеллектуального анализа данных в интернет-технологиях. 
Адам әрқашан оқиға, құбылыс, объект туралы сенімді ақпаратқа, мәселені 
шешудің алгоритміне ғана қызығушылық танытқан. Адам әрқашан қалаған 
мақсатына қалай жетуге болатындығын дәл елестетіп отырды. 
Компьютерлер мен ақпараттық жүйелердің пайда болуы адамның өмірін 
жеңілдетуі керек еді, бірақ бәрі тек күрделене түсті. Ақпарат компьютерлік 
жүйенің ішектеріне өтіп, көзден ғайып болды. Қажетті деректерді таңдау үшін 
дұрыс алгоритм құрастыру немесе мәліметтер базасына сұранысты 
тұжырымдау қажет. 
Data Mining — «машинамен (алгоритмдермен, жасанды интеллект 
саймандарымен) шикі деректерде, бұрын белгілі болмаған, тривиальді емес, 
практикалық түрде пайдалы, адаммен интерпретациялау үшін жетімді жасырын 
білімді зерттеу әрі аңғару. Бұл терминді 1989 жылы Григорий Пятецкий-
Шапиро енгізген. 
Григорий Пятецкий-Шапиро: «Бұл анық емес, объективті және практикада 
пайдалы заңдылықтардың үлкен көлемін іздеуге арналған технология» [1]. 
Data Mining-де алынған ақпарат ретінде модельдер қызмет атқарады. 
Модельдердің түрлері олардың жасалуына қарай негізделетін болады. Ең көп 
таралған: ережелер, ағаштар шешімдер, кластерлер және математикалық 
функциялар болып табылады. 
Data Mining мақсаттары көптеген ережелерді шешуге септігін тигізеді. 
Оның негізгілері: классификация, регрессия, ережелерді іздеу, кластеризация 
болып табылады. 


287 
Классификацияның 
мақсаты 
оның 
сипатымен 
негізделетін 
болады.Классификацияның мақсаты оның сипатымен негізделетін болады. 
Айта кету керек, бұл жерде көптеген кластарды анықтауға болады. 
Регрессияның мақсаты классификациядағыдай көптеген кластарға ие 
болып, оған белгілі бір объект жатқызылуы мүмкін.Регрессияның мақсаты 
классификацияның мақсатына ұқсап, белгілі бір сипаттар бойынша объектінің 
параметрін анықтауға септігін тигізеді. Параметрдің мақсаты көптеген сандар 
болып табылады. 
Ассоциациялы ережелерді іздеген уақытты объектілер арасында 
тәуелділерді табуға болады. Табылған тәуелділер ережелер түрінде табылып, 
объектілер мен қызметтер арасында негізделуі де мұмкін. 
Кластеризацияның мақсаты тәуелсіз топтарды іздеуде болып табылады. 
Бұл мақсатты шешу ақпараттары түсінуге септігін тигізеді. Осыдан бұрын, 
объектілердің бірігуі олардың санын қысқартуға көмектигізеді. 
Жалпы, классификациядағы кластардың саны екіден артық болуы мүмкін. 
Мысалға, ондай кластардың саны 10 (саны бойынша сан ондық санау 
жүйесінде) болуы мүмкін. Осының негізінде әрбір пикселдің түсі зерттелетін 
объектінің саны болып табылады. 
Data Mining классификациясының мақсатын, белігілі бір объектіні 
анықтау ретінде қарастыратын болады. Ол тәуілсіз ауыспалылармен 
негізделетін болады. Қарастырылған мысалдарда тәуелсіз ауыспалылар болып 
табылады:
• Жалақы, жасы, балалар саны және т.б.;
• Белгілі бір сөздердің айтылу жиілігі;
• Матрицаның пикселінің түсінің мақсаты.
Тәуелді ауыспалылар осы мысалдарда болып табылады, тиісінше:
• Клиенттің жұмысқа қабілеттігі (ықтимал мәндер осы айнымалы —«иә» 
және «жоқ»);
• Хат типі (ықтимал мәндер осы айнымалы — «spam» немесе «mail»);
• Бейне саны (ықтимал мәндер осы айнымалы —0, 1, ..., 9).
Барлық қарастырылып отырған мысалдардағы көптік мағынаға көңіл 
бөлу керек: [«ия», «жоқ»], [«spam», «mail»], [0, 1,..., 9]. Егер де 
ауыспалылардың мағынасы тәуелсіз сандар болса, онда регрессияның мақсаты 
болып табылады. Оның мысалы ретінде кредит мөлшерін анықтау болып 
табылады.
Классификация мен регрессияның мақсаты екі этапта жүргізілетін 
болады. Бірінші кезеңде оқыту таңдау бөлінеді. Оған тәуелсіз объектілер 
кіртені болады. Осындай таңдамалылар болуы мүмкін:
• Клиенттер жөніндегі ақпарат;
• Хат қолды түрде спам немесе хат түрінде қабылданады; 
• Бұрын анықталған сандардың матрицасы.
Алынатын жоспар негізінде ауыспалының мағынасы анықталатын 
болады. Оның көбінесе регрессияның немесе классификацияның функциясы 
деп атайды. Оған келесідей амалдар негізделетін болады:


288 
• Таңдамалының құрамына кіретін объектілер үлкен болуы тиіс. Көп 
объектілерінің нақты салынған оның негізінде жіктеу функциясы немесе 
регрессия;
• Таңдауға әртүрлі кластағы объектілер кіруі тиіс;
• Әрбір класс үшін жеткілікті объектілер болуы шарт.
Екінші 
этапта 
жасалған 
модельді 
объектілерге 
(объектілерге 
анықталмаған мәніне тәуелді айнымалы) қолданатын болады [2].
Электронды бизнес жүйесінде Data Mining технологиясы жиі клиенттерді 
ұстау үшін немесе интернет-дүкендер үшін қолданылады. Тауарлар мен 
қызметтер 
көп 
жағдайда 
заңдылықтар 
негізінде 
жүзеге 
асатын 
болады. Статистика көрсетіп жатқандай, Amazon дүкенінің әрбір клиенті 
«Customers who bought this book also bought: ...» не сатып алғанын қарайтын 
болады. Клиенттердің персонализациясы , немесе автоматты түрде тану жоғары 
маркетингтік саясатты жүргізуге септігін тигізеді. Қаншалықты электрондық 
коммерцияда ақша және төлеу жүйелері, электрондық болғандықтан, пластик 
карточкаларымен жұмыс істеу операцияларының қауіпсіздігін қамтамасыз ету 
маңызды тапсырма болып табылады. Себебі, электронды коммерцияда 
төленетін ақша электронды болып табылады. Data Mining алаяқтарды 
анықтауға септігін тигізетін болады. Электронды коммерция облысында 
сондай-ақ әдеттегі маркетинг үшін жасалған Data Mining әдістемелері әділ 
болып есептелінеді. Ол түсінік негізінен Web Mining түсінігімен байланысты.
Web Mining ерекшелігі web-түйіндерде бар ақпараттың көлемі бойынша 
таратылған және маңызды, бірдей еместігін талдауға арналған Data 
Mining дәстүрлі технологияларын қолдануда. 
Web Mining спецификасы Data Mining технологияларын қолдануда болып 
табылады. Онда келесідей бағыттарды анықтап көрсетуге болады:Web Content 
Mining және Web Usage Mining. Біріншісі жағдайда автоматты іздеу және 
Ғаламтор желілерінен «ақпараттық шумен» жүктелген ақпараттан сапалы 
ақпаратты алу, көбінесе қандай уақытта және қандай тұтынушылардың қандай 
топтарымен қандай беттер екендігін анықтау туралы айтылады. Берілген 
бағытты Text Mining деп атайды. Web Usage Mining қандай уақытша тiзбекте 
қандай беттерi және қолданушылардың топтарымен сұрау салғандармен 
табады [3]. 
Data Mining-бұл адами қызметінің әр түрлі саласында шешімдер қабылдау 
үшін қажет шикізат деректердегі білімдердің бұрын белгісіз, маңызсыз, іс 
жүзінде пайдалы және қолжетімді интерпретациясын ашу процесі. Data Mining 
менеджерлер мен талдаушылар үшін күнделікті қызметте үлкен құндылыққа 
иеленеді. Іскер адамдар Data Mining әдістерінің көмегімен нақты бәсекелестік 
артықшылықтарға ие болады. 


Достарыңызбен бөлісу:
1   ...   144   145   146   147   148   149   150   151   ...   301




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет