Data Mining технологияларына жалпы сипаттама Data Mining негізгі түсініктері


Python программалау тілінде Random Forest әдісін қолдану арқылы банк клиенттерінің төлем қабілеттілігін көресететін есепті жүзеге асыру



бет14/16
Дата13.05.2020
өлшемі1,52 Mb.
#67919
1   ...   8   9   10   11   12   13   14   15   16
Байланысты:
Негізгі бөлім

3.4 Python программалау тілінде Random Forest әдісін қолдану арқылы банк клиенттерінің төлем қабілеттілігін көресететін есепті жүзеге асыру


1991 жылы Гвидо ван Россум Python программалау тілін ұсынды. Содан бері бұл тіл жалпы мақсаттағы өте танымал программалау тілі болды және деректер бойынша мамандар қауымдастығында кеңінен қолданылады.

Logistic regression, Gradinet boosting classifier және Random Forest classifier әдістерін қолдану арқылы банк клиенттерінің төлем қабілеттілігін көресететін есепті жүзеге асыру мақсатында Python программалау тілін пайдаланамыз.

Бұл есепті шығару үшін бізге клиенттер жайлы аақпарат көзі қажет, сондықтан біз https://www.kaggle.com/ вебсайтынан өзімізге қажетті деректерді (dataset) қорын жүктеп алдық. Деректер қорында клиенттің жасы, мерзімінде төленбеген несиелер күні, айлық табысы, несиелер мен қарыздары, жылжымайтын мүлікке арналған несиелер саны және жанұясындағы адамдар саны бойынша ақпараттар бар. Барлығы 150 000 жуық клиенттердің ақпараты бар (8 – сурет).



Сурет 8 Деректер қорындағы клиентік база
Кейбір жерде клиенттің жасы санмен жазылады, ал кейбір жерде туған жылы көрсетілген, бізге ақпарат бір форматта болу керек, сондықтан тазарту процессі міндетті түрде болады (9 – сурет).


Сурет 9 Кітапханаларды импорттау
Деректер қорын өзімізге жүктеп алғаннан соң, біз деректерді өзіміздің тапсырмамызға қажетті форматқа келтіреміз, ашып айтсақ, кейбір клиенттердегі ақпарат толық болмайды (10 – сурет).





Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   16




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет