Data Mining технологияларына жалпы сипаттама Data Mining негізгі түсініктері


Сурет 10 Датасеттерді импорттау Одан соң жүктелген ақпараттарды тексереміз (11 – сурет). Сурет 11



бет15/16
Дата13.05.2020
өлшемі1,52 Mb.
#67919
1   ...   8   9   10   11   12   13   14   15   16
Байланысты:
Негізгі бөлім

Сурет 10 Датасеттерді импорттау

Одан соң жүктелген ақпараттарды тексереміз (11 – сурет).



Сурет 11 Деректерді тексеру
Егер деректердің ішінде бос (NULLS), толтырылмаған ақпарат болса, біздің оқыту моделіміз бұзылады, сәйкесінше оларды жоямыз (12 – сурет).

Сурет 12 Медианаға іздеу мен орын ауыстыру
Моделімізді оқытатын кітапханалар тізімі (13 – сурет).

Сурет 13 Деректерді машиналық үйрету
Банк клиенттерінің төлем қабілеттілігін көресететін есептеуге қажетті ақпараттардың салмағы берілген, басқаша айтқанда, шешім қабылдау кезінде сүйенетін негізгі критерийлердің тізімі (14 – сурет).

Сурет 14 Критерийлер бойынша ақпараттар салмағы
Жүктелген 150 000 жуық ақпаратты 2-ге бөлеміз. 75% ақпаратты «train» моделімізді оқытуға, ал қалған 25 % ақпаратты «test» моделіміздің қаншалықты дұрыс жұмыс жасайтынын білу үшін қолданамыз (15 - сурет).

Сурет 15 Бірнеше модельдермен оқыту
Төменде банк клиенттерінің төлем қабілеттілігін көресететін есепті Logistic regression әдісін қолдану арқылы шешу нұсқасы көрсетілген (16 – сурет).



Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   16




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет