11-и топ білім алушысы Орындаған: Хамит Ақ Маржан Тексерген: Гульдар Ашимқызы Тақырыбы: Big data. Big Data дегеніміз не? Big Data термині тура мағынасында «үлкен ақпарат»



Дата21.05.2022
өлшемі15,63 Kb.
#144432
Байланысты:
Хамит Ақ Маржан 11- И тобы (Big data.)


11-И топ білім алушысы
Орындаған: Хамит Ақ Маржан
Тексерген: Гульдар Ашимқызы
Тақырыбы:Big data.
Big Data дегеніміз не?
Big Data термині тура мағынасында «үлкен ақпарат» деген ұғымды білдіреді. Бірақ оның қаншалықты үлкен ақпарат екендігін анықтайтын нақты өлшем жоқ. Атауының өзі субьективті. Дегенмен, Big Data тек мәліметтер көлемін ғана білдірмейді. Оны ауқымды ақпараттармен жұмыс істеу тәсілдері деп түсінуі қажет. Big Data негізгі мына операцияларды орындауы тиіс: Volume:»стандартты» құжаттармен салыстырғанда өте үлкен көлемдегі мәліметтерді өңдей білу.
Variety:Үлкен көлемде түсетін және үнемі келіп отыратын жылдам ақпарат тасқынымен жұмыс істей білу. Яғни мәліметтер белгілі бір деңгейде қалып қоймайды, үсті-үстіне көбейіп отырады.
Velocity: Құрылымды және нашар құрылған мәліметтермен жұмыс істей білу қажет.
Әдеттегі қазақстандық банкті мысал ретінде қарастырайық. Қарапайым адам үшін бұл қаржы институты бөлімшелер, филиалдар, кредит және депозитпен үндеседі. Бірақ банк бірінші кезекте көлем, сапа және транзакция жылдамдығы. Кез-келген қаржы институтында секундына ондаған немесе жүздеген транзакциялар жүзеге асырылуы мүмкін. Үлкен ақпарат тасқынын жинақтап, сақтап, өңдеу қажет. Неге? Банк өзінің клиенттері мен операциялар типін анықтап, тұтынушыларын қанағанттандыру үшін қандай ұсыныстар мен қызмет түрлері қажет екендігін түсінуі тиіс.
Мәліметтер уақыт өте келе ұлғайып отырады, бұл үзіліссіз процесс. Сіз неғұрлым көп операция жасаған сайын сандық әлемде көбірек із қалдырасыз. Big Data күшейіп жатыр, ол қазіргі жағдайға өзгеше қырынан қарауға мүмкіндік береді.

Қалай қолданады?
Bid Data ұғымы бірнеше жылдан астам қолданылып келеді. Бірақ терминнің өзі әдетте ІТ сферасындағы мамандар үшін ғана түсінікті екендігі рас. Big Data-ның пайдалануын тереңірек түсіну үшін бірнеше мысалдар ұсынамыз.
2 жыл бұрын Target дүкендер желісі сатып алушылармен жұмыс істеу кезінде автоматты таңдау жүйесін пайдалана бастады. Бірнеше жыл бойы компанияда жинақталған мәліметтер белгілі бір жүйе бойынша сұрыпталып отырды. Ол ақпараттардың барлығы банк және жеңілдік карталар арқылы алынды. Машиналық есептеуіш сатып аушылардың талғамы қалай өзгеріп отырғандығын сараптап, болжам жасап отырды. Осы болжамдар негізінде тұтынушыға арнайы ұсыныстар жіберілетін еді. 2012 жылдың көктемінде 12 жасар мектеп оқушысының әкесі қызына жүкті болғандарға арналған ұсыныстар жіберілгендігін айтып, шағым жасайды. Target басшылығы автоматтандырудың қателігін мойындап, наразы болғандардың алдында кешірім сұрауға дайын тұрған еді. Бірақ кейінірек қыздың шын мәнінде жүкті болғандығы анықталды. Алгоритм сатып алушының талғамындағы жүкті әйелдерге лайық өзгерістерді байқап қалып, соның негізінде ұсынытар жіберіп отырған.
Big Data түрлі әдіспен қолданылуы мүмкін. Мысалы, ancestry.com сайты қазіргі кездегі қолда бар барлық мәліметтер типін негізге ала отырып, адамзаттың отбасылық тарихын құруға тырысып жатыр. Кітаптардағы қолжазбалардан бастап ДНК-сараптамадағы есептеулерге дейін пайдаланылады. Бүгінде оларға әртүрлі тарихи дәуірлерде өмір сүрген 5 млрд-қа жуық адамдардың профайлдарын, отбасылар арасындағы байланысты сипаттайтын 45 млн генеалогиялық ағашты жинақтаудың сәті түсті.
Image
Бұл жұмыстағы басты қиындық — өңделуі тиіс ақпараттардың жеткіліксіздігі және дәлсіздігі. Мәліметтердегі адамдар тізімін тек аты-жөніне қарап емес, туған және қайтыс болған уақыттарына және тағы басқа критерийлер бойынша өңдеу керек. Стандартты алгоритмдер мұндай тапсырмаларды орындай алмайды, ал машиналық есептеу барлық дәлсіздікті ескере отырып, барынша жоғары ықтималдықтағы дұрыс нәтижені көрсетеді.
Тағы бір мысал — eHarmony жобасы. Бұл 40 млн адам тіркелген танысу сайты. Сайттағы сауалнамаға 1000-ға дейінгі түрлі ерекшелігіңізді көрсете аласыз. Күн сайын жүйе бір-біріне жақын келетін 100 млн ұсыныс шығарады.
Бұл болжамдар қарапайым көрсеткіштерге сүйенбейді. Мысалы, машиналық есептеу профиль суретіндегі бетіңіздің көлемі белгілі-бір адамдар арасындағы байланыстың дамуына ықпал ете алатындығын анықтады. Адамдардың тағамдарға деген талғамдары да қарым-қатынас дамуына әсер етеді. Екі вегетариандықтың өзара қосылу ықтималдылығы 44% бола, гамбургер жақсы көретін жұптың өзара тіл табыспау ықтималдылығы 44 пайызды құрайды.
Image
Машиналық есептеуді қолдана отырып, біз олардың қандай принциптер негізінде қабылданатындығын түсінбейміз. Әрине, машиналық есептеуді тура мағынасында жасанды интеллект деп атауға болмайды, ол тек алдын-ала белгіленген тапсырманы ғана орындайды. Бірақ алгоритм негізге алатын жүздеген және мыңдаған факторларды адам санасы ескермеуі мүмкін. Ал арнайы дайындалған алгоритм қолданушы үшін қандай түйісу нүктесі қажет екендігін кез-келген пайдаланушыдан артық біледі. Бұл жерде жақсы тәжірибеге қарағанда өңделген мәліметтер базасының пайдасы көбірек.

Достарыңызбен бөлісу:




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет