Әлеуметтікмедиа: статистика Facebook деректер қорына күн сайын 500 терабайт жаңа деректер жүктелетінін көрсетеді, негізінен әлеуметтік желі серверлеріне фото мен бейнені жүктеуден, хабар алмасу, постылар астындағы түсініктемелер және т.б. салдарынан пайда болады.
Реактивтіқозғалтқыш ұшу кезінде әрбір 30 минут сайын 10терабайтдеректерді тудырады. Күн сайын мыңдаған ұшу болғандықтан, деректер көлемі петабайтқа жетеді. Ақпаратты тез жинақтаумен бірге деректерді талдау технологиясы да жылдам қарқынмен дамуда. Егер бірнеше жыл бұрын клиенттерді ұқсас қалаулары бар топтарға саралау ғана мүмкін болса, енді нақты уақыт режимінде әрбір клиент үшін модельдер құруға болады, мысалы, нақты тауарды іздеу Интернет желісі арқылы жүзеге асырылды және салынған үлгіге сәйкес лайықты жарнама немесе нақты ұсыныстар шығарылады. Модель сондай-ақ бірнеше жыл бұрын ойластырылған нақты уақыт режимінде реттелуі және қайта құрылуы мүмкін. Үлкен деректер көлемі, жасалу жылдамдығы, түрленуі және өзгергіштігі бойынша ерекшеленеді. Бұл сипаттамаларды толығырақ қарастырайық.
1.Көлем. BigDataтермині үлкен өлшеммен байланысты. Деректер мөлшері – қажетті нәрселерді анықтаудағы маңызды көрсеткіш. Күн сайын 6 миллион адам сандық медианы пайдаланады, бұл – алдын ала бағалау бойынша 2.5 квинтиллион байт деректер. Сондықтан назар аудартатын бірінші сипаттама – көлемі.
2.Алуантүрлілік – келесі аспект. Ол құрылымдалған және құрылымдалмаған гетерогенді көздер мен деректер табиғатына сілтеме жасайды. Бұрын электрондық кестелер мен деректер қорлары қосымшалардың көпшілігінде қарастырылатын ақпараттың жалғыз көзі болды. Қазіргі таңда электрондық хаттар, фото, бейне, PDF файлдар, аудио формасындағы деректер де аналитикалық қосымшаларда қаралады. Құрылымдалмаған деректердің осындай алуан түрлілігі сақтау, өндіру және талдау проблемаларына алып келеді: компаниялардың 27%-і лайықты деректермен жұмыс істейтініне сенімді емес.