Реляциялық деректер қоры: Вigdata



Дата14.11.2022
өлшемі20,06 Kb.
#158174
Байланысты:
Реляциялық деректер қоры, Вigdata.


Реляциялық деректер қоры: Вigdata.

Кез келген кәсiби қызмет түрі ақпаратты жинау , сақтау және оны іріктеуді ұйымдастырумен айналысады. Бүгінгі күні белгілі бір ұйымдастыру тәсілін немесе механизмді қажет ететін деректер қоры күнделікті өмірдің ажырамас бөлігі болды. Мұндай механизмді деректер қорын басқару жүйесі (ДҚБЖ) деп атайды. Осы негізгі ұғымдарды қарастырайық.


Деректер қоры (ДҚ) – мекеменің ақпараттық қажеттіліктерін қанағаттандыруға арналған логикалық байланысқан деректердің жиынтығы (және олардың сипаттамасы).
Деректер қорын басқару жүйесі (ДҚБЖ) – қолданушыларға деректер қорын анықтауға, жасауға, қолдауға және оны бақылауға мүмкіндік беретін программалық жасақтама. Деректер қорын басқару жүйесі бұрыннан бері қолданыста, олардың көбісінің пайда болуы үлкен есептеуіш машиналарындағы құрылымдалмаған файлдар жүйелерінің пайда болуына негізделген. Деректер қорын басқару жүйелері саласында жалпыға бірдей қазіргі заманғы технологиялар мен қатар, дамып келе жатқан бизнестің талаптары, корпоративті деректердің үнемі ұлғаюы және Интернет технологиялардың әсерінен жаңа бағыттары пайда болды.
Реляциялық (ағылш. relation – байланыс) деректер қоры. Негізгі ақпараттық ағындарды басқару бастауын дәстүрлі деректер қоры жүйесінен алатын реляциялық басқару жүйесі көмегімен жүзеге асырылады. Реляциялық деректер қорымен клиент-сервер технологиясын біріктіру заманауи кәсіпорынға тауарлар мен қызметтер нарығында бәсекеге қабілеттілігін сақтай отырып, өз деректерін табысты басқаруға мүмкіндік береді.
Реляциялық деректер қорында математикалық қатынастар теориясына негізделген қуатты теориялық негіз бар. Реляциялық деректер қоры теориясының пайда болуы, екі класқа бөлінетін сұраныстар тілін жасауға негіз болды:
– қатынастарға қолданылатын арнайы операторлар арқылы сұраныстарды сипаттауға мүмкіндік беретін алгебра лық тілдер;
– қолданыстағы қарым-қатынастардың белгілі бір жиынтығынан жаңа қатынасты анықтайтын өрнекті жазу ережелерінің жинағы болып табылатын предикаттық есептеу тілдері.
Ендеше предикаттық есептеу тілі деректер қорындағы қолданыстағы қатынастардан сұранысқа жауап ретінде алынатын жаңа қатынасты анықтау әдісі болып табылады.
Реляциялық ДҚБЖ мысалдары: MySql, PostgreSql. Реляциялық модельде шынайы өмір нысандары және нысандар арасындағы байланыс, өзара байланысқан кестелер (қатынастар) көмегімен ұсынылады.
ДҚБЖ функциялары бір немесе бір неше кестеден апарат таңдау үшін пайдаланған жағдайда да (яғни сұраныс жасалғанда) нәтиже кесте түрінде ұсынылады. Сонымен қатар сұранысты басқа сұраныстың нәтижелерін пайдалану арқылы жасауға болады.
Деректер қорының әр кестесі жолдар мен бағандар жиынтығынан тұрады, мұнда жолдар (жазба) – нысан, нақты оқиға немесе құбылыс саны, ал бағандар (өрістер) – нысанның, оқиға немесе құбылыстың атрибутта ры (белгілер, сипатта ма лар, параметрлер).
Деректер қорымен жұмыс жасау барысында пайда болатын ең негізгі мәселе – іздеуді ұйымдастыру. Соны мен қатар деректер қорында әдетте ақпарат көп болғандықтан, программалаушыларға тек іздеуді ғана емес, тиімді іздеуді жүзеге асыру міндеті қойылады, яғни іздеуді салыстырмалы түрде аз уақытта және жеткілікті дәлдікпен ұйымдастыру. Ол үшін (сұраныстардың өнімділігін тиімділеу үшін) кестенің кейбір өрістеріне индекстеу жүргізіледі. Индекстер бір бағанның көрсетілген мәні мен жолдарды жылдам іздеу үшін ыңғайлы. Индекссіз кесте бірінші жазбадан бастап тиісті жолдар табылмайынша, бүкіл кесте бойынша оқылады. Кесте неғұрлым үлкен болса, шығындар да көп болады. Егер кесте де қарастырылатын бағандар бойынша индекс болатын болса, он да деректер қоры деректердің барлығын қарастырмай, деректер файлының ортасынан іздеу үшін позицияны жылдам анықтай алады.
Деректер қоры кестелерінің арасындағы реляциялық байланыс
Шынайы өмір нысандары арасындағы байланыстар, деректер құрылымында көрініс табуы мүмкін немесе формальды емес деңгейде болуы мүмкін. Деректер қорының екі немесе одан да көп кестелерінің арасында бағынышты қатынастар болуы мүмкін. Олар негізгі (ата-ана) кестенің әрбір жазбасы үшін бағынышты (бала) кестенің бір немесе бір неше жазбасы болуы мүмкін. Деректер қоры кестелері нің арасындағы байланыстың 3 түрі бар:
– «біреуден – көпке»;
– «біреуден – біреуге»;
– «көптен – көпке».
«Біреуден – көпке» қатынасы «Біреуден – көпке» қатынасында негізгі кестенің бір жазбасына бағынышты кестенің бірнеше жазбасы сай келеді.
«Біреуден – көпке» байланысын кейде «көптен – біреуге» деп те атайды. Екі жағдайда да кестелер арасындағы байланыс өзгеріссіз қалады. Байланыстың бұл түрі реляциялық деректер қоры үшін кең таралған. Сонымен қатар ол деректердің иерархия лық құрылымын модельдеуге мүмкіндік береді.
«Біреуден – біреуге» қатынасы «Біреуден – біреуге» қатынасында негізгі кестенің бір жазбасына бағынышты кестенің бір жазбасы сәйкес келеді. Қатынастың бұл түрі «біреуден – көпке» қатынасына қарағанда аз қолданылады. Егер деректер қорының кестесі қосымша ақпараттардан ұлғайып кетпеуін қаласақ, осы қатынас түрін қолданамыз. Алайда бір неше кестедегі өзара байланысқан ақпараттарды оқу үшін, бір кестеде сақталған деректерден бір ақпаратты оқудың орнына бірнеше операция орындау керек болады.
«Көптен – көпке» қатынасы «Көптен – көпке» қатынасы мынадай жағдайларда қолданылады:
– негізгі кестедегі бір жазбаға бағынышты кестенің бірден көп жазбалары сәйкес келеді;
– бағынышты кестенің бір жазбасына негізгі кестенің бір неше жазбасы сәйкес келеді. Реляция лық деректер қорындағы кез келген «көптен – көпке» қатынасын, қосымша кестелерді енгізу арқылы «біреуден – көпке» қатынасына ауыстыру керек.
Big Data
Big Data (тура аударма – «үлкен деректер») дегеніміз не? «Үлкен деректер» терминін деректердің үлкен көлемін басқаруға және талдауға қатысты деп болжауға болады. Деректер – компьютерді басқаратын және электр сигналдары түрінде сақталатын және берілетін магниттік, оптикалық, механикалық тасығыштарға жазылатын шамалар, белгілер немесе символдар.
«Big Data» термині қысқа уақыт ішінде алуан түрлі, ауқымды, құнды деректерді жинау дегенді білдіреді. Мұндай деректерді өңдеу машинасыз жүзеге аспайды. Соңғы уақытқа дейін деректер электрондық кестелермен немесе деректер қорымен шектелді әрі барлығы өте ретті және ұқыпты болды. Жолдар мен бағандарға орналастыруға келмейтіндердің барлығы жұмыс істеу үшін тым қиын деп есептеліп, еленбе ді. Алайда ақпарат сақтау саласындағы прогресс әртүрлі деректің көп санын тіркеп, сақтап, өңдеуге қол жеткізді. Нәтижесінде қазіргі таңда «деректер»ұғымына деректер қорынан бастап, фотосуреттер , бейнелер, дыбыс жазбалары, жазбаша мәтіндер және датчиктердің деректеріне дейін кіреді. Үнемі өсіп келе жатқан ақпарат ағынын бірнеше жыл бұрын елестетуде мүмкін болмаған жолмен пайдалана алатынымызды білдіреді. Бүгінде компаниялар клиенттердің нақты санаттарының қандай затты, қашан сатып алуды қалайтынын болжай алады. Big Data сондай-ақ компанияларға өз қызметін әлде қайда тиімді орындауға көмектеседі.
Термин экономикада, банк қызметінде, өндірісте, маркетингте, телекоммуникацияда, web-талдауда, медицинада және т.б. деректер ағынының жылдамдығының артуы тұрақты болатын, сапалы үлкен көлемдегі деректер мен жұмыс істейтін ірі салаларда қолданылады.
Мысалы, Нью-Йорк қор биржасы күн сайын өткен сессия бойынша сауда-саттық туралы 1 терабайт деректер жасайды.
Әлеуметтік медиа: статистика Facebook деректер қорына күн сайын 500 терабайт жаңа деректер жүктелетінін көрсетеді, негізінен әлеуметтік желі серверлеріне фотомен бейнені жүктеуден, хабар алмасу, постылар астындағы түсі ніктемелер және т.б. салдарынан пайда болады.
Реактивті қозғалтқыш ұшу кезінде әрбір 30 минут сайын 10 терабайт деректерді тудырады. Күн сайын мыңдаған ұшу болғандықтан, деректер көлемі петабайтқа жетеді.
Ақпаратты тез жинақтау мен бірге деректерді талдау технологиясы да жылдам қарқын мен дамуда. Егер бірнеше жыл бұрын клиенттерді ұқсас қалаулары бар топтарға саралау ғана мүмкін болса, енді нақты уақыт режимінде әрбір клиент үшін модельдер құруға болады, мысалы, нақты тауарды іздеу Интернет желісі арқылы жүзеге асырылады және салынған үлгіге сәйкес лайықты жарнама немесе нақты ұсыныстар шығарылады. Модель сондай-ақ бірнеше жыл бұрын ойластырылған нақты уақыт режимінде реттелуі және қайта құрылуы мүмкін.
Үлкен деректер көлемі, жасалу жылдамдығы, түрленуі және өзгергіштігі бойынша ерекшеленеді. Бұл сипаттамаларды толығырақ қарастырайық.
1. Көлем. Big Data термині үлкен өлшеммен байланысты. Деректер мөлшері – қажетті нәрселерді анықтаудағы маңызды көрсеткіш. Күн сайын 6 миллион адам сандық медианы пайдаланады, бұл – алдын ала бағалау бойынша 2.5 квинтиллион байт деректер. Сондықтан назар аудартатын бірінші сипаттама – көлемі.
2. Алуан түрлілік – келесі аспект. Ол құрылымдалған және құрылымдалмаған гетерогенді көздер мен деректер табиғатына сілтеме жасайды. Бұрын электрондық кестелер мен деректер қорлары қосымшалардың көпшілігінде қарастырылатын ақпараттың жалғыз көзі болды. Қазіргі таңда электрондық хаттар, фото, бейне, PDF файлдар, аудио формасындағы деректер де аналитикалық қосымшаларда қаралады. Құрылымдалмаған деректердің осындай алуан түрлілігі сақтау, өндіру және талдау проблемаларына алып келеді: компаниялардың 27%-і лайықты деректермен жұмыс істейтініне сенімді емес.
3. Жасалу жылдамдығы. Деректердің талаптарды қанағаттандыру үшін қаншалықты тез жинақталатыны және өңделетіндігі әлеуетті анықтайды. Жылдамдық апарат көздерінен – бизнес үдерістерден, қосымшалардың логоларынан, әлеуметтік желілер мен медиа сайттарынан, сенсорлардан, мобильді құрылғылардан апарат ағынының жылдамдығын анықтайды. Деректер ағыны уақыт өте үлкен және үздіксіз болып келеді.
4. Өзгергіштік – өңдеу мен басқаруды қиындататын уақыттың кейбір сәттерінде деректердің тұрақсыздығын сипаттайды. Мысалы, деректердің басым бөлігі өз ерекшелігіне сай құрылымдалмаған.
Big Data ұсынатын артықшылықтар:
1. Әртүрлі көздерден деректерді жинау.
2. Нақты уақытта талдау арқылы – бизнес процестерін жақсарту.
3. Үлкен көлемді деректерді сақтау.
4. Инсайттар. Big Data құрылымдалған және жартылай құрылымдалған деректердің көмегімен жасырын ақпаратқа аса бай.
5. Үлкен деректер тәуекелді азайтуға және қолайлы тәуекел-талдаушының арқасында дұрыс шешімдер қабылдауға көмектеседі.
Big Data-ның қиыншылықтары:
1. Деректердің құпиялылығы – Big Data біздің жеке өміріміз туралы көптеген ақпарат ты қамтиды, оның құпиялылығын сақтауға толық құқымыз бар.
2. Дерек терді қорғау – егер белгілі бір мақсат үшін біздің деректеріміз бөгде жандардың қолында болса, осы деректеріміздің сақталуы мен қауіпсіздігіне сенімді бола ала мыз ба?
4. Жаңа сабақты қортындылау:

Достарыңызбен бөлісу:




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет