Л. Партыка, И. И. Попов системы управления базами данных



бет70/215
Дата29.01.2022
өлшемі4,64 Mb.
#115817
1   ...   66   67   68   69   70   71   72   73   ...   215
Байланысты:
Голицына О Л Партыка Т Л Попов И И Системы

2.5. Хранилища данных


В основе концепции OLAP (On Line Analytical Processing — анализ данных онлайн) лежит принцип многомерного представления данных. В 1993 г. Е. Ф. Кодд рассмотрел недостатки реляционной модели, в первую очередь указав на невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для корпоративных аналитиков способом», и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

Аббревиатурой OLAP иногда обозначается не только многомерный взгляд на данные, но и хранение самих данных в многомерной БД. Однако Кодд отмечал, что «реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпоративных данных. Необходимость существует не в новой технологии БД, а, скорее в средствах анализа, дополняющих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP».

Для выполнения аналитических запросов могут быть использованы приложения, написанные специально для решения тех или иных практических задач. При этом для решения задач аналитической обработки используются данные, характер и организация которых несколько отличаются от того, как это принято в системах, ориентированных на оперативную обработку.

Использование концепции хранилища данных (ХД) позволяет:



  • своевременно обеспечивать аналитиков всей информацией, необходимой для выработки решений;

  • создавать единую модель данных организации;

  • создавать интегрированный источник данных, предоставляющий удобный доступ к разнородной информации из различных подсистем (единый источник).

Для хранилищ данных характерны следующие основные свойства:

ориентация на предметную область — хранилище в первую очередь  отражает  специфику предметной  области,   а   не приложений;

интегрированностъ — информация, загружаемая в хранилище из баз, ориентированных на частные прикладные задачи, должна быть приведена к единому синтаксическому и семантическому виду. Важно также провести проверку поступающих данных на целостность и непротиворечивость. Чтобы при выполнении аналитических запросов избежать выполнения   операций   группирования,   данные   должны обобщаться (агрегироваться) при загрузке хранилища;

неизменяемость данных — хранилищам свойственна ретроспективность:  объем  накопленных данных должен  быть
достаточным для решения аналитических задач с требуемым качеством.  Поэтому важное отличие аналитических
систем от систем операционной обработки состоит в том, что данные после загрузки в них остаются неизменными,
внесение каких-либо изменений кроме добавления записей, не предполагается;

поддержка хронологии — для выполнения большинства аналитических запросов необходим анализ тенденций развития явлений или характера изменения значений переменных во времени, что обычно достигается введением атрибутов типа дата/время;

многомерное   концептуальное   представление   (multi-dimen­sional conceptual view) — множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных.

Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения предприятие—подразделение—отдел—служащий. Измерение Время может даже включать два направления консолидации — год—квартал—месяц—день и неделя—день, поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим (рис. 2.26).



Рис. 2.26. Измерения и направления консолидации данных



Кодд определил 12 свойств, которыми должны обладать системы этого класса (табл. 2.2).



Достарыңызбен бөлісу:
1   ...   66   67   68   69   70   71   72   73   ...   215




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет