Доставка данных в хранилище. Данные должны поступать в хранилище в нужном формате и с требуемой регулярностью. Как правило, составляется расписание пополнения хранилища, в соответствии с которым специальные программы организуют передачу данных на склад и их первичную обработку. Передача данных на склад может также осуществляться при возникновении заранее определенных внешних событий.
Процесс загрузки данных обычно подразумевает решение следующих задач:
предобработка данных (исключение дубликатов, устранение ошибочных значений, восстановление пропущенных значений);
агрегирование данных (вычисление обобщенных статистических показателей).
приведение данных к единому формату (унификация типов данных и их представления, исключение управляющих кодов);
Достарыңызбен бөлісу: |