Лабораторная работа № 8
МАССОВАЯ ЗАГРУЗКА ДАННЬІХ
СВОД ПО ФИЛИАЛАМ
(4 ЧАСА)
Кейс.
Допустим, что у нас на диске (локальном или сетевом)
есть папка «Продажи ООО Сибирь» с подпапками для
каждого года. В каждой папке находится несколько
файлов с названиями месяцев (в формате Excel), откуда
мы должны собрать данные.
В каждом файле более 2000 строк.
Необходимо собрать все эти данные в один файл Excel с
помощью технологий Power Query.
Методика решения задачи
Выполнение этой задачи распадается на несколько
ситуационных задач:
Ситуационная задача 1.
Получение списка файлов из папок и фильтрация
файлов по расширению (если необходимо).
Ситуационная задача 2.
Извлечение содержимого
(данных) из каждого файла и отбор нужных листов.
Ситуационная задача З.
Импортирование их на лист
Excel с целью построения сводной таблицы.
Такая декомпозиция позволяет представить кейс как
совокупность ситуационных задач.
Краткий процесс выполнения кейса средствами сервиса -
Скачать преобразовать, обращая внимание только на
специфику выполнения действий.
Ситуационная задача 1.
При ее выполнении необходимо понять, что данные
папки могут содержать файлы любых расширений,
поэтому необходима фильтрация по расширению. Кроме
того, файлы могут быть записаны по-разному — «Июнь.
Csv», «июль. Csv» и т.д.
Для
корректного
распознавания
требуется
их
преобразовать к одному регистру, например, нижнему,
используя вкладку -Преобразование - Формат нижний
регистр для столбца Extension.
Ситуационная задача 2.
Извлечение содержимого (данных) из каждого файла и
отбор нужных листов:
1) после загрузки данных из папки в Редактор запросов
необходимо воспользоваться кнопкой с двойными
стрелками в шапке столбца Content, чтобы развернуть
содержимое каждого файла, обозначенное Power Query
как Binary (рисунок 1);
2) на экране появится окно с предварительным
просмотром содержимого на примере первого файла из
нашего списка. Здесь необходимо проверить кодировку
данных (Источник файла), если файл некорректно
распознался, и символы-разделители (выбрать нужный
из списка). Нажать ОК (рис. ниже).
Результат - нашей ситуационной задачи.
1) Составить годовой отчет средствами PQ ( см. пример)
2) И визуализировать продажи в разрезе филиала и
товаров
Филиал
Группа А
Группа Б
Итого по филиалу
Филиал 1
57250
52532
109782
Филиал 2
56416
52872
109288
Филиал 3
48961
49969
98930
Филиал 4
55856
51706
107562
Филиал 5
54821
57875
112696
Всего по группам
273304
264954
538258
Достарыңызбен бөлісу: |