Power Query Modulo: як обробляти накопичені дані

У цьому підручнику я збираюся продемонструвати, як можна перетворити безладні накопичені дані в більш упорядкований формат. Є досить простий спосіб зробити це, і він буде неймовірно корисним і матиме багато різних застосувань. Ми будемо використовувати модуль Power Query. Ви можете переглянути повне відео цього підручника внизу цього блогу.

Моя дружина прийшла в офіс і сказала, що скопіювала купу адрес із запрошення в календарі, і воно закінчилося вставленням у такому форматі. У неї було 28 адрес електронної пошти та імен, які опинилися в такому дивному, складеному форматі. Це був список імен із купою цитат, ком, сміття та адрес електронної пошти. Вона хотіла знати, як використовувати Power Query, щоб перевести це в кращий формат.

Power Query Modulo: як обробляти накопичені дані

Отже, перейдемо до Power Query, і ми побачимо необроблені дані. Давайте збережемо вихідні дані недоторканими та просто посилатимемося на них. Ми назвемо цей довідковий файл TestData .

Power Query Modulo: як обробляти накопичені дані

Перше, що ми збираємося зробити, це додати індекс, і для цих цілей не має особливого значення, чи буде це індекс від нуля чи одиниці. Для цієї демонстрації ми просто використаємо індекс від нуля. Це легко натиснути, не вибираючи жодних інших параметрів.

Power Query Modulo: як обробляти накопичені дані

Це залучатиме зведення, оскільки воно бере рядки та перетворює їх на стовпці. У цьому випадку ми хочемо взяти цей набір рядків і перетворити їх на три стовпці: один для імені, один для прізвища та один для електронної адреси.

Ми збираємося зводити їх у стовпцях, але нам потрібно мати спосіб, щоб зведення знало, який елемент до якого стовпця. Тут на допомогу приходить Power Query Modulo.

Зміст

Обробка накопичених даних за допомогою Power Query Modulo

Модуль дає нам залишок, коли ми ділимо певне число. Щоб отримати доступ до Modulo, ми переходимо на вкладку «Додати стовпець», потім знаходимо «Стандартний», натискаємо стрілку спадного меню та прокручуємо вниз.

Power Query Modulo: як обробляти накопичені дані

Коли ми клацаємо Modulo, з’являється спливаюче вікно із запитом на кількість потрібних нам стовпців. У цьому випадку нам потрібні три стовпці.

Power Query Modulo: як обробляти накопичені дані

Якщо поділити три на три, то отримаємо одиницю із залишком нуль. Три на чотири дає залишок одиниці, три на п’ять дає залишок два, а потім три на шість дає нам залишок нуль. Таким чином, він виробляє цей гарний повторюваний шаблон, який ми можемо використовувати для нашої опори.

Але перш ніж ми це зробимо, давайте очистимо дані. Ми можемо це зробити двома способами. По-перше, ми можемо просто замінити цінності. Наприклад, для лапок ми можемо просто помістити цитату туди, а потім нічим її не замінити. Він візьме та вичистить ці лапки.

Power Query Modulo: як обробляти накопичені дані

Інший спосіб зробити це, де ми можемо все відразу очистити та зберегти деякі кроки, — це за допомогою функції під назвою Text.Remove . Спочатку ми додаємо спеціальний стовпець, а потім перераховуємо всі значення, від яких хочемо позбутися.

Power Query Modulo: як обробляти накопичені дані

Як бачите, це все добре та легко очищає. Отже, тепер ми можемо позбутися цього початкового стовпця, а потім перемістити цей користувацький стовпець.

Power Query Modulo: як обробляти накопичені дані

Тепер ми можемо чітко виконати наш поворот. Ми беремо Modulo, переходимо до Transform, а потім Pivot Column, і ми збираємося повернути Custom, але ми не хочемо, щоб це агрегувалося. Отже, ми виберемо «Не агрегувати» та натиснемо «ОК».

Power Query Modulo: як обробляти накопичені дані

Ми просто замінюємо його на ці значення в стовпці. Потім він створює ці три стовпці для нас. Ми можемо побачити там прізвище, ім’я та електронну адресу, але це не зовсім той формат, який нам потрібен.

Щоб виправити це, ми можемо взяти ці стовпці, а потім виконати Fill Up .

Power Query Modulo: як обробляти накопичені дані

І тепер у нас є ці додаткові рядки через повторюваний шаблон Modulo.

Power Query Modulo: як обробляти накопичені дані

Ми можемо легко позбутися цього, видаливши альтернативні рядки. Ми можемо зробити це за допомогою параметра «Видалити рядки».

Power Query Modulo: як обробляти накопичені дані

Ми можемо сказати, що перший рядок, який потрібно видалити, це два. Потім видаліть другий і третій ряд, а потім збережіть четвертий і зробіть це як повторюваний візерунок.

Power Query Modulo: як обробляти накопичені дані

Тепер ви бачите, що всі правильні дані добре очищені, і ми все ще маємо 28 оригінальних електронних адрес.

Power Query Modulo: як обробляти накопичені дані

Тепер ми можемо позбутися стовпця Index і відповідно перейменувати заголовки стовпців.




Висновок

Ви можете побачити, що за допомогою простого трюку Modulo, а потім повороту даних і невеликого очищення зробити це досить легко. Як тільки ви зрозумієте, вам знадобиться лише хвилина, щоб зробити все.

Тож, сподіваюся, це дало вам ще кілька ідей та інструментів. Ви також можете переглянути мій наступний посібник . У цьому плані ми детальніше розглянемо деякі речі, які ми розглядали в цьому посібнику, а також розглянемо, як ми можемо автоматизувати цей процес повторюваним способом, використовуючи спеціальні функції. Я також покажу вам кілька цікавих трюків для налагодження ваших спеціальних функцій.

Сподіваюся, це вам було корисно. Ви можете переглянути повне відео нижче та перейти за посиланнями нижче, щоб отримати більше відповідного вмісту.

Все найкраще!


Труба в R: підключення функцій за допомогою Dplyr

Труба в R: підключення функцій за допомогою Dplyr

У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.

Вилучення тем і зображень LuckyTemplates із PBIX

Вилучення тем і зображень LuckyTemplates із PBIX

Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Python у LuckyTemplates: як встановити та налаштувати

Python у LuckyTemplates: як встановити та налаштувати

Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.

Розрахунок динамічної норми прибутку – легкий аналіз LuckyTemplates за допомогою DAX

Розрахунок динамічної норми прибутку – легкий аналіз LuckyTemplates за допомогою DAX

Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.

Сортування стовпців таблиці дат у LuckyTemplates

Сортування стовпців таблиці дат у LuckyTemplates

Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.

Знайдіть свої найкращі продукти для кожного регіону в LuckyTemplates за допомогою DAX

Знайдіть свої найкращі продукти для кожного регіону в LuckyTemplates за допомогою DAX

У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.

Вимір сміття: що це таке і чому це щось інше, але не сміття

Вимір сміття: що це таке і чому це щось інше, але не сміття

Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.