Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
Під час роботи з обчисленими даними іноді необхідно порівнювати різні набори даних. Я збираюся показати вам, як це зробити, комбінуючи різні функції таблиці. Ви можете переглянути повне відео цього підручника внизу цього блогу.
Theфункція є найкращою річчю для використання в таких випадках. Дехто також може так сказатитак само корисно для порівняння обчислених даних. Але як тільки ви зрозумієте, як використовувати INTERSECT , ви також зможете застосувати до функції EXCEPT у своїх обчисленнях.
Зміст
Зразок даних
Щоб показати, на що здатний INTERSECT , я покажу вам, як порівнювати клієнтів із двох різних періодів часу.
У наведеному нижче прикладі я маю зрізувач дат, який допоможе мені визначити потрібний проміжок часу. У мене також є колонка для штатів, де клієнти розміщують свої замовлення. Звичайно, це може бути зовсім інший вимір залежно від уявлень, які ви намагаєтеся отримати.
Я також маю свій загальний дохід для кожного штату, який також показано у візуалізації.
Тепер я хочу побачити, скільки клієнтів, які зробили покупку в певну дату минулого року, також зробили покупку в ту ж дату цього року. Це означає, що я розглядаю два конкретні списки клієнтів, які зробили покупку в ту саму дату, але в різні роки . Після цього я збираюся дізнатися, скільки клієнтів є в обох списках.
Порівняння клієнтів із двох періодів часу
Перш ніж я зможу порівняти ці два списки клієнтів, мені потрібно спершу визначити загальну кількість клієнтів .
Загальна кількість клієнтів включає тих, хто зробив покупки в різних магазинах у різних штатах протягом зазначеного періоду часу. Я використав просту формулу, щоб отримати цей результат.
Я використовувавоскільки вона відкриває єдиний список унікальних значень. У цьому випадку він покаже нам клієнтів, які купили продукти в указаний період часу.
Я також використовувавфункція. Це підрахує кількість унікальних значень зі списку.
Я посилаюся на таблицю продажів для цього показника.
Чому б замість цього не використати таблицю Customer?
Якщо я посилаюся безпосередньо на таблицю «Клієнт», я в кінцевому підсумку підрахую лише кожного окремого клієнта незалежно від періоду часу. Мені потрібно переконатися, що використовується правильний контекст. Використовуючи таблицю «Продажі» , я отримую не лише інформацію про клієнтів, але й інформацію про те, де та коли вони зробили покупку.
Тепер, коли я маю загальну кількість клієнтів , я можу скласти список клієнтів із тієї ж дати, але минулого року. Тут вимірювання стає дещо складнішим.
Дозвольте мені трохи за кроком розглянути кожну частину цього показника.
Пам’ятайте, що я намагаюся змінити контекст таблиці. Ось чому я збираюся використовуватифункція.
це знайома функція, оскільки я використовую її у своїх прикладах більшу частину часу. Це змінює контекст конкретного розрахунку. З іншого боку, CALCULATETABLE змінює контекст усієї таблиці .
Оскільки я хочу змінити часові рамки, я збираюся використовуватифункція.
Використання CALCULATETABLE дозволяє додавати параметри фільтра . Використовуючи функцію DATESBETWEEN , я можу визначити часовий проміжок, який на 365 днів нижчий заідати. Коротше кажучи, це відсуває часові рамки назад до минулого року та створює інший список клієнтів звідти.
Знову ж таки, я використовую функцію COUNTROWS для обчислення кількості клієнтів після застосування додаткових фільтрів.
Тепер, коли у мене є два списки, я можу перенести ці вимірювання у функцію INTERSECT .
Функція INTERSECT віртуально переглядатиме список, на який посилаються. У цьому випадку це Індекс імен клієнтів. Він перевірить кожного з цих клієнтів і порівняє їх із другим списком річної давності.
Порівнюючи обчислені дані, він переглядає ті, які відображаються в обох списках. Наприклад, таблиця нижче показує, що 224 клієнти зробили покупки в той самий день у два різні роки в Каліфорнії.
Висновок
Сподіваємось, тепер ви можете уявити інші сценарії, де функцію INTERSECT можна використовувати для порівняння двох наборів обчислених даних.
Ви навіть можете представити порівняння у відсотках і застосувати деякі методи розгалуження мір. Ви можете переглянути клієнтів, які не повернулися, і надіслати їм маркетинговий матеріал.
Це дійсно показує, наскільки багато розуміння ви можете отримати, коли навчитесь використовувати різні функції DAX у LuckyTemplates.
Все найкраще,
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.