Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
Якщо ви продаєте продукти в багатьох різних магазинах або в багатьох різних регіонах, то вам варто зрозуміти, чи є якась спільність у ваших найпопулярніших чи найнижчих продуктах. Ви хотіли б знайти свої найкращі продукти в регіоні. Ви можете переглянути повне відео цього підручника внизу цього блогу.
У цьому прикладі я поясню, як ви можете знайти свої 2 найкращі продукти за допомогою обчислень DAX у LuckyTemplates .
Я бачу, що це також дуже цінно, якщо ви шукаєте викиди у своїх даних з часом. Можливо, ви виявите, що деякі продукти продаються дуже добре в певних регіонах, ніж в інших, і може бути можливість скористатися цим за допомогою акцій, дорожчих продажів тощо.
Є так багато можливостей додати цінність за допомогою цих типів статистики.
У цьому підручнику я розглядаю формулу DAX, необхідну для досягнення цього конкретного розуміння, зосереджуючись на тому, як використовувати її в операторі.
Зміст
Навіщо ізолювати ваші найкращі продукти
Легко розрахувати загальний обсяг продажів кожного продукту в регіоні. Однак це може призвести до дуже насиченого діаграми, коли ми хочемо зосередитися лише на наших найкращих продуктах.
У цій таблиці ми бачимо, що ми продаємо багато продуктів, і цей список може бути дуже довгим. Досить важко побачити будь-які тенденції або побачити розрахунок чи розуміння, яких ми прагнемо.
У цьому прикладі ми хочемо побачити наші 2 найпопулярніші продукти, тому нам потрібно якось зробити так, щоб ті, які не входять у перші два, відображалися порожніми. Таким чином вони не відображатимуться в нашій візуалізації.
Техніка, яку ми використовуватимемо в цьому підручнику, дуже корисна для низки різних сценаріїв, а не лише для продажу продуктів. Це можуть бути найкращі клієнти, найбільш продавані регіони, найкращі продавці тощо. Ми навіть можемо виокремити норми прибутку або витрати.
Чудова особливість цього шаблону, який ми збираємося використовувати, полягає в тому, що ми можемо змінити контекст обчислення, і він динамічно коригуватиме таблицю.
У цій візуалізації дуже легко побачити всі місця, де ми продаємо, відсортувати їх за назвою продукту, і ми зможемо побачити наші найбільш продавані продукти тощо. Ми можемо використати всю інформацію тут для маркетингових акцій, реклами нових угод, для наприклад, і так далі.
Як знайти найкращі продукти
Я збираюся показати вам формулу, яка дозволяє нам знаходити наші найкращі продукти.
Тут ми маємо загальний обсяг продажів за кодом штату, а інша таблиця показує продажі для кожного продукту для кожного місця. У цьому прикладі ми хочемо показати лише продажі 2 найпопулярніших продуктів у кожному регіоні , а потім очистити все інше.
Для цього ми створюємо нашу формулу, яку я називаю 2 найкращі продукти на регіон . Ми використовуємо тут (змінні) і розміщуємо RankingContext у наступному рядку з нашими продуктами , тому що насправді це те, що ми збираємося ранжувати. У наступному рядку ми переходимо до RETURN, а потім використовуємо CALCULATE Total Sales.
Потім ми переходимо до TOPN зі значенням N як 2 , оскільки ми шукаємо наші 2 найкращі продукти, у цьому прикладі, і тому ми також маємо ВСІ продукти . Після цього ми оцінюємо його за загальним обсягом продажів .
Нарешті, через цей оператор ALL у нашій функції TOPN ми повинні повернути контекст назви продукту. І щоб досягти цього, ми розмістили цей RankingContext .
Коли це буде зроблено, ми натискаємо «ОК» і переконуємося, що його відформатовано правильно.
Якщо ми перенесемо це в нашу таблицю, то побачимо, що для всіх продуктів, які не входять до двох найвищих, є порожні значення . Усі інші цінності стосуються наших двох найкращих продуктів у будь-якому конкретному регіоні.
І це, звичайно, пов’язано з моделлю даних, як і більшість обчислень, які ми виконуємо. Ми також можемо покращити цю візуалізацію, додавши панель даних , додавши трохи кольору нашій таблиці.
Висновок
Як я вже згадував, ви можете багаторазово використовувати цей шаблон формули з будь-яким виміром, який ви можете придумати, який є у вашій моделі даних. Ви можете скористатися цією технікою та внести чудову інформацію у свої звіти.
Цю техніку дуже добре вивчити. Розуміння того, як TOPN внутрішньо обчислює рейтинг на льоту, а потім створює контекст усередині CALCULATE, який ізолює найпопулярніші (в даному випадку) продукти для продажу, дуже корисно для вас, коли ви працюєте з LuckyTemplates.
Не менш важливою є функція VALUES. Вам потрібно, щоб повернути контекст назви продукту, щоб цей обчислення працював належним чином.
Як завжди, DAX — чудова аналітична мова , яку варто добре вивчити, якщо ви починаєте працювати з LuckyTemplates. Дійсно, якщо ви не вчитеся, ніж ви втрачаєте 90% того, чого можете досягти в LuckyTemplates.
Насолоджуйтеся вивченням цієї техніки та обов’язково спробуйте застосувати її у вашому власному середовищі, щоб закріпити концепції у своїй свідомості. Перегляньте повне відео нижче.
здоров'я!
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.