Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
Цей підручник продемонструє показники VertiPaq Analyzer уі як це допомагає оптимізувати ваші коди DAX. Кожен показник буде обговорено, щоб ви зрозуміли, як кожен з них може допомогти покращити продуктивність ваших кодів.
Це показники аналізатора VertiPaq.
Зміст
Вкладка «Таблиці» аналізатора VertiPaq
Перший показник – це вкладка «Таблиці» або «Загальний вигляд таблиці». На цій вкладці ви можете побачити стовпець Кардинальність . Це стосується кількості унікальних значень у таблиці. Це найважливіший стовпець у вашій моделі даних.
Якщо ви подивитеся на таблицю DimCustomer , ви побачите 20 унікальних значень. Це означає, що є 20 окремих клієнтів із значеннями, що не повторюються.
Це зразок запиту DAX.
Він використовує функція для підрахунку рядків різних таблиць. Кількість рядків відповідає потужності, отриманій у таблиці.
Стовпці для розміру даних
Наступний стовпець після потужності називається таблицею . Він показує, скільки пам’яті займає таблиця. Чим більший розмір даних, тим більше уваги їм потрібно. Стовпець «Розмір стовпця» — це загальна сума стовпців «Дані» , «Словник » і «Розмір ієрархії» .
Стовпці « Дані » , «Словник » і «Розмір ієрархії» показують загальний розмір стиснених даних, стовпців, закодованих у словнику, і автоматично згенерованих стовпців ієрархії відповідно.
Далі йде стовпець Кодування , у якому показано тип кодування, що використовується. Значення та хеш -кодування зустрічаються в усіх таблицях, тому результат показує «Багато».
Порушення посилальної цілісності також буде показано в стовпці Порушення RI . Порушення виникають, коли значення існує в таблиці фактів , але не існує в таблиці вимірювань .
У стовпці «Розмір ієрархії користувача» показано розмір ієрархій, визначених користувачем. У стовпці «Розмір зв’язку» також відображатиметься розмір зв’язку на основі багатьох сторін налаштування «один до багатьох» .
Далі у вас є стовпці %DB . У цьому стовпці показано, скільки таблиці займає у відсотках від загального розміру всіх таблиць.
У прикладі ви бачите, що таблиця DimCustomer займає майже 66% від загального розміру таблиці. Відсоток вашої бази даних у таблиці фактів має бути більшим, ніж у таблицях розмірів .
Це відсотки:
Оскільки в цьому прикладі небагато даних, стовпці «Сегменти» та «Поділи» використовувати не можна; це буде застосовно лише для великих таблиць.
Останній стовпець на вкладці називається Стовпці . Він просто показує кількість стовпців у таблиці. Стовпці "Тип даних" і " Таблиця в %" не застосовуються до перегляду загальної таблиці.
Всередині таблиці FactSales
Це таблиця даних про загальні факти продажів.
Кожен стовпець таблиці містить свою інформацію. Загальний рівень таблиці, наприклад, має різні стовпці, такі як Кардинальність , Розмір стовпця тощо.
У прикладі ви помітите, що потужність SalesKey дорівнює потужності таблиці. Це тому, що SalesKey не має повторюваних значень і є унікальним значенням.
Стовпець «Розмір стовпця» не менш важливий, ніж рівень таблиці. Він показує суму стовпців «Дані» , «Словник » і «Розмір ієрархії» .
Ви також можете побачити, що використаний метод кодування — це хеш-кодування , який створює окремий список значень.
Якщо ви подивіться на рядок «Кількість» , ви побачите, що в ньому використовується метод хеш-кодування , навіть якщо тип даних — ціле число.
Причиною цього є те, що служби аналізу SQL Server налаштували метод визначення найкращого методу стиснення.
Стовпець % таблиці показує стовпець у відсотках від загального розміру таблиці. У прикладі SalesKey має найбільший розмір таблиці, що має сенс, оскільки він має найвищу кількість елементів і розмір стовпця.
Подібним чином стовпець % бази даних показує відсоток таблиці або стовпця в таблиці у відсотках від усієї бази даних.
Ви побачите, що таблиця FactSales становить 46,8% від загального розміру моделі даних. Стовпець SalesKey у таблиці FactSales займає 15% від загального розміру бази даних.
Оскільки цей приклад містить лише невелику кількість даних, у вас буде лише один сегмент і розділ. Те саме стосується стовпця Стовпці . Кількість стовпців у вікні перегляду стовпців завжди дорівнюватиме одному.
Вкладка «Стовпці» аналізатора VertiPaq
Вкладка Стовпці має зручніший формат для перегляду даних. Він надає більш детальну інформацію, ніж вкладка Таблиці .
Ви помітите, що він має подібні стовпці, як і вкладка Таблиці .
Вкладка «Стовпці» дозволяє сортувати будь-які стовпці. У цьому прикладі він відсортований за потужністю, яка позначена маленьким трикутником. Стовпець «Рядки» показує кількість рядків у таблиці.
Ви бачите, що FactSales-SalesKey має 15 000 рядків і потужність. Усі первинні ключі мають рядки, які дорівнюють їхній відповідній потужності.
Якщо кількість рядків не дорівнює кількості потужностей, таблиця матиме повторювані значення.
Якщо ви подивіться на FactSales-CustomerKey , ви помітите, що він має потужність 801 і розмір стовпця майже 1,1 мільйона.
Це означає, що його потрібно оптимізувати та стиснути. Щоб оптимізувати його, перейдіть до файлу LuckyTemplates і відкрийте таблицю DimCustomer .
Стовпець CustomerKey є рядковим типом даних. Ви бачите, що значення починаються з C, а потім йде число. Натисніть «Замінити значення» , щоб змінити значення всередині стовпця.
Знайдіть значення C і змініть його на порожнє. Далі змініть тип даних на Ціле число.
Зробіть те саме для стовпця CustomerKey у таблиці фактів . Натисніть «Застосувати» та поверніться до DAX Studio. Далі натисніть «Переглянути показники», щоб перезавантажити DAX і відсортувати його за кількістю елементів.
Розмір стовпця тепер зменшено до 46 372 з 1,1 мільйона. Якщо ви подивіться на таблицю, ви побачите, що розмір стовпця також зменшився до 46 372.
Якщо ви зробите те ж саме з SalesPersonKey, який має розмір стовпця майже 1,1 мільйона, ви можете зменшити його до 5540.
Зміна значень типу рядка або тексту на цілочисельний тип може оптимізувати ваш DAX, щоб підвищити його продуктивність.
Висновок
Оптимізація DAX починається в DAX Studio за допомогою VertiPaq Analyzer. У показниках аналізатора ви побачите, як працюють таблиці та стовпці, і визначите, яку сутність потрібно оптимізувати та покращити.
Якщо ви хочете дізнатися, яка частина коду сповільнює продуктивність вашого коду, скористайтеся VertiPaq Analyzer. Це безумовно покращить ваш DAX.
Ніклі
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.