Змініть формати дати за допомогою редактора Power Query
У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.
У цьому блозі буде продемонстровано, як використовувати кумулятивний графік розподілу , також відомий як графіки емпіричної кумулятивної функції розподілу або ECDF, і продемонстровано переваги використання цього варіанту графіка перед іншими типами графіків. Ви можете переглянути повне відео цього підручника внизу цього блогу .
Більшість людей віддають перевагу графікам ECDF, а не для візуалізації даних, оскільки вони безпосередньо малюють кожну точку даних, і ця функція полегшує для користувача взаємодію з графіком. Сьогодні ви дізнаєтеся, як використовувати ECDF у Python і LuckyTemplates і покращите свої презентації та звіти про розподіл даних.
Зміст
Види ділянок розподілу
Я почну з фільтрації моїх даних у певний день, суботу, і нижче ми побачимо всі ці діаграми Python, які використовуються для опису розподілу. Тут ми маємо наш графік ECDF, гістограму, графік KDE та графік Box.
Усі ці графіки описуватимуть, як дані розподіляються між собою. Наприклад, якщо ми опустимося вниз і подивимося на гістограму, ми побачимо, що більшість цих високих контейнерів будуть там, де розташовані наші дані.
Приблизно 3,50 дол. США, ми маємо найвищий бак для наших даних Tips у нашому наборі даних нижче.
Ми також можемо використати графік KDE, який дає нам іншу метрику при розгляді розподілу. Гістограма має справу з підрахунком, який буде в цих контейнерах, тоді як KDE має справу з щільністю.
За допомогою діаграми KDE ви можете визначити, де знаходиться більшість наших даних, помітивши найбільшу щільність або найбільшу опуклість на діаграмі, якщо хочете. Отже, на зображенні вище ми можемо сказати, що він розподілений десь між 2 і 4 доларами США.
Те саме стосується діаграми Box, яка показує, що розподіл становить від 2 до 4 доларів, і саме тут буде більшість наших даних. Він використовує медіану, горизонтальну лінію, що розділяє рамку, щоб дати нам уявлення про те, де найбільший розподіл.
А потім у нас є графік ECDF, де ліворуч від осі ординат ви можете побачити слово Пропорція , яке представляє наші процентилі. Виходячи з графіка, при 3,50 долара ми розглядаємо приблизно 50% наших даних, а при 5 доларах і нижче розподіляється 80% наших даних.
Код графіка гістограми
Зараз я покажу вам код для кожного з цих графіків, починаючи з гістограми. Усі вони мають дуже схожі та , тому ви можете швидко отримати їх за допомогою одного коду, як шаблону.
Нам спочатку потрібно імпортувати і збережіть його як sb, а потім matplotlib.pyplot як plt. Ми використаємо стиль фону під назвою ggplot і цю змінну matplotlib для передачі в різних стилях.
Наприклад, на зображенні нижче ми бачимо, що в 11-му рядку ми додаємо заголовок для гістограми та розміри тактів у наступних рядках. Позначки yticks і xticks представляють розміри x і y відповідно.
У 14-му рядку ми використовуємо змінну Seaborn, яка вводить цей конкретний графік, як histplot у прикладі вище, який представляє графік гістограми. Потім ми передаємо дані з 4-го рядка у функцію як набір даних.
Все, що ви вносите в значення, представляє ваш набір даних і видаляє дублікати. Тоді ми використаємо x для підказок і відтінок , який разом із seaborn дає змогу розділити ваші дані за категоріями. Якщо ми повернемося до нашого візуалу, то побачимо, що він має категорії, зокрема, час або курець.
Сюжет KDE
Для сюжету KDE все майже ідентично. Нам потрібно лише передати новий параметр під назвою shade, щоб мати такий затінений вигляд. Крім цього, відтінок, дані та інше однакові.
Сюжет Box здебільшого схожий на інші сюжети, за винятком кількох незначних відмінностей. Тут ми використовуємо функцію boxplot , де x — день, а y — підказки. Ми також не використовуємо відтінок для цього сюжету.
Отже, це та сама структура, що й графік ECDF, і єдина відмінність полягає в змінній Сіборна, де ми передаємо графік ECDF і використовуємо відтінок як день. Але ми також можемо змінити цей відтінок на іншу категорію, яку маємо, наприклад курець.
Якщо ми пропустимо цю категорію, ми отримаємо графік ECDF, який має дві різні лінії. У цих розподілах ми бачимо, що курці мають більше щодо нашої конкретної ширини лінії.
Для некурців сто відсотків цих даних менше 6 доларів, а для курців – 6 доларів. Цікаво, що наші курці можуть залишати більші чайові в певний день.
Стилізація сюжетів ECDF
Тепер ми можемо додатково стилізувати наші сюжети ECDF, щоб зробити їх більш презентабельними. На зображенні нижче представлені різні графіки ECDF. У першому сюжеті я збільшив лінії та використав іншу палітру кольорів.
У першому графіку я використовував різні параметри всередині функції. Як ви бачите нижче, я вказав палітру як літо , а ширину лінії – як 5.
Я також порівняв суботу та неділю, тому є дві різні зелені лінії. Тут ми бачимо, що чайові в 3 долари знаходяться на 45-му процентилі для неділі та 70-му процентилі для четверга, що говорить нам, що люди, як правило, залишають вищі чайові в неділю.
Ми також можемо поміняти вісь X і Y, поміняти пропорції та наконечник всередині нашої ділянки та змінити палітру, як на зображенні нижче.
Тут ми бачимо, що чайові 2 долари знаходяться на 20-му процентилі для неділі, яка є фіолетовою лінією на графіку. Отже, дані збігаються з попереднім графіком ECDF, і лише представлення відрізняється.
Тепер ми маємо іншу діаграму з тим самим набором даних і зберігає оригінальне положення осі, як показано на зображенні вище. Цього разу різниця полягає в тому, що лінії перевернуті.
Стиль сюжетів ECDF
Якщо ми подивимося на код, все, що ми робимо, це передаємо параметр complementary equals = true. Ця дія дозволить нам сказати, що в діапазоні 2 долари і вище розподіляється 80% наших даних, замість того, щоб казати, що в діапазоні нижче 2 доларів розподілено 20% наших даних. Знову ж таки, це ті самі дані з іншим виглядом або способом представлення.
І в нашому четвертому й останньому графіку ECDF ми використовуємо підрахунок замість пропорції.
Цей підхід корисний, коли у нас більше кількох ділянок. Подивившись на стовпець підрахунку на зображенні нижче, ми можемо побачити, що в п’ятницю спостережень небагато, а це означає, що в цей день люди не залишають багато чайових.
Основи коду ділянок ECDF
Якщо ми подивимось на код, ви знайдете Seaborn , який є основним для створення цього конкретного сюжету. У нас також є matplotlib.pyplot для стилізації, який ви можете зберегти як змінну під назвою plt .
Потім ми можемо використовувати цю змінну для створення різних стилів для нашого конкретного сюжету, наприклад додавання заголовків і розмірів шрифту. Основною частиною вашого коду буде ваша функція графіка ECDF, яку ми вводимо з Seaborn.
Висновок
Це були способи використання різних графіків розподілу, включно з графіками гістограми, KDE, Box і ECDF. Ви також дізналися про чотири способи представлення графіка ECDF, використовуючи той самий набір даних. Ви можете використовувати будь-який підхід залежно від ваших уподобань.
Завжди пам’ятайте, що для створення сюжету потрібно мати необхідні бібліотеки та використовувати правильну функцію. Після цього залишиться лише змінити візуальні та стилістичні аспекти вашого сюжету, такі як розташування осі та відтінки.
Все найкраще,
У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.
Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.
Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.
Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.
У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.
У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.
Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.
Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.
У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.
У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.