Як використовувати графіки ECDF у Python і LuckyTemplates

У цьому блозі буде продемонстровано, як використовувати кумулятивний графік розподілу , також відомий як графіки емпіричної кумулятивної функції розподілу або ECDF, і продемонстровано переваги використання цього варіанту графіка перед іншими типами графіків. Ви можете переглянути повне відео цього підручника внизу цього блогу .

Більшість людей віддають перевагу графікам ECDF, а не для візуалізації даних, оскільки вони безпосередньо малюють кожну точку даних, і ця функція полегшує для користувача взаємодію з графіком. Сьогодні ви дізнаєтеся, як використовувати ECDF у Python і LuckyTemplates і покращите свої презентації та звіти про розподіл даних.

Зміст

Види ділянок розподілу

Я почну з фільтрації моїх даних у певний день, суботу, і нижче ми побачимо всі ці діаграми Python, які використовуються для опису розподілу. Тут ми маємо наш графік ECDF, гістограму, графік KDE та графік Box.

Як використовувати графіки ECDF у Python і LuckyTemplates

Усі ці графіки описуватимуть, як дані розподіляються між собою. Наприклад, якщо ми опустимося вниз і подивимося на гістограму, ми побачимо, що більшість цих високих контейнерів будуть там, де розташовані наші дані.

Як використовувати графіки ECDF у Python і LuckyTemplates

Приблизно 3,50 дол. США, ми маємо найвищий бак для наших даних Tips у нашому наборі даних нижче.

Як використовувати графіки ECDF у Python і LuckyTemplates

Ми також можемо використати графік KDE, який дає нам іншу метрику при розгляді розподілу. Гістограма має справу з підрахунком, який буде в цих контейнерах, тоді як KDE має справу з щільністю.

Як використовувати графіки ECDF у Python і LuckyTemplates

За допомогою діаграми KDE ви можете визначити, де знаходиться більшість наших даних, помітивши найбільшу щільність або найбільшу опуклість на діаграмі, якщо хочете. Отже, на зображенні вище ми можемо сказати, що він розподілений десь між 2 і 4 доларами США.

Те саме стосується діаграми Box, яка показує, що розподіл становить від 2 до 4 доларів, і саме тут буде більшість наших даних. Він використовує медіану, горизонтальну лінію, що розділяє рамку, щоб дати нам уявлення про те, де найбільший розподіл.

Як використовувати графіки ECDF у Python і LuckyTemplates

А потім у нас є графік ECDF, де ліворуч від осі ординат ви можете побачити слово Пропорція , яке представляє наші процентилі. Виходячи з графіка, при 3,50 долара ми розглядаємо приблизно 50% наших даних, а при 5 доларах і нижче розподіляється 80% наших даних.

Як використовувати графіки ECDF у Python і LuckyTemplates

Код графіка гістограми

Як використовувати графіки ECDF у Python і LuckyTemplates

Зараз я покажу вам код для кожного з цих графіків, починаючи з гістограми. Усі вони мають дуже схожі та , тому ви можете швидко отримати їх за допомогою одного коду, як шаблону.

Нам спочатку потрібно імпортувати  і збережіть його як  sb,  а потім  matplotlib.pyplot  як  plt. Ми використаємо стиль фону під назвою  ggplot  і цю  змінну matplotlib  для передачі в різних стилях.

Як використовувати графіки ECDF у Python і LuckyTemplates

Наприклад, на зображенні нижче ми бачимо, що в 11-му рядку ми додаємо заголовок для гістограми та розміри тактів у наступних рядках. Позначки yticks  і  xticks  представляють  розміри x і y відповідно.

Як використовувати графіки ECDF у Python і LuckyTemplates

У 14-му рядку ми використовуємо змінну Seaborn, яка вводить цей конкретний графік, як histplot  у  прикладі вище, який представляє графік гістограми. Потім ми передаємо дані з 4-го рядка у функцію як набір даних.

Як використовувати графіки ECDF у Python і LuckyTemplates

Все, що ви вносите в значення, представляє ваш набір даних і видаляє дублікати. Тоді ми використаємо  для підказок і  відтінок  який разом  із seaborn дає змогу розділити ваші дані за категоріями. Якщо ми повернемося до нашого візуалу, то побачимо, що він має категорії, зокрема, час або курець.

Як використовувати графіки ECDF у Python і LuckyTemplates

Сюжет KDE

Для сюжету KDE все майже ідентично. Нам потрібно лише передати новий параметр під назвою shade, щоб мати такий затінений вигляд. Крім цього, відтінок, дані та інше однакові.

Як використовувати графіки ECDF у Python і LuckyTemplates

Сюжет Box здебільшого схожий на інші сюжети, за винятком кількох незначних відмінностей. Тут ми використовуємо  функцію boxplot  , де  x  — день, а  y  — підказки. Ми також не використовуємо  відтінок  для цього сюжету.

Як використовувати графіки ECDF у Python і LuckyTemplates

Отже, це та сама структура, що й графік ECDF, і єдина відмінність полягає в змінній Сіборна, де ми передаємо графік ECDF і використовуємо відтінок як день. Але ми також можемо змінити цей відтінок на іншу категорію, яку маємо, наприклад курець.

Як використовувати графіки ECDF у Python і LuckyTemplates

Якщо ми пропустимо цю категорію, ми отримаємо графік ECDF, який має дві різні лінії. У цих розподілах ми бачимо, що курці мають більше щодо нашої конкретної ширини лінії.

Як використовувати графіки ECDF у Python і LuckyTemplates

Для некурців сто відсотків цих даних менше 6 доларів, а для курців – 6 доларів. Цікаво, що наші курці можуть залишати більші чайові в певний день.

Стилізація сюжетів ECDF

Як використовувати графіки ECDF у Python і LuckyTemplates

Тепер ми можемо додатково стилізувати наші сюжети ECDF, щоб зробити їх більш презентабельними. На зображенні нижче представлені різні графіки ECDF. У першому сюжеті я збільшив лінії та використав іншу палітру кольорів.

У першому графіку я використовував різні параметри всередині функції. Як ви бачите нижче, я вказав палітру як  літо  , а ширину лінії – як  5. 

Як використовувати графіки ECDF у Python і LuckyTemplates

Я також порівняв суботу та неділю, тому є дві різні зелені лінії. Тут ми бачимо, що чайові в 3 долари знаходяться на 45-му процентилі для неділі та 70-му процентилі для четверга, що говорить нам, що люди, як правило, залишають вищі чайові в неділю.

Як використовувати графіки ECDF у Python і LuckyTemplates

Ми також можемо поміняти вісь X і Y, поміняти пропорції та наконечник всередині нашої ділянки та змінити палітру, як на зображенні нижче.

Тут ми бачимо, що чайові 2 долари знаходяться на 20-му процентилі для неділі, яка є фіолетовою лінією на графіку. Отже, дані збігаються з попереднім графіком ECDF, і лише представлення відрізняється.

Як використовувати графіки ECDF у Python і LuckyTemplates

Тепер ми маємо іншу діаграму з тим самим набором даних і зберігає оригінальне положення осі, як показано на зображенні вище. Цього разу різниця полягає в тому, що лінії перевернуті.

Стиль сюжетів ECDF

Якщо ми подивимося на код, все, що ми робимо, це передаємо параметр  complementary equals = true. Ця дія  дозволить нам сказати, що в діапазоні 2 долари і вище розподіляється 80% наших даних, замість того, щоб казати, що в діапазоні нижче 2 доларів розподілено 20% наших даних. Знову ж таки, це ті самі дані з іншим виглядом або способом представлення.

Як використовувати графіки ECDF у Python і LuckyTemplates

І в нашому четвертому й останньому графіку ECDF ми використовуємо підрахунок замість пропорції.

Як використовувати графіки ECDF у Python і LuckyTemplates

Цей підхід корисний, коли у нас більше кількох ділянок. Подивившись на стовпець підрахунку на зображенні нижче, ми можемо побачити, що в п’ятницю спостережень небагато, а це означає, що в цей день люди не залишають багато чайових.

Як використовувати графіки ECDF у Python і LuckyTemplates

Основи коду ділянок ECDF

Якщо ми подивимось на код, ви знайдете  Seaborn , який є основним для створення цього конкретного сюжету. У нас також є  matplotlib.pyplot  для стилізації, який ви можете зберегти як змінну під назвою  plt .

Як використовувати графіки ECDF у Python і LuckyTemplates

Потім ми можемо використовувати цю змінну для створення різних стилів для нашого конкретного сюжету, наприклад додавання заголовків і розмірів шрифту. Основною частиною вашого коду буде ваша функція графіка ECDF, яку ми вводимо з Seaborn.




Висновок

Це були способи використання різних графіків розподілу, включно з графіками гістограми, KDE, Box і ECDF. Ви також дізналися про чотири способи представлення графіка ECDF, використовуючи той самий набір даних. Ви можете використовувати будь-який підхід залежно від ваших уподобань.

Завжди пам’ятайте, що для створення сюжету потрібно мати необхідні бібліотеки та використовувати правильну функцію. Після цього залишиться лише змінити візуальні та стилістичні аспекти вашого сюжету, такі як розташування осі та відтінки.

Все найкраще,


Змініть формати дати за допомогою редактора Power Query

Змініть формати дати за допомогою редактора Power Query

У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.

Power Query: об’єднайте файли з кількох папок

Power Query: об’єднайте файли з кількох папок

Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.

Створення таблиці дат у LuckyTemplates

Створення таблиці дат у LuckyTemplates

Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.

Мобільні звіти LuckyTemplates. Поради та методи

Мобільні звіти LuckyTemplates. Поради та методи

У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.

Звіти про професійну аналітику послуг у LuckyTemplates

Звіти про професійну аналітику послуг у LuckyTemplates

У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.

Загальні функції SQL: огляд

Загальні функції SQL: огляд

Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.

Створення шаблону LuckyTemplates: керівництво та поради

Створення шаблону LuckyTemplates: керівництво та поради

У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.

Параметри полів і малі кратні в LuckyTemplates

Параметри полів і малі кратні в LuckyTemplates

У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.