Як використовувати графіки ECDF у Python і LuckyTemplates

У цьому блозі буде продемонстровано, як використовувати кумулятивний графік розподілу , також відомий як графіки емпіричної кумулятивної функції розподілу або ECDF, і продемонстровано переваги використання цього варіанту графіка перед іншими типами графіків. Ви можете переглянути повне відео цього підручника внизу цього блогу .

Більшість людей віддають перевагу графікам ECDF, а не для візуалізації даних, оскільки вони безпосередньо малюють кожну точку даних, і ця функція полегшує для користувача взаємодію з графіком. Сьогодні ви дізнаєтеся, як використовувати ECDF у Python і LuckyTemplates і покращите свої презентації та звіти про розподіл даних.

Зміст

Види ділянок розподілу

Я почну з фільтрації моїх даних у певний день, суботу, і нижче ми побачимо всі ці діаграми Python, які використовуються для опису розподілу. Тут ми маємо наш графік ECDF, гістограму, графік KDE та графік Box.

Як використовувати графіки ECDF у Python і LuckyTemplates

Усі ці графіки описуватимуть, як дані розподіляються між собою. Наприклад, якщо ми опустимося вниз і подивимося на гістограму, ми побачимо, що більшість цих високих контейнерів будуть там, де розташовані наші дані.

Як використовувати графіки ECDF у Python і LuckyTemplates

Приблизно 3,50 дол. США, ми маємо найвищий бак для наших даних Tips у нашому наборі даних нижче.

Як використовувати графіки ECDF у Python і LuckyTemplates

Ми також можемо використати графік KDE, який дає нам іншу метрику при розгляді розподілу. Гістограма має справу з підрахунком, який буде в цих контейнерах, тоді як KDE має справу з щільністю.

Як використовувати графіки ECDF у Python і LuckyTemplates

За допомогою діаграми KDE ви можете визначити, де знаходиться більшість наших даних, помітивши найбільшу щільність або найбільшу опуклість на діаграмі, якщо хочете. Отже, на зображенні вище ми можемо сказати, що він розподілений десь між 2 і 4 доларами США.

Те саме стосується діаграми Box, яка показує, що розподіл становить від 2 до 4 доларів, і саме тут буде більшість наших даних. Він використовує медіану, горизонтальну лінію, що розділяє рамку, щоб дати нам уявлення про те, де найбільший розподіл.

Як використовувати графіки ECDF у Python і LuckyTemplates

А потім у нас є графік ECDF, де ліворуч від осі ординат ви можете побачити слово Пропорція , яке представляє наші процентилі. Виходячи з графіка, при 3,50 долара ми розглядаємо приблизно 50% наших даних, а при 5 доларах і нижче розподіляється 80% наших даних.

Як використовувати графіки ECDF у Python і LuckyTemplates

Код графіка гістограми

Як використовувати графіки ECDF у Python і LuckyTemplates

Зараз я покажу вам код для кожного з цих графіків, починаючи з гістограми. Усі вони мають дуже схожі та , тому ви можете швидко отримати їх за допомогою одного коду, як шаблону.

Нам спочатку потрібно імпортувати  і збережіть його як  sb,  а потім  matplotlib.pyplot  як  plt. Ми використаємо стиль фону під назвою  ggplot  і цю  змінну matplotlib  для передачі в різних стилях.

Як використовувати графіки ECDF у Python і LuckyTemplates

Наприклад, на зображенні нижче ми бачимо, що в 11-му рядку ми додаємо заголовок для гістограми та розміри тактів у наступних рядках. Позначки yticks  і  xticks  представляють  розміри x і y відповідно.

Як використовувати графіки ECDF у Python і LuckyTemplates

У 14-му рядку ми використовуємо змінну Seaborn, яка вводить цей конкретний графік, як histplot  у  прикладі вище, який представляє графік гістограми. Потім ми передаємо дані з 4-го рядка у функцію як набір даних.

Як використовувати графіки ECDF у Python і LuckyTemplates

Все, що ви вносите в значення, представляє ваш набір даних і видаляє дублікати. Тоді ми використаємо  для підказок і  відтінок  який разом  із seaborn дає змогу розділити ваші дані за категоріями. Якщо ми повернемося до нашого візуалу, то побачимо, що він має категорії, зокрема, час або курець.

Як використовувати графіки ECDF у Python і LuckyTemplates

Сюжет KDE

Для сюжету KDE все майже ідентично. Нам потрібно лише передати новий параметр під назвою shade, щоб мати такий затінений вигляд. Крім цього, відтінок, дані та інше однакові.

Як використовувати графіки ECDF у Python і LuckyTemplates

Сюжет Box здебільшого схожий на інші сюжети, за винятком кількох незначних відмінностей. Тут ми використовуємо  функцію boxplot  , де  x  — день, а  y  — підказки. Ми також не використовуємо  відтінок  для цього сюжету.

Як використовувати графіки ECDF у Python і LuckyTemplates

Отже, це та сама структура, що й графік ECDF, і єдина відмінність полягає в змінній Сіборна, де ми передаємо графік ECDF і використовуємо відтінок як день. Але ми також можемо змінити цей відтінок на іншу категорію, яку маємо, наприклад курець.

Як використовувати графіки ECDF у Python і LuckyTemplates

Якщо ми пропустимо цю категорію, ми отримаємо графік ECDF, який має дві різні лінії. У цих розподілах ми бачимо, що курці мають більше щодо нашої конкретної ширини лінії.

Як використовувати графіки ECDF у Python і LuckyTemplates

Для некурців сто відсотків цих даних менше 6 доларів, а для курців – 6 доларів. Цікаво, що наші курці можуть залишати більші чайові в певний день.

Стилізація сюжетів ECDF

Як використовувати графіки ECDF у Python і LuckyTemplates

Тепер ми можемо додатково стилізувати наші сюжети ECDF, щоб зробити їх більш презентабельними. На зображенні нижче представлені різні графіки ECDF. У першому сюжеті я збільшив лінії та використав іншу палітру кольорів.

У першому графіку я використовував різні параметри всередині функції. Як ви бачите нижче, я вказав палітру як  літо  , а ширину лінії – як  5. 

Як використовувати графіки ECDF у Python і LuckyTemplates

Я також порівняв суботу та неділю, тому є дві різні зелені лінії. Тут ми бачимо, що чайові в 3 долари знаходяться на 45-му процентилі для неділі та 70-му процентилі для четверга, що говорить нам, що люди, як правило, залишають вищі чайові в неділю.

Як використовувати графіки ECDF у Python і LuckyTemplates

Ми також можемо поміняти вісь X і Y, поміняти пропорції та наконечник всередині нашої ділянки та змінити палітру, як на зображенні нижче.

Тут ми бачимо, що чайові 2 долари знаходяться на 20-му процентилі для неділі, яка є фіолетовою лінією на графіку. Отже, дані збігаються з попереднім графіком ECDF, і лише представлення відрізняється.

Як використовувати графіки ECDF у Python і LuckyTemplates

Тепер ми маємо іншу діаграму з тим самим набором даних і зберігає оригінальне положення осі, як показано на зображенні вище. Цього разу різниця полягає в тому, що лінії перевернуті.

Стиль сюжетів ECDF

Якщо ми подивимося на код, все, що ми робимо, це передаємо параметр  complementary equals = true. Ця дія  дозволить нам сказати, що в діапазоні 2 долари і вище розподіляється 80% наших даних, замість того, щоб казати, що в діапазоні нижче 2 доларів розподілено 20% наших даних. Знову ж таки, це ті самі дані з іншим виглядом або способом представлення.

Як використовувати графіки ECDF у Python і LuckyTemplates

І в нашому четвертому й останньому графіку ECDF ми використовуємо підрахунок замість пропорції.

Як використовувати графіки ECDF у Python і LuckyTemplates

Цей підхід корисний, коли у нас більше кількох ділянок. Подивившись на стовпець підрахунку на зображенні нижче, ми можемо побачити, що в п’ятницю спостережень небагато, а це означає, що в цей день люди не залишають багато чайових.

Як використовувати графіки ECDF у Python і LuckyTemplates

Основи коду ділянок ECDF

Якщо ми подивимось на код, ви знайдете  Seaborn , який є основним для створення цього конкретного сюжету. У нас також є  matplotlib.pyplot  для стилізації, який ви можете зберегти як змінну під назвою  plt .

Як використовувати графіки ECDF у Python і LuckyTemplates

Потім ми можемо використовувати цю змінну для створення різних стилів для нашого конкретного сюжету, наприклад додавання заголовків і розмірів шрифту. Основною частиною вашого коду буде ваша функція графіка ECDF, яку ми вводимо з Seaborn.




Висновок

Це були способи використання різних графіків розподілу, включно з графіками гістограми, KDE, Box і ECDF. Ви також дізналися про чотири способи представлення графіка ECDF, використовуючи той самий набір даних. Ви можете використовувати будь-який підхід залежно від ваших уподобань.

Завжди пам’ятайте, що для створення сюжету потрібно мати необхідні бібліотеки та використовувати правильну функцію. Після цього залишиться лише змінити візуальні та стилістичні аспекти вашого сюжету, такі як розташування осі та відтінки.

Все найкраще,


Відкрийте для себе унікальні ідеї за допомогою функції TOPN LuckyTemplates

Відкрийте для себе унікальні ідеї за допомогою функції TOPN LuckyTemplates

У цьому блозі представлено функцію LuckyTemplates TOPN DAX, яка дає вам змогу отримувати унікальну статистику з ваших даних, допомагаючи вам приймати кращі маркетингові рішення.

Моделювання даних у LuckyTemplates за допомогою допоміжних таблиць

Моделювання даних у LuckyTemplates за допомогою допоміжних таблиць

Дізнайтеся про деякі фантастичні аналітичні прийоми, які ми можемо використовувати для моделювання даних у LuckyTemplates за допомогою таблиць підтримки DAX.

Розширений DAX для LuckyTemplates: впровадження логіки ранжування в унікальній статистиці

Розширений DAX для LuckyTemplates: впровадження логіки ранжування в унікальній статистиці

Тут ми зануримося в LuckyTemplates Advanced DAX і запровадимо логіку ранжирування, щоб отримати дуже унікальну інформацію. У цьому прикладі я також демонструю розгалуження міри.

Функція параметра LuckyTemplates «Що, якщо».

Функція параметра LuckyTemplates «Що, якщо».

У цьому блозі представлено нову функцію в LuckyTemplates — параметр аналізу «Що, якщо». Ви побачите, як це робить усе швидким і легким для аналізу сценарію.

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Дізнайтеся, як визначити, чи добре зростає ваш дохід, перевіривши, чи зросла ваша маржа за допомогою розгалуження міри LuckyTemplates.

Параметри LuckyTemplates через редактор запитів

Параметри LuckyTemplates через редактор запитів

Дізнайтеся та зрозумійте, як можна створювати та використовувати параметри LuckyTemplates, які є потужною функцією редактора запитів.

Кругла гістограма – візуалізація для вашої інформаційної панелі

Кругла гістограма – візуалізація для вашої інформаційної панелі

У цьому підручнику буде обговорено створення круглої гістограми за допомогою Charticulator. Ви дізнаєтеся, як створити їх для звіту LuckyTemplates.

Функції та формули PowerApps | Вступ

Функції та формули PowerApps | Вступ

Дізнайтеся, як використовувати функції та формули PowerApps, щоб покращити функціональність і змінити поведінку в нашій програмі Canvas Power Apps.

Труба в R: підключення функцій за допомогою Dplyr

Труба в R: підключення функцій за допомогою Dplyr

У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.