Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tento blog ukáže, jak používat graf kumulativní distribuce , také známý jako empirická kumulativní distribuční funkce nebo grafy ECDF, a předvede výhody použití této variace grafu oproti jiným typům grafu. Na celé video tohoto tutoriálu se můžete podívat na konci tohoto blogu .

Většina lidí dává přednost grafům ECDF před vizualizací dat, protože vykreslují každý datový bod přímo, a tato funkce usnadňuje uživateli interakci s grafem. Dnes se naučíte používat ECDF v Pythonu a LuckyTemplates a vylepšíte své prezentace a sestavy o distribuci dat.

Obsah

Druhy distribučních pozemků

Začnu filtrováním dat v konkrétní den, v sobotu, a níže můžeme vidět všechny tyto grafy Pythonu používané pro popis distribucí. Máme zde náš graf ECDF, histogram, graf KDE a krabicový graf.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Všechny tyto grafy budou popisovat, jak jsou data rozložena nebo distribuována. Když se například podíváme dolů a podíváme se na histogram, uvidíme, že většina těchto vysokých košů bude tam, kde se nacházejí naše data.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Přibližně 3,50 USD máme nejvyšší přihrádku pro naše údaje o tipech v naší sadě dat níže.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Můžeme také použít graf KDE, který nám při pohledu na distribuci poskytne jinou metriku. Histogram se zabývá počtem, který bude v těchto přihrádkách, zatímco KDE se zabývá hustotou.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

S grafem KDE můžete zjistit, kde je většina našich dat, podle největší hustoty nebo největšího vyboulení v grafu, chcete-li. Takže na obrázku výše můžeme říci, že je distribuován někde mezi $2 a $4.

Totéž platí v krabicovém grafu, který ukazuje, že distribuce je 2 až 4 $, a to je místo, kde bude většina našich dat. Používá medián, vodorovnou čáru rozdělující rámeček, abychom získali představu o tom, kde je největší rozdělení.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

A pak máme graf ECDF, kde na levé straně osy y můžete vidět slovo Proporce , představující naše percentily. Na základě grafu se při ceně 3,50 USD díváme na přibližně 50 % našich dat a při hodnotě 5 USD a méně je distribuováno 80 % našich údajů.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Kód histogramu

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní vám ukážu kód pro každý z těchto grafů, počínaje histogramem. Všechny mají velmi podobné a , takže je můžete rychle vytáhnout pomocí jednoho kódu, jako šablony.

Nejprve musíme importovat  a uložte jej jako  sb,  následovaný  matplotlib.pyplot  jako  plt. Použijeme styl pozadí nazvaný  ggplot  a  proměnnou matplotlib  k předání v různých stylech.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Například na obrázku níže můžeme vidět, že na 11. řádku přidáváme nadpis pro histogram a velikosti ticků v následujících řádcích. Značky yticks  a  xticcks  představují  odpovídajícím způsobem velikosti x a y.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Ve 14. řádku používáme proměnnou Seaborn, která přináší tento konkrétní graf, jako je histplot  ve  výše uvedeném příkladu, který představuje graf histogramu. Data ze 4. řádku pak předáme do funkce jako datovou sadu.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Cokoli, co vložíte do hodnot, představuje vaši datovou sadu a odstraní duplikáty. Potom použijeme  pro tipy  a  odstín ,  který spolu  s seaborn umožňuje rozdělit data podle kategorií. Pokud se vrátíme k našemu vizuálu, můžeme, že má kategorie, včetně kategorie, čas nebo kuřák.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Plot KDE

Pro KDE plot je vše téměř totožné. Potřebujeme pouze předat nový parametr nazvaný odstín, abychom měli tento stínovaný vzhled. Kromě toho je odstín, data a zbytek stejné.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Se zápletkou Box je to většinou podobné jako u jiných zápletek až na pár drobných rozdílů. Zde používáme  funkci boxplot  , kde  x  je den a  y  jsou tipy. Pro tento graf také nepoužíváme  odstín  .

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Je to tedy stejná struktura jako graf ECDF a jediný rozdíl je v proměnné Seaborn, kde předáváme graf ECDF a jako den používáme odstín. Ale můžeme také změnit tento odstín na jinou kategorii, kterou máme, jako kuřák.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Pokud tuto kategorii projdeme, skončíme s grafem ECDF, který má dvě různé linie. V těchto distribucích můžeme vidět, že kuřáci mají více, pokud jde o naši konkrétní šířku čáry.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nekuřáci mají sto procent těchto údajů pod 6 dolary, zatímco kuřáci je mají na 6 dolarech. Je zajímavé, že naši kuřáci mohou v určitý den nechávat větší spropitné.

Stylování pozemků ECDF

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní můžeme naše ECDF grafy dále upravovat tak, aby byly reprezentativnější. Na obrázku níže jsou různé grafy ECDF. V prvním výkresu jsem čáry zvětšil a použil jinou barevnou paletu.

V prvním grafu jsem použil různé parametry uvnitř funkce. Jak můžete vidět níže, v paletce jsem prošel jako  léto  a šířku linky jako  5. 

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Také jsem porovnával sobotu a neděli, proto jsou tam dvě různé zelené čáry. Zde můžeme vidět, že spropitné 3 dolary je na 45. percentilu pro neděli a 70. percentilu pro čtvrtek, což nám říká, že lidé mají tendenci nechávat vyšší spropitné v neděli.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Můžeme také přepnout osu X a Y, vyměnit proporce a hrot uvnitř našeho výkresu a změnit paletu, stejně jako na obrázku níže.

Zde vidíme, že spropitné 2 dolary je na 20. percentilu pro neděli, což je fialová čára v grafu. Data jsou tedy stejná jako u předchozího grafu ECDF a liší se pouze prezentace.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní máme další graf se stejným souborem dat a zachovává původní polohy os, jak je znázorněno na obrázku výše. Rozdíl je tentokrát v tom, že směr čar je obrácený.

ECDF styl pozemků

Pokud se podíváme na kód, vše, co děláme, je předání parametru  komplementární rovno = true. Tato akce  nám umožní říci, že v rozsahu 2 $ a výše je distribuováno 80 % našich dat, místo abychom řekli, že pod rozsahem 2 $ je distribuováno 20 % našich dat. Opět jde o stejná data s jiným vzhledem nebo způsobem jejich prezentace.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

A v našem čtvrtém a posledním ECDF grafu používáme Count místo proporce.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tento přístup je užitečný, když máme více než několik pozemků. Když se podíváme na sloupec počtu na obrázku níže, můžeme vidět, že v pátek není mnoho pozorování, což nám říká, že lidé v ten den nezanechávají mnoho tipů.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

ECDF Plots Code Essentials

Když se podíváme do kódu, najdete tam  Seaborn , což je hlavní věc pro vytvoření této konkrétní zápletky. Pro stylování máme také  matplotlib.pyplot  , který si můžete uložit jako proměnnou  plt .

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tuto proměnnou pak můžeme použít k vytvoření různých stylů pro náš konkrétní výkres, jako je přidání nadpisů a velikostí písma. Hlavní částí vašeho kódu bude funkce ECDF plot, kterou přinášíme s Seaborn.




Závěr

To byly způsoby, jak můžete použít různé distribuční grafy, včetně grafů Histogram, KDE, Box a ECDF. Také jste se naučili čtyři způsoby, jak prezentovat graf ECDF pomocí stejného souboru dat. Můžete použít jakýkoli přístup v závislosti na vašich preferencích.

Vždy si nezapomeňte přinést potřebné knihovny pro vytvoření vašeho pozemku a použít správnou funkci. Poté už je to jen otázka změny vizuálních a stylistických aspektů vašeho pozemku, jako je umístění os a odstíny.

Vše nejlepší,


Vytvoření tabulky data v LuckyTemplates

Vytvoření tabulky data v LuckyTemplates

Zjistěte, proč je důležité mít vyhrazenou tabulku s daty v LuckyTemplates, a naučte se nejrychlejší a nejefektivnější způsob, jak toho dosáhnout.

LuckyTemplates Mobile Reporting Tipy a techniky

LuckyTemplates Mobile Reporting Tipy a techniky

Tento stručný návod zdůrazňuje funkci mobilního hlášení LuckyTemplates. Ukážu vám, jak můžete efektivně vytvářet přehledy pro mobily.

Profesionální servisní analytické zprávy v LuckyTemplates

Profesionální servisní analytické zprávy v LuckyTemplates

V této ukázce LuckyTemplates si projdeme sestavy ukazující profesionální analýzy služeb od firmy, která má více smluv a zákaznických vztahů.

Aktualizácie Microsoft Power Platform | Microsoft Ignite 2021

Aktualizácie Microsoft Power Platform | Microsoft Ignite 2021

Pozrite si kľúčové aktualizácie pre Power Apps a Power Automate a ich výhody a dôsledky pre platformu Microsoft Power Platform.

Bežné funkcie SQL: Prehľad

Bežné funkcie SQL: Prehľad

Objavte niektoré bežné funkcie SQL, ktoré môžeme použiť, ako napríklad reťazec, dátum a niektoré pokročilé funkcie na spracovanie alebo manipuláciu s údajmi.

Vytvoření šablony LuckyTemplates: Průvodce a tipy

Vytvoření šablony LuckyTemplates: Průvodce a tipy

V tomto tutoriálu se naučíte, jak vytvořit dokonalou šablonu LuckyTemplates, která je nakonfigurována podle vašich potřeb a preferencí.

Parametry pole a malé násobky v LuckyTemplates

Parametry pole a malé násobky v LuckyTemplates

V tomto blogu si ukážeme, jak vrstvit parametry pole s malými násobky, abychom vytvořili neuvěřitelně užitečné přehledy a vizuály.

LuckyTemplates Rank a vlastní seskupení

LuckyTemplates Rank a vlastní seskupení

V tomto blogu se dozvíte, jak používat funkce hodnocení LuckyTemplates a vlastní seskupování k segmentaci ukázkových dat a jejich seřazení podle kritérií.

Zobrazení kumulativního součtu pouze do určitého data v LuckyTemplates

Zobrazení kumulativního součtu pouze do určitého data v LuckyTemplates

V tomto tutoriálu se budu zabývat konkrétní technikou, jak zobrazit kumulativní součet pouze do určitého data ve vašich vizuálech v LuckyTemplates.

Bullet Charts: Pokročilé vlastní vizuální prvky pro LuckyTemplates

Bullet Charts: Pokročilé vlastní vizuální prvky pro LuckyTemplates

Naučte se vytvářet a přizpůsobovat Bullet grafy v LuckyTemplates, které se používají hlavně pro měření výkonu oproti cílovým nebo předchozím rokům.