Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tento blog ukáže, jak používat graf kumulativní distribuce , také známý jako empirická kumulativní distribuční funkce nebo grafy ECDF, a předvede výhody použití této variace grafu oproti jiným typům grafu. Na celé video tohoto tutoriálu se můžete podívat na konci tohoto blogu .

Většina lidí dává přednost grafům ECDF před vizualizací dat, protože vykreslují každý datový bod přímo, a tato funkce usnadňuje uživateli interakci s grafem. Dnes se naučíte používat ECDF v Pythonu a LuckyTemplates a vylepšíte své prezentace a sestavy o distribuci dat.

Obsah

Druhy distribučních pozemků

Začnu filtrováním dat v konkrétní den, v sobotu, a níže můžeme vidět všechny tyto grafy Pythonu používané pro popis distribucí. Máme zde náš graf ECDF, histogram, graf KDE a krabicový graf.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Všechny tyto grafy budou popisovat, jak jsou data rozložena nebo distribuována. Když se například podíváme dolů a podíváme se na histogram, uvidíme, že většina těchto vysokých košů bude tam, kde se nacházejí naše data.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Přibližně 3,50 USD máme nejvyšší přihrádku pro naše údaje o tipech v naší sadě dat níže.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Můžeme také použít graf KDE, který nám při pohledu na distribuci poskytne jinou metriku. Histogram se zabývá počtem, který bude v těchto přihrádkách, zatímco KDE se zabývá hustotou.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

S grafem KDE můžete zjistit, kde je většina našich dat, podle největší hustoty nebo největšího vyboulení v grafu, chcete-li. Takže na obrázku výše můžeme říci, že je distribuován někde mezi $2 a $4.

Totéž platí v krabicovém grafu, který ukazuje, že distribuce je 2 až 4 $, a to je místo, kde bude většina našich dat. Používá medián, vodorovnou čáru rozdělující rámeček, abychom získali představu o tom, kde je největší rozdělení.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

A pak máme graf ECDF, kde na levé straně osy y můžete vidět slovo Proporce , představující naše percentily. Na základě grafu se při ceně 3,50 USD díváme na přibližně 50 % našich dat a při hodnotě 5 USD a méně je distribuováno 80 % našich údajů.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Kód histogramu

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní vám ukážu kód pro každý z těchto grafů, počínaje histogramem. Všechny mají velmi podobné a , takže je můžete rychle vytáhnout pomocí jednoho kódu, jako šablony.

Nejprve musíme importovat  a uložte jej jako  sb,  následovaný  matplotlib.pyplot  jako  plt. Použijeme styl pozadí nazvaný  ggplot  a  proměnnou matplotlib  k předání v různých stylech.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Například na obrázku níže můžeme vidět, že na 11. řádku přidáváme nadpis pro histogram a velikosti ticků v následujících řádcích. Značky yticks  a  xticcks  představují  odpovídajícím způsobem velikosti x a y.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Ve 14. řádku používáme proměnnou Seaborn, která přináší tento konkrétní graf, jako je histplot  ve  výše uvedeném příkladu, který představuje graf histogramu. Data ze 4. řádku pak předáme do funkce jako datovou sadu.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Cokoli, co vložíte do hodnot, představuje vaši datovou sadu a odstraní duplikáty. Potom použijeme  pro tipy  a  odstín ,  který spolu  s seaborn umožňuje rozdělit data podle kategorií. Pokud se vrátíme k našemu vizuálu, můžeme, že má kategorie, včetně kategorie, čas nebo kuřák.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Plot KDE

Pro KDE plot je vše téměř totožné. Potřebujeme pouze předat nový parametr nazvaný odstín, abychom měli tento stínovaný vzhled. Kromě toho je odstín, data a zbytek stejné.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Se zápletkou Box je to většinou podobné jako u jiných zápletek až na pár drobných rozdílů. Zde používáme  funkci boxplot  , kde  x  je den a  y  jsou tipy. Pro tento graf také nepoužíváme  odstín  .

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Je to tedy stejná struktura jako graf ECDF a jediný rozdíl je v proměnné Seaborn, kde předáváme graf ECDF a jako den používáme odstín. Ale můžeme také změnit tento odstín na jinou kategorii, kterou máme, jako kuřák.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Pokud tuto kategorii projdeme, skončíme s grafem ECDF, který má dvě různé linie. V těchto distribucích můžeme vidět, že kuřáci mají více, pokud jde o naši konkrétní šířku čáry.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nekuřáci mají sto procent těchto údajů pod 6 dolary, zatímco kuřáci je mají na 6 dolarech. Je zajímavé, že naši kuřáci mohou v určitý den nechávat větší spropitné.

Stylování pozemků ECDF

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní můžeme naše ECDF grafy dále upravovat tak, aby byly reprezentativnější. Na obrázku níže jsou různé grafy ECDF. V prvním výkresu jsem čáry zvětšil a použil jinou barevnou paletu.

V prvním grafu jsem použil různé parametry uvnitř funkce. Jak můžete vidět níže, v paletce jsem prošel jako  léto  a šířku linky jako  5. 

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Také jsem porovnával sobotu a neděli, proto jsou tam dvě různé zelené čáry. Zde můžeme vidět, že spropitné 3 dolary je na 45. percentilu pro neděli a 70. percentilu pro čtvrtek, což nám říká, že lidé mají tendenci nechávat vyšší spropitné v neděli.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Můžeme také přepnout osu X a Y, vyměnit proporce a hrot uvnitř našeho výkresu a změnit paletu, stejně jako na obrázku níže.

Zde vidíme, že spropitné 2 dolary je na 20. percentilu pro neděli, což je fialová čára v grafu. Data jsou tedy stejná jako u předchozího grafu ECDF a liší se pouze prezentace.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Nyní máme další graf se stejným souborem dat a zachovává původní polohy os, jak je znázorněno na obrázku výše. Rozdíl je tentokrát v tom, že směr čar je obrácený.

ECDF styl pozemků

Pokud se podíváme na kód, vše, co děláme, je předání parametru  komplementární rovno = true. Tato akce  nám umožní říci, že v rozsahu 2 $ a výše je distribuováno 80 % našich dat, místo abychom řekli, že pod rozsahem 2 $ je distribuováno 20 % našich dat. Opět jde o stejná data s jiným vzhledem nebo způsobem jejich prezentace.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

A v našem čtvrtém a posledním ECDF grafu používáme Count místo proporce.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tento přístup je užitečný, když máme více než několik pozemků. Když se podíváme na sloupec počtu na obrázku níže, můžeme vidět, že v pátek není mnoho pozorování, což nám říká, že lidé v ten den nezanechávají mnoho tipů.

Jak používat grafy ECDF v Pythonu a LuckyTemplates

ECDF Plots Code Essentials

Když se podíváme do kódu, najdete tam  Seaborn , což je hlavní věc pro vytvoření této konkrétní zápletky. Pro stylování máme také  matplotlib.pyplot  , který si můžete uložit jako proměnnou  plt .

Jak používat grafy ECDF v Pythonu a LuckyTemplates

Tuto proměnnou pak můžeme použít k vytvoření různých stylů pro náš konkrétní výkres, jako je přidání nadpisů a velikostí písma. Hlavní částí vašeho kódu bude funkce ECDF plot, kterou přinášíme s Seaborn.




Závěr

To byly způsoby, jak můžete použít různé distribuční grafy, včetně grafů Histogram, KDE, Box a ECDF. Také jste se naučili čtyři způsoby, jak prezentovat graf ECDF pomocí stejného souboru dat. Můžete použít jakýkoli přístup v závislosti na vašich preferencích.

Vždy si nezapomeňte přinést potřebné knihovny pro vytvoření vašeho pozemku a použít správnou funkci. Poté už je to jen otázka změny vizuálních a stylistických aspektů vašeho pozemku, jako je umístění os a odstíny.

Vše nejlepší,


Tabulky proporcí a četností v Excelu

Tabulky proporcí a četností v Excelu

Chtěli jsme se ponořit do tabulek četností v Excelu a také do tabulek proporcí. Podívejte se, co to je a kdy je použít.

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Zistite, ako stiahnuť a nainštalovať DAX Studio a Tabular Editor 3 a ako ich nakonfigurovať na použitie v LuckyTemplates a v Exceli.

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

Tento blog obsahuje vizualizáciu Shape Map pre priestorovú analýzu v LuckyTemplates. Ukážem vám, ako môžete efektívne využiť túto vizualizáciu s jej funkciami a prvkami.

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

V tomto návode predstavujem jedinečný nápad týkajúci sa finančného výkazníctva, ktorý spočíva v prideľovaní výsledkov na vopred určené šablóny tabuliek v rámci LuckyTemplates.

DAX měří v LuckyTemplates pomocí Measure Branching

DAX měří v LuckyTemplates pomocí Measure Branching

Vytvářejte míry DAX v LuckyTemplates pomocí existujících mír nebo vzorců. Tomu říkám technika větvení opatření.

Najvýkonnejšie volanie funkcie v LuckyTemplates

Najvýkonnejšie volanie funkcie v LuckyTemplates

V tomto blogu preskúmajte množinu údajov LuckyTemplates, najvýkonnejšie volanie funkcií, ktoré vám prináša tisíce funkcií M a DAX na dosah ruky.

Techniky modelovania údajov na organizáciu opatrení DAX

Techniky modelovania údajov na organizáciu opatrení DAX

V dnešnom návode sa podelím o niekoľko techník modelovania údajov o tom, ako lepšie usporiadať vaše merania DAX pre efektívnejší pracovný tok.

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates je skvelý nástroj pre finančné výkazníctvo. Tu je návod, ako vytvoriť prispôsobené tabuľky pre váš finančný dashboard LuckyTemplates.

Osvedčené postupy toku jazyka Power Query

Osvedčené postupy toku jazyka Power Query

V tomto návode sa bude diskutovať o toku jazyka Power Query a o tom, ako môže pomôcť vytvoriť hladkú a efektívnu zostavu údajov.

LuckyTemplates vlastní ikony | Vizualizační technika PBI

LuckyTemplates vlastní ikony | Vizualizační technika PBI

Budu diskutovat o jedné z mých oblíbených technik kolem vlastních ikon LuckyTemplates, která používá vlastní ikony dynamickým způsobem ve vizuálech LuckyTemplates.