Vytvoření tabulky data v LuckyTemplates
Zjistěte, proč je důležité mít vyhrazenou tabulku s daty v LuckyTemplates, a naučte se nejrychlejší a nejefektivnější způsob, jak toho dosáhnout.
Tento blog ukáže, jak používat graf kumulativní distribuce , také známý jako empirická kumulativní distribuční funkce nebo grafy ECDF, a předvede výhody použití této variace grafu oproti jiným typům grafu. Na celé video tohoto tutoriálu se můžete podívat na konci tohoto blogu .
Většina lidí dává přednost grafům ECDF před vizualizací dat, protože vykreslují každý datový bod přímo, a tato funkce usnadňuje uživateli interakci s grafem. Dnes se naučíte používat ECDF v Pythonu a LuckyTemplates a vylepšíte své prezentace a sestavy o distribuci dat.
Obsah
Druhy distribučních pozemků
Začnu filtrováním dat v konkrétní den, v sobotu, a níže můžeme vidět všechny tyto grafy Pythonu používané pro popis distribucí. Máme zde náš graf ECDF, histogram, graf KDE a krabicový graf.
Všechny tyto grafy budou popisovat, jak jsou data rozložena nebo distribuována. Když se například podíváme dolů a podíváme se na histogram, uvidíme, že většina těchto vysokých košů bude tam, kde se nacházejí naše data.
Přibližně 3,50 USD máme nejvyšší přihrádku pro naše údaje o tipech v naší sadě dat níže.
Můžeme také použít graf KDE, který nám při pohledu na distribuci poskytne jinou metriku. Histogram se zabývá počtem, který bude v těchto přihrádkách, zatímco KDE se zabývá hustotou.
S grafem KDE můžete zjistit, kde je většina našich dat, podle největší hustoty nebo největšího vyboulení v grafu, chcete-li. Takže na obrázku výše můžeme říci, že je distribuován někde mezi $2 a $4.
Totéž platí v krabicovém grafu, který ukazuje, že distribuce je 2 až 4 $, a to je místo, kde bude většina našich dat. Používá medián, vodorovnou čáru rozdělující rámeček, abychom získali představu o tom, kde je největší rozdělení.
A pak máme graf ECDF, kde na levé straně osy y můžete vidět slovo Proporce , představující naše percentily. Na základě grafu se při ceně 3,50 USD díváme na přibližně 50 % našich dat a při hodnotě 5 USD a méně je distribuováno 80 % našich údajů.
Kód histogramu
Nyní vám ukážu kód pro každý z těchto grafů, počínaje histogramem. Všechny mají velmi podobné a , takže je můžete rychle vytáhnout pomocí jednoho kódu, jako šablony.
Nejprve musíme importovat a uložte jej jako sb, následovaný matplotlib.pyplot jako plt. Použijeme styl pozadí nazvaný ggplot a proměnnou matplotlib k předání v různých stylech.
Například na obrázku níže můžeme vidět, že na 11. řádku přidáváme nadpis pro histogram a velikosti ticků v následujících řádcích. Značky yticks a xticcks představují odpovídajícím způsobem velikosti x a y.
Ve 14. řádku používáme proměnnou Seaborn, která přináší tento konkrétní graf, jako je histplot ve výše uvedeném příkladu, který představuje graf histogramu. Data ze 4. řádku pak předáme do funkce jako datovou sadu.
Cokoli, co vložíte do hodnot, představuje vaši datovou sadu a odstraní duplikáty. Potom použijeme x pro tipy a odstín , který spolu s seaborn umožňuje rozdělit data podle kategorií. Pokud se vrátíme k našemu vizuálu, můžeme, že má kategorie, včetně kategorie, čas nebo kuřák.
Plot KDE
Pro KDE plot je vše téměř totožné. Potřebujeme pouze předat nový parametr nazvaný odstín, abychom měli tento stínovaný vzhled. Kromě toho je odstín, data a zbytek stejné.
Se zápletkou Box je to většinou podobné jako u jiných zápletek až na pár drobných rozdílů. Zde používáme funkci boxplot , kde x je den a y jsou tipy. Pro tento graf také nepoužíváme odstín .
Je to tedy stejná struktura jako graf ECDF a jediný rozdíl je v proměnné Seaborn, kde předáváme graf ECDF a jako den používáme odstín. Ale můžeme také změnit tento odstín na jinou kategorii, kterou máme, jako kuřák.
Pokud tuto kategorii projdeme, skončíme s grafem ECDF, který má dvě různé linie. V těchto distribucích můžeme vidět, že kuřáci mají více, pokud jde o naši konkrétní šířku čáry.
Nekuřáci mají sto procent těchto údajů pod 6 dolary, zatímco kuřáci je mají na 6 dolarech. Je zajímavé, že naši kuřáci mohou v určitý den nechávat větší spropitné.
Stylování pozemků ECDF
Nyní můžeme naše ECDF grafy dále upravovat tak, aby byly reprezentativnější. Na obrázku níže jsou různé grafy ECDF. V prvním výkresu jsem čáry zvětšil a použil jinou barevnou paletu.
V prvním grafu jsem použil různé parametry uvnitř funkce. Jak můžete vidět níže, v paletce jsem prošel jako léto a šířku linky jako 5.
Také jsem porovnával sobotu a neděli, proto jsou tam dvě různé zelené čáry. Zde můžeme vidět, že spropitné 3 dolary je na 45. percentilu pro neděli a 70. percentilu pro čtvrtek, což nám říká, že lidé mají tendenci nechávat vyšší spropitné v neděli.
Můžeme také přepnout osu X a Y, vyměnit proporce a hrot uvnitř našeho výkresu a změnit paletu, stejně jako na obrázku níže.
Zde vidíme, že spropitné 2 dolary je na 20. percentilu pro neděli, což je fialová čára v grafu. Data jsou tedy stejná jako u předchozího grafu ECDF a liší se pouze prezentace.
Nyní máme další graf se stejným souborem dat a zachovává původní polohy os, jak je znázorněno na obrázku výše. Rozdíl je tentokrát v tom, že směr čar je obrácený.
ECDF styl pozemků
Pokud se podíváme na kód, vše, co děláme, je předání parametru komplementární rovno = true. Tato akce nám umožní říci, že v rozsahu 2 $ a výše je distribuováno 80 % našich dat, místo abychom řekli, že pod rozsahem 2 $ je distribuováno 20 % našich dat. Opět jde o stejná data s jiným vzhledem nebo způsobem jejich prezentace.
A v našem čtvrtém a posledním ECDF grafu používáme Count místo proporce.
Tento přístup je užitečný, když máme více než několik pozemků. Když se podíváme na sloupec počtu na obrázku níže, můžeme vidět, že v pátek není mnoho pozorování, což nám říká, že lidé v ten den nezanechávají mnoho tipů.
ECDF Plots Code Essentials
Když se podíváme do kódu, najdete tam Seaborn , což je hlavní věc pro vytvoření této konkrétní zápletky. Pro stylování máme také matplotlib.pyplot , který si můžete uložit jako proměnnou plt .
Tuto proměnnou pak můžeme použít k vytvoření různých stylů pro náš konkrétní výkres, jako je přidání nadpisů a velikostí písma. Hlavní částí vašeho kódu bude funkce ECDF plot, kterou přinášíme s Seaborn.
Závěr
To byly způsoby, jak můžete použít různé distribuční grafy, včetně grafů Histogram, KDE, Box a ECDF. Také jste se naučili čtyři způsoby, jak prezentovat graf ECDF pomocí stejného souboru dat. Můžete použít jakýkoli přístup v závislosti na vašich preferencích.
Vždy si nezapomeňte přinést potřebné knihovny pro vytvoření vašeho pozemku a použít správnou funkci. Poté už je to jen otázka změny vizuálních a stylistických aspektů vašeho pozemku, jako je umístění os a odstíny.
Vše nejlepší,
Zjistěte, proč je důležité mít vyhrazenou tabulku s daty v LuckyTemplates, a naučte se nejrychlejší a nejefektivnější způsob, jak toho dosáhnout.
Tento stručný návod zdůrazňuje funkci mobilního hlášení LuckyTemplates. Ukážu vám, jak můžete efektivně vytvářet přehledy pro mobily.
V této ukázce LuckyTemplates si projdeme sestavy ukazující profesionální analýzy služeb od firmy, která má více smluv a zákaznických vztahů.
Pozrite si kľúčové aktualizácie pre Power Apps a Power Automate a ich výhody a dôsledky pre platformu Microsoft Power Platform.
Objavte niektoré bežné funkcie SQL, ktoré môžeme použiť, ako napríklad reťazec, dátum a niektoré pokročilé funkcie na spracovanie alebo manipuláciu s údajmi.
V tomto tutoriálu se naučíte, jak vytvořit dokonalou šablonu LuckyTemplates, která je nakonfigurována podle vašich potřeb a preferencí.
V tomto blogu si ukážeme, jak vrstvit parametry pole s malými násobky, abychom vytvořili neuvěřitelně užitečné přehledy a vizuály.
V tomto blogu se dozvíte, jak používat funkce hodnocení LuckyTemplates a vlastní seskupování k segmentaci ukázkových dat a jejich seřazení podle kritérií.
V tomto tutoriálu se budu zabývat konkrétní technikou, jak zobrazit kumulativní součet pouze do určitého data ve vašich vizuálech v LuckyTemplates.
Naučte se vytvářet a přizpůsobovat Bullet grafy v LuckyTemplates, které se používají hlavně pro měření výkonu oproti cílovým nebo předchozím rokům.