Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ez a blog bemutatja, hogyan kell használni a kumulatív eloszlási diagramot , más néven empirikus kumulatív eloszlási függvényt vagy ECDF-grafikonokat, és bemutatja ennek a diagramváltozatnak az előnyeit más telektípusokkal szemben. Az oktatóanyag teljes videóját a blog alján tekintheti meg .

A legtöbben az ECDF-ábrázolásokat részesítik előnyben az adatok megjelenítéséhez, mivel minden adatpontot közvetlenül ábrázolnak, és ez a funkció megkönnyíti a felhasználó számára a diagrammal való interakciót. Ma megtanulhatja, hogyan használhatja az ECDF-et a Pythonban és a LuckyTemplatesben, és hogyan javíthatja az adatelosztással kapcsolatos prezentációit és jelentéseit.

Tartalomjegyzék

Az elosztási telkek fajtái

Először egy adott napon, szombaton szűröm az adataimat, és az alábbiakban láthatjuk a disztribúciók leírására használt Python diagramokat. Itt található az ECDF diagramunk, egy hisztogram, egy KDE diagram és egy Box plot.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Mindezek a diagramok leírják, hogyan oszlanak el vagy oszlanak el az adatok. Például, ha lemegyünk és megnézzük a hisztogramot, láthatjuk, hogy ezeknek a magas tárolóknak a többsége ott lesz, ahol az adataink találhatók.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Az alábbi adatkészletünkben 3,50 dollár körüli összeggel a legmagasabb a tippjeink adatai.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Használhatunk egy KDE plot-t is, amely más mérőszámot ad a disztribúció szempontjából. A hisztogram az ezekben a tárolókban található számokkal, míg a KDE a sűrűséggel foglalkozik.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A KDE-grafikonnal meg tudja állapítani, hogy hol található a legtöbb adatunk, ha meglátja a diagram legnagyobb sűrűségét vagy legmagasabb kidomborodását, ha akarja. Tehát a fenti képen azt mondhatjuk, hogy 2 és 4 dollár között van elosztva.

Ugyanez igaz a Box plotra is, amely azt mutatja, hogy az eloszlás 2 és 4 dollár között mozog, és itt lesz a legtöbb adatunk. Egy mediánt, a dobozt elválasztó vízszintes vonalat használja, hogy képet adjon arról, hol van a legnagyobb eloszlás.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ezután megvan az ECDF diagram, ahol az y tengely bal oldalán láthatja az Arány szót , amely a százalékpontjainkat jelöli. A grafikon alapján 3,50 dollárnál adataink körülbelül 50%-át nézzük, és 5 dollárnál és ez alatt az adatok 80%-a oszlik meg.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Histogram Plot Code

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most megmutatom a kódot minden egyes diagramhoz, a hisztogrammal kezdve. Mindegyiknek nagyon hasonló és , így gyorsan előhívhatja őket egyetlen kóddal, például egy sablonnal.

Először importálnunk kell  és mentse el  sb-ként,  majd  a matplotlib.pyplot-t  plt- ként  A ggplot nevű háttérstílust   és a  matplotlib  változót fogjuk használni a különböző stílusok átadásához.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Például az alábbi képen láthatjuk, hogy a 11. sorban a következő sorokban a hisztogram és a pipaméretek címét adjuk meg. Az  ytick  és  xtick  ennek megfelelően az x és y méretet jelentik.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A 14. sorban egy Seaborn változót használunk, amely behozza az adott diagramot, mint például  a fenti példában a hisztogram diagramot ábrázoló hisztogram  . Ezután a 4. sor adatait adathalmazként átadjuk a függvénynek.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Bármi, amit bevisz az értékekbe, az adatkészletet képviseli, és eldobja az ismétlődéseket. Ezután x-et  használunk  a tippekhez ,  és egy  színárnyalatot,  amely  a seaborn-nel együtt lehetővé teszi az adatok kategóriák szerinti elkülönítését. Ha visszatérünk a vizualitásunkhoz, akkor megállapíthatjuk, hogy vannak kategóriái, beleértve a, az időt vagy a dohányzót.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

KDE Plot

A KDE cselekmény esetében minden majdnem azonos. Csak egy új, shade nevű paramétert kell megadnunk, hogy ezt az árnyékolt megjelenést megkapjuk. Ezt leszámítva a színárnyalat, az adatok és a többi ugyanaz.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A Box cselekménynél ez többnyire hasonlít a többi cselekményhez, kivéve néhány kisebb eltérést. Itt a boxplot függvényt használjuk   , ahol  x  a nap,  y pedig  a tipp.  Ehhez a cselekményhez szintén nem használunk  színárnyalatot .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Tehát ez ugyanaz, mint az ECDF diagram, és az egyetlen különbség a Seaborn változóban van, ahol átadunk egy ECDF diagramot, és a színárnyalatot nappalként használjuk. De megváltoztathatjuk ezt az árnyalatot egy másik kategóriára is, például dohányzóra.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ha átengedjük ezt a kategóriát, akkor egy olyan ECDF-rajzot kapunk, amely két különböző vonallal rendelkezik. Ezekben az eloszlásokban azt láthatjuk, hogy a dohányosoknak több van az adott vonalszélességünkkel kapcsolatban.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A nemdohányzók száz százaléka 6 dollár alatt van, míg a dohányosok 6 dollár alatt. Érdekes módon dohányosaink nagyobb borravalót hagyhatnak egy adott napon.

Styling ECDF Plots

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most tovább formálhatjuk ECDF-telkeinket, hogy még jobban bemutathatóak legyenek. Az alábbi képen különböző ECDF-rajzok láthatók. Az első cselekménynél nagyobbra tettem a vonalakat és más színpalettát használtam.

Az első diagramban különböző paramétereket használtam a függvényen belül. Amint lentebb látható, a palettán nyárként  ,  a vonalszélességen pedig  5-ként léptem be. 

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A szombatot és a vasárnapot is összehasonlítottam, ezért van két különböző zöld vonal. Itt láthatjuk, hogy a 3 dolláros borravaló a 45. percentilisnél van vasárnapra és a 70. százalékosnál csütörtökön, ami azt jelzi, hogy az emberek általában magasabb borravalót hagynak vasárnap.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Az alábbi képen látható módon váltogathatjuk az X és Y tengelyt, felcserélhetjük az arányt és a csúcsot a diagramon belül, és megváltoztathatjuk a palettát.

Itt láthatjuk, hogy a 2 dolláros borravaló a vasárnapi 20. percentilisnél van, ami a cselekmény lila vonala. Tehát az adatok megegyeznek az előző ECDF diagrammal, és csak a megjelenítés más.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most van egy másik diagramunk ugyanazzal az adatkészlettel, és megtartja az eredeti tengelypozíciókat, amint az a fenti képen látható. A különbség ezúttal az, hogy a vonalak iránya fordított.

ECDF Plots Style

Ha megnézzük a kódot, akkor csak a kiegészítő egyenlő = igaz paramétert adjuk át  Ez a művelet  lehetővé teszi számunkra, hogy azt mondjuk, hogy a 2 dolláros és afeletti tartományban az adataink 80%-a oszlik meg, ahelyett, hogy azt mondanánk, hogy az alatta lévő tartományban az adataink 20%-a oszlik meg. Megint ugyanaz az adat, más megjelenéssel vagy megjelenítési móddal.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Negyedik, egyben utolsó ECDF-rajzunkban az arány helyett a Count-ot használjuk .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ez a megközelítés akkor hasznos, ha több mint néhány telkünk van. Az alábbi képen a számláló oszlopot nézve láthatjuk, hogy pénteken nem sok megfigyelés történt, ami azt mutatja, hogy az emberek nem sok borravalót hagynak aznap.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

ECDF Plots Code Essentials

Ha megnézzük a kódot, megtalálja  a Seabornt , ami a fő dolog ennek a cselekménynek a létrehozásához. A stílusozáshoz a matplotlib.pyplot is rendelkezésre áll   , amelyet elmenthet  plt nevű változóként .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ezután ezt a változót használhatjuk különböző stílusok létrehozására az adott cselekményhez, például címek és betűméretek hozzáadásához. A kód fő része az ECDF plot funkciója lesz, amelyet a Seaborn segítségével viszünk be.




Következtetés

Így használhatja a különböző terjesztési diagramokat, beleértve a hisztogram, a KDE, a Box és az ECDF diagramokat. Négy módszert is megtanult az ECDF diagram bemutatására ugyanazon adatkészlet használatával. Bármilyen megközelítést alkalmazhat, preferenciáitól függően.

Mindig ne felejtse el behozni a szükséges könyvtárakat a telek létrehozásához, és a megfelelő funkciót használni. Ezt követően már csak a cselekmény vizuális és stilisztikai szempontjainak megváltoztatása, például a tengelypozíció és a színárnyalatok kérdése.

Minden jót,


A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

Ismerje meg, hogyan töltheti le és telepítheti a DAX Studio és a Tabular Editor 3 alkalmazást, és hogyan konfigurálhatja őket a LuckyTemplates és az Excel programban való használatra.

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

Ez a blog tartalmazza a Shape Map vizualizációt a LuckyTemplates térbeli elemzéséhez. Megmutatom, hogyan használhatja hatékonyan ezt a vizualizációt annak funkcióival és elemeivel.

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

Ebben az oktatóanyagban egy egyedülálló ötletet mutatok be a pénzügyi jelentésekkel kapcsolatban, amely az eredmények hozzárendelését jelenti a LuckyTemplates-en belüli táblázatsablonok előre meghatározásához.

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

Hozzon létre DAX-mértékeket a LuckyTemplates alkalmazásban meglévő mértékek vagy képletek használatával. Ezt nevezem mértékelágazási technikának.

A legerősebb funkcióhívás a LuckyTemplatesben

A legerősebb funkcióhívás a LuckyTemplatesben

Ebben a blogban fedezze fel a LuckyTemplates adatkészletet, a leghatékonyabb függvényhívást, amely M- és DAX-függvények ezreit juttatja a keze ügyébe.

Adatmodellezési technikák a DAX-mérések megszervezéséhez

Adatmodellezési technikák a DAX-mérések megszervezéséhez

A mai oktatóanyagban megosztok néhány adatmodellezési technikát a DAX-mérések jobb rendszerezéséhez a hatékonyabb munkafolyamat érdekében.

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

A LuckyTemplates egy nagyszerű eszköz a pénzügyi jelentésekhez. Itt található egy oktatóanyag, amely bemutatja, hogyan hozhat létre személyre szabott táblázatokat a LuckyTemplates pénzügyi irányítópultjához.

A Power Query nyelvi folyamatának bevált gyakorlatai

A Power Query nyelvi folyamatának bevált gyakorlatai

Ez az oktatóanyag megvitatja a Power Query nyelvi folyamatot, és azt, hogyan segíthet zökkenőmentes és hatékony adatjelentések létrehozásában.

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

Az egyik kedvenc technikámról fogok beszélni a LuckyTemplates egyéni ikonok körül, amely dinamikusan használja az egyéni ikonokat a LuckyTemplates vizualizációkban.

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

Ebben a blogban megmutatom, hogyan hozhat létre LuckyTemplates táblázatokat olyan képlet segítségével, amely egyesíti az UNION és a ROW függvényt.