Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ez a blog bemutatja, hogyan kell használni a kumulatív eloszlási diagramot , más néven empirikus kumulatív eloszlási függvényt vagy ECDF-grafikonokat, és bemutatja ennek a diagramváltozatnak az előnyeit más telektípusokkal szemben. Az oktatóanyag teljes videóját a blog alján tekintheti meg .

A legtöbben az ECDF-ábrázolásokat részesítik előnyben az adatok megjelenítéséhez, mivel minden adatpontot közvetlenül ábrázolnak, és ez a funkció megkönnyíti a felhasználó számára a diagrammal való interakciót. Ma megtanulhatja, hogyan használhatja az ECDF-et a Pythonban és a LuckyTemplatesben, és hogyan javíthatja az adatelosztással kapcsolatos prezentációit és jelentéseit.

Tartalomjegyzék

Az elosztási telkek fajtái

Először egy adott napon, szombaton szűröm az adataimat, és az alábbiakban láthatjuk a disztribúciók leírására használt Python diagramokat. Itt található az ECDF diagramunk, egy hisztogram, egy KDE diagram és egy Box plot.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Mindezek a diagramok leírják, hogyan oszlanak el vagy oszlanak el az adatok. Például, ha lemegyünk és megnézzük a hisztogramot, láthatjuk, hogy ezeknek a magas tárolóknak a többsége ott lesz, ahol az adataink találhatók.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Az alábbi adatkészletünkben 3,50 dollár körüli összeggel a legmagasabb a tippjeink adatai.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Használhatunk egy KDE plot-t is, amely más mérőszámot ad a disztribúció szempontjából. A hisztogram az ezekben a tárolókban található számokkal, míg a KDE a sűrűséggel foglalkozik.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A KDE-grafikonnal meg tudja állapítani, hogy hol található a legtöbb adatunk, ha meglátja a diagram legnagyobb sűrűségét vagy legmagasabb kidomborodását, ha akarja. Tehát a fenti képen azt mondhatjuk, hogy 2 és 4 dollár között van elosztva.

Ugyanez igaz a Box plotra is, amely azt mutatja, hogy az eloszlás 2 és 4 dollár között mozog, és itt lesz a legtöbb adatunk. Egy mediánt, a dobozt elválasztó vízszintes vonalat használja, hogy képet adjon arról, hol van a legnagyobb eloszlás.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ezután megvan az ECDF diagram, ahol az y tengely bal oldalán láthatja az Arány szót , amely a százalékpontjainkat jelöli. A grafikon alapján 3,50 dollárnál adataink körülbelül 50%-át nézzük, és 5 dollárnál és ez alatt az adatok 80%-a oszlik meg.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Histogram Plot Code

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most megmutatom a kódot minden egyes diagramhoz, a hisztogrammal kezdve. Mindegyiknek nagyon hasonló és , így gyorsan előhívhatja őket egyetlen kóddal, például egy sablonnal.

Először importálnunk kell  és mentse el  sb-ként,  majd  a matplotlib.pyplot-t  plt- ként  A ggplot nevű háttérstílust   és a  matplotlib  változót fogjuk használni a különböző stílusok átadásához.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Például az alábbi képen láthatjuk, hogy a 11. sorban a következő sorokban a hisztogram és a pipaméretek címét adjuk meg. Az  ytick  és  xtick  ennek megfelelően az x és y méretet jelentik.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A 14. sorban egy Seaborn változót használunk, amely behozza az adott diagramot, mint például  a fenti példában a hisztogram diagramot ábrázoló hisztogram  . Ezután a 4. sor adatait adathalmazként átadjuk a függvénynek.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Bármi, amit bevisz az értékekbe, az adatkészletet képviseli, és eldobja az ismétlődéseket. Ezután x-et  használunk  a tippekhez ,  és egy  színárnyalatot,  amely  a seaborn-nel együtt lehetővé teszi az adatok kategóriák szerinti elkülönítését. Ha visszatérünk a vizualitásunkhoz, akkor megállapíthatjuk, hogy vannak kategóriái, beleértve a, az időt vagy a dohányzót.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

KDE Plot

A KDE cselekmény esetében minden majdnem azonos. Csak egy új, shade nevű paramétert kell megadnunk, hogy ezt az árnyékolt megjelenést megkapjuk. Ezt leszámítva a színárnyalat, az adatok és a többi ugyanaz.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A Box cselekménynél ez többnyire hasonlít a többi cselekményhez, kivéve néhány kisebb eltérést. Itt a boxplot függvényt használjuk   , ahol  x  a nap,  y pedig  a tipp.  Ehhez a cselekményhez szintén nem használunk  színárnyalatot .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Tehát ez ugyanaz, mint az ECDF diagram, és az egyetlen különbség a Seaborn változóban van, ahol átadunk egy ECDF diagramot, és a színárnyalatot nappalként használjuk. De megváltoztathatjuk ezt az árnyalatot egy másik kategóriára is, például dohányzóra.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ha átengedjük ezt a kategóriát, akkor egy olyan ECDF-rajzot kapunk, amely két különböző vonallal rendelkezik. Ezekben az eloszlásokban azt láthatjuk, hogy a dohányosoknak több van az adott vonalszélességünkkel kapcsolatban.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A nemdohányzók száz százaléka 6 dollár alatt van, míg a dohányosok 6 dollár alatt. Érdekes módon dohányosaink nagyobb borravalót hagyhatnak egy adott napon.

Styling ECDF Plots

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most tovább formálhatjuk ECDF-telkeinket, hogy még jobban bemutathatóak legyenek. Az alábbi képen különböző ECDF-rajzok láthatók. Az első cselekménynél nagyobbra tettem a vonalakat és más színpalettát használtam.

Az első diagramban különböző paramétereket használtam a függvényen belül. Amint lentebb látható, a palettán nyárként  ,  a vonalszélességen pedig  5-ként léptem be. 

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

A szombatot és a vasárnapot is összehasonlítottam, ezért van két különböző zöld vonal. Itt láthatjuk, hogy a 3 dolláros borravaló a 45. percentilisnél van vasárnapra és a 70. százalékosnál csütörtökön, ami azt jelzi, hogy az emberek általában magasabb borravalót hagynak vasárnap.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Az alábbi képen látható módon váltogathatjuk az X és Y tengelyt, felcserélhetjük az arányt és a csúcsot a diagramon belül, és megváltoztathatjuk a palettát.

Itt láthatjuk, hogy a 2 dolláros borravaló a vasárnapi 20. percentilisnél van, ami a cselekmény lila vonala. Tehát az adatok megegyeznek az előző ECDF diagrammal, és csak a megjelenítés más.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Most van egy másik diagramunk ugyanazzal az adatkészlettel, és megtartja az eredeti tengelypozíciókat, amint az a fenti képen látható. A különbség ezúttal az, hogy a vonalak iránya fordított.

ECDF Plots Style

Ha megnézzük a kódot, akkor csak a kiegészítő egyenlő = igaz paramétert adjuk át  Ez a művelet  lehetővé teszi számunkra, hogy azt mondjuk, hogy a 2 dolláros és afeletti tartományban az adataink 80%-a oszlik meg, ahelyett, hogy azt mondanánk, hogy az alatta lévő tartományban az adataink 20%-a oszlik meg. Megint ugyanaz az adat, más megjelenéssel vagy megjelenítési móddal.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Negyedik, egyben utolsó ECDF-rajzunkban az arány helyett a Count-ot használjuk .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ez a megközelítés akkor hasznos, ha több mint néhány telkünk van. Az alábbi képen a számláló oszlopot nézve láthatjuk, hogy pénteken nem sok megfigyelés történt, ami azt mutatja, hogy az emberek nem sok borravalót hagynak aznap.

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

ECDF Plots Code Essentials

Ha megnézzük a kódot, megtalálja  a Seabornt , ami a fő dolog ennek a cselekménynek a létrehozásához. A stílusozáshoz a matplotlib.pyplot is rendelkezésre áll   , amelyet elmenthet  plt nevű változóként .

Az ECDF-plotok használata Pythonban és LuckyTemplatesben

Ezután ezt a változót használhatjuk különböző stílusok létrehozására az adott cselekményhez, például címek és betűméretek hozzáadásához. A kód fő része az ECDF plot funkciója lesz, amelyet a Seaborn segítségével viszünk be.




Következtetés

Így használhatja a különböző terjesztési diagramokat, beleértve a hisztogram, a KDE, a Box és az ECDF diagramokat. Négy módszert is megtanult az ECDF diagram bemutatására ugyanazon adatkészlet használatával. Bármilyen megközelítést alkalmazhat, preferenciáitól függően.

Mindig ne felejtse el behozni a szükséges könyvtárakat a telek létrehozásához, és a megfelelő funkciót használni. Ezt követően már csak a cselekmény vizuális és stilisztikai szempontjainak megváltoztatása, például a tengelypozíció és a színárnyalatok kérdése.

Minden jót,


Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.

Gyakori SQL-függvények: Áttekintés

Gyakori SQL-függvények: Áttekintés

Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.

LuckyTemplates sablonok létrehozása: útmutató és tippek

LuckyTemplates sablonok létrehozása: útmutató és tippek

Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.

LuckyTemplates rangsor és egyéni csoportosítás

LuckyTemplates rangsor és egyéni csoportosítás

Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.