Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Ha több változóból álló adatkészlettel dolgozik, a legjobb, ha megérti, hogy ezek miben különböznek egymástól, és hogyan hatnak egymásra. Ebben az oktatóanyagban bemutatom, hogyan használhatja a Seaborn függvényt Pythonban egy változó eloszlásának alternatíváinak megjelenítésére. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Tartalomjegyzék

Seaborn függvény használata Pythonban

Ezt az MPG adatkészleten fogom bemutatni, amely elérhető a Seaborn-on belül. Tehát menjünk előre, és importáljunk minden szükséges csomagot, valamint minden szükséges adatot. Megvizsgáljuk az MPG változók eloszlását és azt, hogy hogyan változnak. Ennek két általános módja a hisztogram és a boxplot .

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Tehát a dispot függvényt fogom használni (DIS a terjesztéshez). Ezután meg kell adnom, hogy milyen adathalmazról van szó, és milyen változót fogunk feltenni az X-tengelyre. És ezzel megvan az elosztás.

Ez nagyon jó. Így nagyon könnyen látható a teljes eloszlás és a forma. Van azonban néhány hiányosság a disztribúció ezen vizualizációjában. Az egyik az, hogy az általunk használt rekeszek száma vitathatatlanul tetszőleges. A másik dolog az, hogy nem feltétlenül tudhatjuk azonnal, hogy mi a változó átlaga.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

A szép dolog a Seaborn-nál az, hogy ha egyszer beállítom, hogy milyen változót akarok, hol és milyen adatkészletet használok, akkor ez valóban plug-and-chug az új vizualizáció elkészítésével. Most megyünk a boxplothoz. A Boxplot nem használ kukákat.

Az ötlet az, hogy igazán tisztán látjuk a kvartilis értéket, konkrétan a mediánt, és látjuk a többi kvartilis értéket. Látjuk, hogy van egy kiugró érték, és ez egy nagyon pontos cselekmény. A boxplot probléma az, hogy pontosan olyan dolgokra vonatkozik, amelyek általában sok üzleti felhasználót nem érdekelnek.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Szóval, ez a cselekmény egy kicsit nehéz a nem statisztikák számára, hogy valóban sok értéket szerezzenek. És ismét összesíti az adatokat, így sok részletet veszítünk. Nehéz pontosan tudni, hogy néz ez ki. Láthatjuk, hogy van egy kiugró érték. Láthatjuk, hogy a legtöbb érték itt van. A hisztogram intuitívabb módot ad ennek megvizsgálására.

Mindkettő jó cselekmény. Mindkettőjüknek megvan a maga célja. Nézzünk meg néhány alternatívát a Seaborn segítségével a vizualizáláshoz. Maradunk az MPG-nél ennek a változónak az eloszlását illetően.

A boxplothoz hasonlóan itt is látható, hogy a medián egyértelműen meg van jelölve. Látjuk a kvartilis tartományt is, és jobban megnézhetjük, mi az általános eloszlás. Ez is olyan, mint egy hisztogram. Kernel sűrűségbecslési diagramnak vagy KDE-diagramnak hívják. Ez a hisztogram sima változata. Nem használunk önkényes binninget. Itt minden folyamatos tartományba van simítva.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Ez e két megközelítés egyfajta hibridje, és valóban gondoskodik néhány hiányosságról. Azonban a közönségtől függően előfordulhat, hogy nagyon nehezen nézik ezt. Lehet, hogy nem szoktak hozzá, de van némi előnye a hagyományos megközelítésekhez képest.

Ebben a megközelítésben többé nem összesítjük az adatokat. Minden egyes pont kirajzolódik. Ez a szóródási diagram elemeit veszi igénybe, igaz? Ha szóródásdiagramra gondol, akkor minden egyes pontot ábrázolunk az X és Y koordinátákon.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Végül megvan a stripplot . Mi itt azt csináljuk, hogy ezt az elosztást vesszük, és véletlenszerűen szétszórjuk. Ez egy véletlenszerű folyamat. Többé nem próbáljuk ezt az elosztási formát kialakítani. Ezzel az a probléma, hogy ezek a csomók egymásba futnak, így ez nem feltétlenül jó attól függően, hogy mit próbál tenni. Esetleg ezeket szeretnéd csoportonként színezni vagy valami hasonlót, szóval van rá lehetőség.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Módosíthatjuk a jittert 0,25-re, és láthatjuk, hogy ahogy növeljük a jittert, ezek a pontok egy kicsit jobban szétterülnek.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Azonban minden alkalommal, amikor futtatom őket, kicsit másképp fognak kinézni. Tehát, ha meg akarsz szabadulni ettől, és minden alkalommal ugyanazt szeretnéd csinálni, importálhatod a numpy-t np néven . Ez az úgynevezett véletlenszerű mag beállítás.

Minden alkalommal, amikor futtatok valamit, aminek köze van a véletlen számokhoz, ugyanazokat a véletlen számokat fogja használni. A dolgok nem változnak véletlenszerűen, amikor újra futtatja. Ez bármilyen típusú szimulációhoz jó lehet, ami az adattudományban és az analitikában is gyakran előfordul ezzel a vizualizációval. Tehát most minden alkalommal, amikor futtatom ezt a cselekményt, ugyanazt fogjuk látni.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Hozzátehetem ide az Y eredetet is, és most látjuk, hogy kétváltozatos eloszlást hozunk létre. A futásteljesítmény-eloszlást vesszük, és származás szerint szegmentáljuk.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez




Következtetés

Ezek alternatívák egy változó eloszlásának megjelenítésére. Mindegyiknek megvan a maga előnye és hátránya. Ez nem azt jelenti, hogy soha ne használd a boxplotot vagy a hisztogramot, de ez csak azt jelenti, hogy itt van néhány más lehetőség, attól függően, hogy mit akarsz megjeleníteni.

Ezek mindegyike ugyanolyan könnyen elkészíthető, mint bármelyik másik, amikor a Python Seaborn funkcióját használjuk. Ha többet szeretne tudni róla, nézze meg az alábbi linkeket.

Minden jót!


A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

Ismerje meg, hogyan töltheti le és telepítheti a DAX Studio és a Tabular Editor 3 alkalmazást, és hogyan konfigurálhatja őket a LuckyTemplates és az Excel programban való használatra.

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

Ez a blog tartalmazza a Shape Map vizualizációt a LuckyTemplates térbeli elemzéséhez. Megmutatom, hogyan használhatja hatékonyan ezt a vizualizációt annak funkcióival és elemeivel.

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

Ebben az oktatóanyagban egy egyedülálló ötletet mutatok be a pénzügyi jelentésekkel kapcsolatban, amely az eredmények hozzárendelését jelenti a LuckyTemplates-en belüli táblázatsablonok előre meghatározásához.

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

Hozzon létre DAX-mértékeket a LuckyTemplates alkalmazásban meglévő mértékek vagy képletek használatával. Ezt nevezem mértékelágazási technikának.

A legerősebb funkcióhívás a LuckyTemplatesben

A legerősebb funkcióhívás a LuckyTemplatesben

Ebben a blogban fedezze fel a LuckyTemplates adatkészletet, a leghatékonyabb függvényhívást, amely M- és DAX-függvények ezreit juttatja a keze ügyébe.

Adatmodellezési technikák a DAX-mérések megszervezéséhez

Adatmodellezési technikák a DAX-mérések megszervezéséhez

A mai oktatóanyagban megosztok néhány adatmodellezési technikát a DAX-mérések jobb rendszerezéséhez a hatékonyabb munkafolyamat érdekében.

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

A LuckyTemplates egy nagyszerű eszköz a pénzügyi jelentésekhez. Itt található egy oktatóanyag, amely bemutatja, hogyan hozhat létre személyre szabott táblázatokat a LuckyTemplates pénzügyi irányítópultjához.

A Power Query nyelvi folyamatának bevált gyakorlatai

A Power Query nyelvi folyamatának bevált gyakorlatai

Ez az oktatóanyag megvitatja a Power Query nyelvi folyamatot, és azt, hogyan segíthet zökkenőmentes és hatékony adatjelentések létrehozásában.

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

Az egyik kedvenc technikámról fogok beszélni a LuckyTemplates egyéni ikonok körül, amely dinamikusan használja az egyéni ikonokat a LuckyTemplates vizualizációkban.

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

Ebben a blogban megmutatom, hogyan hozhat létre LuckyTemplates táblázatokat olyan képlet segítségével, amely egyesíti az UNION és a ROW függvényt.