Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Ha több változóból álló adatkészlettel dolgozik, a legjobb, ha megérti, hogy ezek miben különböznek egymástól, és hogyan hatnak egymásra. Ebben az oktatóanyagban bemutatom, hogyan használhatja a Seaborn függvényt Pythonban egy változó eloszlásának alternatíváinak megjelenítésére. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Tartalomjegyzék

Seaborn függvény használata Pythonban
Következtetés

Seaborn függvény használata Pythonban

Ezt az MPG adatkészleten fogom bemutatni, amely elérhető a Seaborn-on belül. Tehát menjünk előre, és importáljunk minden szükséges csomagot, valamint minden szükséges adatot. Megvizsgáljuk az MPG változók eloszlását és azt, hogy hogyan változnak. Ennek két általános módja a hisztogram és a boxplot .

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Tehát a dispot függvényt fogom használni (DIS a terjesztéshez). Ezután meg kell adnom, hogy milyen adathalmazról van szó, és milyen változót fogunk feltenni az X-tengelyre. És ezzel megvan az elosztás.

Ez nagyon jó. Így nagyon könnyen látható a teljes eloszlás és a forma. Van azonban néhány hiányosság a disztribúció ezen vizualizációjában. Az egyik az, hogy az általunk használt rekeszek száma vitathatatlanul tetszőleges. A másik dolog az, hogy nem feltétlenül tudhatjuk azonnal, hogy mi a változó átlaga.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

A szép dolog a Seaborn-nál az, hogy ha egyszer beállítom, hogy milyen változót akarok, hol és milyen adatkészletet használok, akkor ez valóban plug-and-chug az új vizualizáció elkészítésével. Most megyünk a boxplothoz. A Boxplot nem használ kukákat.

Az ötlet az, hogy igazán tisztán látjuk a kvartilis értéket, konkrétan a mediánt, és látjuk a többi kvartilis értéket. Látjuk, hogy van egy kiugró érték, és ez egy nagyon pontos cselekmény. A boxplot probléma az, hogy pontosan olyan dolgokra vonatkozik, amelyek általában sok üzleti felhasználót nem érdekelnek.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Szóval, ez a cselekmény egy kicsit nehéz a nem statisztikák számára, hogy valóban sok értéket szerezzenek. És ismét összesíti az adatokat, így sok részletet veszítünk. Nehéz pontosan tudni, hogy néz ez ki. Láthatjuk, hogy van egy kiugró érték. Láthatjuk, hogy a legtöbb érték itt van. A hisztogram intuitívabb módot ad ennek megvizsgálására.

Mindkettő jó cselekmény. Mindkettőjüknek megvan a maga célja. Nézzünk meg néhány alternatívát a Seaborn segítségével a vizualizáláshoz. Maradunk az MPG-nél ennek a változónak az eloszlását illetően.

A boxplothoz hasonlóan itt is látható, hogy a medián egyértelműen meg van jelölve. Látjuk a kvartilis tartományt is, és jobban megnézhetjük, mi az általános eloszlás. Ez is olyan, mint egy hisztogram. Kernel sűrűségbecslési diagramnak vagy KDE-diagramnak hívják. Ez a hisztogram sima változata. Nem használunk önkényes binninget. Itt minden folyamatos tartományba van simítva.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Ez e két megközelítés egyfajta hibridje, és valóban gondoskodik néhány hiányosságról. Azonban a közönségtől függően előfordulhat, hogy nagyon nehezen nézik ezt. Lehet, hogy nem szoktak hozzá, de van némi előnye a hagyományos megközelítésekhez képest.

Ebben a megközelítésben többé nem összesítjük az adatokat. Minden egyes pont kirajzolódik. Ez a szóródási diagram elemeit veszi igénybe, igaz? Ha szóródásdiagramra gondol, akkor minden egyes pontot ábrázolunk az X és Y koordinátákon.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Végül megvan a stripplot . Mi itt azt csináljuk, hogy ezt az elosztást vesszük, és véletlenszerűen szétszórjuk. Ez egy véletlenszerű folyamat. Többé nem próbáljuk ezt az elosztási formát kialakítani. Ezzel az a probléma, hogy ezek a csomók egymásba futnak, így ez nem feltétlenül jó attól függően, hogy mit próbál tenni. Esetleg ezeket szeretnéd csoportonként színezni vagy valami hasonlót, szóval van rá lehetőség.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Módosíthatjuk a jittert 0,25-re, és láthatjuk, hogy ahogy növeljük a jittert, ezek a pontok egy kicsit jobban szétterülnek.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Azonban minden alkalommal, amikor futtatom őket, kicsit másképp fognak kinézni. Tehát, ha meg akarsz szabadulni ettől, és minden alkalommal ugyanazt szeretnéd csinálni, importálhatod a numpy-t np néven . Ez az úgynevezett véletlenszerű mag beállítás.

Minden alkalommal, amikor futtatok valamit, aminek köze van a véletlen számokhoz, ugyanazokat a véletlen számokat fogja használni. A dolgok nem változnak véletlenszerűen, amikor újra futtatja. Ez bármilyen típusú szimulációhoz jó lehet, ami az adattudományban és az analitikában is gyakran előfordul ezzel a vizualizációval. Tehát most minden alkalommal, amikor futtatom ezt a cselekményt, ugyanazt fogjuk látni.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Hozzátehetem ide az Y eredetet is, és most látjuk, hogy kétváltozatos eloszlást hozunk létre. A futásteljesítmény-eloszlást vesszük, és származás szerint szegmentáljuk.

Seaborn függvény Pythonban egy változó eloszlásának megjelenítéséhez

Következtetés

Ezek alternatívák egy változó eloszlásának megjelenítésére. Mindegyiknek megvan a maga előnye és hátránya. Ez nem azt jelenti, hogy soha ne használd a boxplotot vagy a hisztogramot, de ez csak azt jelenti, hogy itt van néhány más lehetőség, attól függően, hogy mit akarsz megjeleníteni.

Ezek mindegyike ugyanolyan könnyen elkészíthető, mint bármelyik másik, amikor a Python Seaborn funkcióját használjuk. Ha többet szeretne tudni róla, nézze meg az alábbi linkeket.

Minden jót!

Hagyj kommentárt

E-mail melléklet mentése SharePointba a Power Automate segítségével

E-mail melléklet mentése SharePointba a Power Automate segítségével

Ebből a blogból megtudhatja, hogyan mentheti automatikusan az e-mail mellékleteket a SharePointba, majd törölheti az e-maileket a Power Automate segítségével.

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Power Automate folyamatok létrehozása a semmiből

A Power Automate folyamatok létrehozása a semmiből

Ismerje meg, hogyan hozhat létre Power Automate folyamatokat a semmiből. Sablon használata helyett mi magunk hozzuk létre a kiváltó okokat és a műveleteket.

4 módszer a Pi használatára a Pythonban példákkal

4 módszer a Pi használatára a Pythonban példákkal

4 módszer a Pi használatára a Pythonban példákkal

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Ebben az útmutatóban bemutatom, hogyan lehet Pénzügyi információk mátrixát létrehozni a Profit és veszteség (P&L) kimutatással a LuckyTemplates alkalmazásban.

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Fedezze fel, hogyan lehet dinamikusan egyesíteni oszlopokat a Power Query Table.CombineColumns függvény segítségével.

SharePoint-fájlok hozzáadása a számítógéphez

SharePoint-fájlok hozzáadása a számítógéphez

Ismerje meg, hogyan adhatjuk hozzá és szinkronizálhatjuk SharePoint-fájljainkat az asztalon és a OneDrive-on.

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.