Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban
Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.
Ha több változóból álló adatkészlettel dolgozik, a legjobb, ha megérti, hogy ezek miben különböznek egymástól, és hogyan hatnak egymásra. Ebben az oktatóanyagban bemutatom, hogyan használhatja a Seaborn függvényt Pythonban egy változó eloszlásának alternatíváinak megjelenítésére. Az oktatóanyag teljes videóját a blog alján tekintheti meg.
Tartalomjegyzék
Seaborn függvény használata Pythonban
Ezt az MPG adatkészleten fogom bemutatni, amely elérhető a Seaborn-on belül. Tehát menjünk előre, és importáljunk minden szükséges csomagot, valamint minden szükséges adatot. Megvizsgáljuk az MPG változók eloszlását és azt, hogy hogyan változnak. Ennek két általános módja a hisztogram és a boxplot .
Tehát a dispot függvényt fogom használni (DIS a terjesztéshez). Ezután meg kell adnom, hogy milyen adathalmazról van szó, és milyen változót fogunk feltenni az X-tengelyre. És ezzel megvan az elosztás.
Ez nagyon jó. Így nagyon könnyen látható a teljes eloszlás és a forma. Van azonban néhány hiányosság a disztribúció ezen vizualizációjában. Az egyik az, hogy az általunk használt rekeszek száma vitathatatlanul tetszőleges. A másik dolog az, hogy nem feltétlenül tudhatjuk azonnal, hogy mi a változó átlaga.
A szép dolog a Seaborn-nál az, hogy ha egyszer beállítom, hogy milyen változót akarok, hol és milyen adatkészletet használok, akkor ez valóban plug-and-chug az új vizualizáció elkészítésével. Most megyünk a boxplothoz. A Boxplot nem használ kukákat.
Az ötlet az, hogy igazán tisztán látjuk a kvartilis értéket, konkrétan a mediánt, és látjuk a többi kvartilis értéket. Látjuk, hogy van egy kiugró érték, és ez egy nagyon pontos cselekmény. A boxplot probléma az, hogy pontosan olyan dolgokra vonatkozik, amelyek általában sok üzleti felhasználót nem érdekelnek.
Szóval, ez a cselekmény egy kicsit nehéz a nem statisztikák számára, hogy valóban sok értéket szerezzenek. És ismét összesíti az adatokat, így sok részletet veszítünk. Nehéz pontosan tudni, hogy néz ez ki. Láthatjuk, hogy van egy kiugró érték. Láthatjuk, hogy a legtöbb érték itt van. A hisztogram intuitívabb módot ad ennek megvizsgálására.
Mindkettő jó cselekmény. Mindkettőjüknek megvan a maga célja. Nézzünk meg néhány alternatívát a Seaborn segítségével a vizualizáláshoz. Maradunk az MPG-nél ennek a változónak az eloszlását illetően.
A boxplothoz hasonlóan itt is látható, hogy a medián egyértelműen meg van jelölve. Látjuk a kvartilis tartományt is, és jobban megnézhetjük, mi az általános eloszlás. Ez is olyan, mint egy hisztogram. Kernel sűrűségbecslési diagramnak vagy KDE-diagramnak hívják. Ez a hisztogram sima változata. Nem használunk önkényes binninget. Itt minden folyamatos tartományba van simítva.
Ez e két megközelítés egyfajta hibridje, és valóban gondoskodik néhány hiányosságról. Azonban a közönségtől függően előfordulhat, hogy nagyon nehezen nézik ezt. Lehet, hogy nem szoktak hozzá, de van némi előnye a hagyományos megközelítésekhez képest.
Ebben a megközelítésben többé nem összesítjük az adatokat. Minden egyes pont kirajzolódik. Ez a szóródási diagram elemeit veszi igénybe, igaz? Ha szóródásdiagramra gondol, akkor minden egyes pontot ábrázolunk az X és Y koordinátákon.
Végül megvan a stripplot . Mi itt azt csináljuk, hogy ezt az elosztást vesszük, és véletlenszerűen szétszórjuk. Ez egy véletlenszerű folyamat. Többé nem próbáljuk ezt az elosztási formát kialakítani. Ezzel az a probléma, hogy ezek a csomók egymásba futnak, így ez nem feltétlenül jó attól függően, hogy mit próbál tenni. Esetleg ezeket szeretnéd csoportonként színezni vagy valami hasonlót, szóval van rá lehetőség.
Módosíthatjuk a jittert 0,25-re, és láthatjuk, hogy ahogy növeljük a jittert, ezek a pontok egy kicsit jobban szétterülnek.
Azonban minden alkalommal, amikor futtatom őket, kicsit másképp fognak kinézni. Tehát, ha meg akarsz szabadulni ettől, és minden alkalommal ugyanazt szeretnéd csinálni, importálhatod a numpy-t np néven . Ez az úgynevezett véletlenszerű mag beállítás.
Minden alkalommal, amikor futtatok valamit, aminek köze van a véletlen számokhoz, ugyanazokat a véletlen számokat fogja használni. A dolgok nem változnak véletlenszerűen, amikor újra futtatja. Ez bármilyen típusú szimulációhoz jó lehet, ami az adattudományban és az analitikában is gyakran előfordul ezzel a vizualizációval. Tehát most minden alkalommal, amikor futtatom ezt a cselekményt, ugyanazt fogjuk látni.
Hozzátehetem ide az Y eredetet is, és most látjuk, hogy kétváltozatos eloszlást hozunk létre. A futásteljesítmény-eloszlást vesszük, és származás szerint szegmentáljuk.
Következtetés
Ezek alternatívák egy változó eloszlásának megjelenítésére. Mindegyiknek megvan a maga előnye és hátránya. Ez nem azt jelenti, hogy soha ne használd a boxplotot vagy a hisztogramot, de ez csak azt jelenti, hogy itt van néhány más lehetőség, attól függően, hogy mit akarsz megjeleníteni.
Ezek mindegyike ugyanolyan könnyen elkészíthető, mint bármelyik másik, amikor a Python Seaborn funkcióját használjuk. Ha többet szeretne tudni róla, nézze meg az alábbi linkeket.
Minden jót!
Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.
Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.
Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.
Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.
Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.
Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.
Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.
Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.
Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.
Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.