Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban
Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.
A mai blogban végigvezetjük a korreláció megjelenítésének folyamatát, és azt, hogyan importálhatjuk ezeket a látványelemeket a LuckyTemplatesbe. Az oktatóanyag teljes videóját a blog alján tekintheti meg.
Tartalomjegyzék
Az összefüggések megértése
Itt van egy szép kép, amely bemutatja a különböző típusú összefüggéseket.
Balról kiindulva tökéletes pozitív korrelációt kapunk , ami azt jelenti, hogy a korrelációs értéke 1. Ezt követően csökkenő sorrendben pozitív korrelációk következnek, ami 0-hoz vezet.
A középső grafikon nem mutat összefüggést , ami 0-val egyenlő korrelációs értékre utalna.
Végül a jobb oldalon 0-ról csökkenő negatív korrelációs értékek láthatók. A jobb szélső gráf a tökéletes negatív korreláció , melynek korrelációs értéke -1.
Csomagok Python korrelációhoz
Ehhez az oktatóanyaghoz négy csomagot fogunk használni. Első csomagunk a Pandas , amelyet adatkezelésre használunk és változó pd- ként mentünk el .
A megjelenítéshez a Matplotlib-et fogjuk használni, amely plt változóként van elmentve a funkciók könnyebb használatához. A Seaborn , a statisztikai vizualizációs könyvtárunk sns néven lesz elmentve . Végül pedig a Numpy , amelyet np néven kell elmenteni , a lineáris algebrához lesz használva.
Az adatokhoz egy Seaborn-beli mintaadatkészletet fogunk használni. Ezután az sns változó használatával behozzuk a gyémánt adatkészletet az alábbiak szerint. .
Az adatok attribútumai
Adataink attribútumait a dataset.info függvény segítségével tekinthetjük meg . Ez a függvény megmutatja nekünk az összes különböző adattípust, amint az az alábbi utolsó oszlopban látható.
Vegye figyelembe, hogy a korreláció csak numerikus változókon működik, ezért legtöbbször a numerikus változókat fogjuk nézni. Megtanuljuk azonban azt is, hogyan használhatunk fel néhány kategorikus változót a vizualizációhoz.
A Python korrelációs adatkészlet
A dataset.head néven írt head függvény használatával megkaphatjuk adataink felső öt sorát, amelyeknek így kell kinézniük.
Az első oszlopban karát található , ezt követi a cut , color és clear kategorikus változók , majd a többi adat numerikus értékei.
Python-korreláció: Scatter Plot létrehozása
Amikor összefüggéseket vizualizálunk és két változót nézünk, általában a .
Így a Seaborn könyvtárat használva elkészítettük a szóródiagramunkat a scatter plot függvény segítségével, ahol a fent elmentett adatokat data=dataset néven továbbítottuk . Ezután azonosítottuk az X és Y változókat – karát és ár .
Íme a Seaborn könyvtárral készített szóródási tervünk.
Látható, hogy ez a szórványrajz meglehetősen sűrű. Ennek az az oka, hogy körülbelül 54 000 adatsorunk van, és a pontok nem feltétlenül a legjobb módon vannak ábrázolva.
A Shift + Tab billentyűk lenyomásával láthatjuk a szóródiagram stílusának különböző módjait. Ez megmutatja nekünk a különböző paraméterek listáját, amelyeket hozzáadhatunk a szórási diagramunkhoz.
Ha tovább görget, információt kap arról, hogy a felsorolt paraméterek mindegyike mit csinál.
További Scatter Plot paraméterek
Merüljünk el egy kicsit. A linewidth=0-t azért tehetjük meg, mert az alább látható első szóródiagramunk fehér vonalai némileg elfedik a dolgokat.
Az alfát is be akarjuk állítani, hogy szabályozni tudjuk az átlátszatlanságot. Példánkban használjuk az alfa=0,2 értéket . De természetesen ezt is módosíthatja 0,1-re.
Ha hozzáadjuk ezeket a paramétereket, és rákattintunk a Futtatás gombra , láthatjuk, hogy a szóródiagramunk átlátszatlanabb lesz a fehér vonalak nélkül.
Játszhat a paraméterekkel, hogy a legjobb látványt kapja, amit keres.
A kategorikus változók használata
Használhatunk néhány kategorikus változónkat is a látvány fejlesztésére. Például tudjuk, hogy adatainknak van egy vágása a gyémántunknak.
Amit tehetünk, hogy átadjuk a vágási kategóriát a hue paraméter használatával, mint hue='cut'. Ez lehetővé teszi számunkra, hogy a színek megváltoztatásával megjelenítsük ezeket a pontokat.
Természetesen további paramétereket is hozzáadhatunk, mint például az alfa. Ezt újra hozzáadhatjuk 0,2-re állítva, és meglátjuk, hogy ez hogyan változtatja meg a látványt. Kattintson a Futtatás gombra , és láthat egy kis különbséget.
Játszhatunk a paraméterekkel, hogy megkapjuk a keresett látványt. Különféle kategóriákat is használhatunk, például a tisztaságot, amely megadja a tisztasági kategóriákat, és egy kicsit más képet ad a szóródásról.
Korreláció más változókkal
Érdekelheti az is, hogy az ár és a karáton kívül más értékek hogyan kapcsolódnak egymáshoz. Tehát ha megnézzük a táblázat szórásdiagramját , amely a gyémánt és a mélység numerikus dimenziója , akkor láthatjuk, hogy nincs egy-egy lineáris kapcsolat.
Két másik változót is megvizsgálhatunk, például a mélységet és az árat . A grafikon alapján láthatjuk, hogy az adatok a középső terület köré összpontosulnak.
Python-korreláció: Regressziós diagram létrehozása
Térjünk át az úgynevezett regressziós diagramra, amely lehetővé teszi két változó közötti lineáris kapcsolat értékelését.
Tehát a scatter plot függvény helyett ezúttal a regplot függvényt fogjuk használni. Ugyanabban a struktúrában adjuk át az adatainkat, majd az X és Y változókat.
Az eredmény egy vonalat mutat, amely a változók közötti lineáris kapcsolatot méri. Az is nyilvánvaló, hogy értékeink hogyan keringenek a regressziós egyenes körül.
Ez jelenleg nem túl szép látvány, de még mindig tudjuk optimalizálni, hogy jobb legyen. Például átadhatunk egy stílust a Matplotlib változó használatával. A stílust sötét háttérre változtathatjuk a plt.style.use('dark_background') kóddal.
Vegyük ugyanazt a regressziós diagramot, és adjunk meg néhány kulcsszót a szóráshoz és az egyeneshez. Használjunk vörös színt és 1-es vonalszélességet a regressziós egyenesünkhöz. Ezt a következőképpen írjuk : line_kws={“color” : “red”, 'linewidth' : 1).
Scatter kulcsszavainknál állítsuk be a színt fehérre, az élszínt szürkere, az átlátszatlanságot pedig 0,4-re, és ezt a következőképpen írjuk: scatter_kws={“color” : „white”, 'edgecolor' : 'grey', 'alpha' : 0,4 ).
Ezek a paraméterek egy kicsit más nézetet adnak az alábbiakban.
Python korreláció: korrelációs mátrix létrehozása
Eddig csak két változót tartalmazó szóródási diagramokat néztünk, de érdemes megnéznünk az összes változókorrelációnkat is.
Ezt az adatkészletünk segítségével hajtjuk végre egy adatkeret-függvénnyel, az úgynevezett korrelációval, amely dataset.corr. És amit kapunk, az egy mátrix, amely megmutatja nekünk az egyes változók közötti összefüggéseket.
A fenti táblázatban szereplő számok a Pearson-korrelációt jelentik , amely az összes változó közötti lineáris kapcsolatra összpontosít.
De ha nem vagyunk biztosak abban, hogy a változóink teljesen lineárisan korrelálnak-e, használhatunk más típusú korrelációt, amely inkább a hatásra összpontosít, mint a lineáris részre. Ezt Spearman-korrelációnak hívják .
Mindezekről a dolgokról pedig információkat láthatunk a Shift + Tab megnyomásával. Ha lefelé görget, láthatjuk a Spearman-féle rangkorrelációt, a Pearson-korrelációs együtthatót, és nagyon sok különböző módszert az adatok mérésére.
Ha visszatekintünk a korrelációs mátrixunkra, tudjuk, hogy az ár és a karát meglehetősen jól korrelál.
Ezek a mi ábrázolásunkból származnak, ami azt mutatja, hogy meglehetősen lineárisak 0,92-nél.
Ha most inkább a Spearman-korrelációt használjuk, akkor a hatás vagy a rang egy kicsit magasabb lesz, 0,96.
Ezek a különböző típusú korrelációk lehetővé teszik számunkra, hogy a változók közötti korreláció különböző attribútumait vegyük fel.
Több x egyváltozós korreláció
Néha nem akarjuk látni az a-t, mert jobban aggódunk az összes változó és egyetlen változó korrelációja miatt (pl. ár).
Amit tehetünk, hogy elkülönítjük az árat a dataset.corr használatával, amelyet a „price” követ .
Most láthatjuk, hogy az ár korrelál a táblázatban szereplő összes különböző numerikus változónkkal. És ennek oka a vizuális cselekmények miatt van.
Nézzük tehát a korrelációs mátrixunkat hőtérképpel.
Python-korreláció: Hőtérkép készítése
Ezt a korrelációs változót átadhatjuk egy Seaborn-nek az sns.heatmap függvény segítségével.
Így kapunk egy hőtérképet, amely így néz ki.
Ismét hozzáadhatunk paramétereket a preferenciánkhoz. Átadhatjuk a linewidths=1 paramétert, és az annot=True használatával megjegyzéseket adhatunk hozzá .
És láthatja, hogy a hőtérképünk most egészen másképp néz ki. Most van egy nagyon szép hőtérképünk.
Láthatjuk a sorok és a megjegyzések hozzáadásának hasznosságát. Ismét, ha megnyomjuk a Shift + Tab billentyűket, akkor megjelenik az összes különböző paraméter, amelybe beleférhet.
Ezután próbálja meg hozzáadni a method='spearman ' paramétert a kódunkhoz, így tudni fogja, hogyan kell más típusú korrelációt használni a használati esettől függően.
Hőtérkép egy változóval
Ezután izolálunk egy változót, és létrehozunk egy hőtérképet, amelyben a korreláció negatívról pozitívra megy.
Ez az alábbi hőtérképet kapja.
Természetesen a stíluson is változtathatunk. Használhatjuk például a cmap paramétert a következőképpen: cmap='coolwarm' . Ez a színeket hidegre és melegre változtatja, és megszünteti a fekete hátterünket is.
Ha a Futtatás gombra kattintunk , ezt a hőtérképet kapjuk alább. A hideghez a kék, a meleghez pedig a piros sávok vannak.
Az irányt is megváltoztathatjuk, hogy a térképünket a színsávhoz igazítsuk. Ezt a sort_values paraméterünk szerkesztésével és az ascending=False hozzáadásával teheti meg .
Ez a leginkább korrelálttól (piros sáv) a legkevésbé korreláltig (kék sáv) fog menni.
Python-korreláció: Lépcsővizuál létrehozása
A korreláció megjelenítésének egyik fejlett módja az, ha egy maszkot használunk, amely blokkolja az összes már meglévő összefüggést.
Ezt megtehetjük a Numpy-val, néhány IGAZ és HAMIS függvény segítségével, hogy egy lépcsőházat vizualizáljunk összefüggéseinkhez.
Így kell kinéznie az eredményeknek.
Lássuk, hogyan tudjuk ezt átvezetni a LuckyTemplates-be.
Vizuális lépcsőház a LuckyTemplatesben
Először nyissa meg a LuckyTemplates alkalmazást. Behoztam egy avokádó adatkészletet, hogy más látványt lássunk. Ezt az adatkészletet a Mezők ablaktáblában láthatja. Inicializálja a vizualizációt a Python ikonra kattintva a Vizualizációk panelen.
Az adatkészletet úgy kell létrehoznunk, hogy hozzáadjuk az összes numerikus változót, amelyet a ? . Adja hozzá őket a változók melletti jelölőnégyzetekre kattintva.
Most, hogy van adatkészletünk, átléphetünk a Jupyter notebookunkba, és kimásolhatjuk a korábban birtokolt kódot.
Ezután átmásoljuk a kódot a LuckyTemplates Python szkriptszerkesztőjébe.
Ezután kiválasztjuk a látványtervünket, ami a lépcsőházi látvány lenne. Visszamegyünk a Jupyterhez, és kimásoljuk a kódot, amelyet a lépcsőház vizualizációjához használtunk.
Illessze be a kódot a Python szkriptszerkesztőbe.
Utolsó teendő, hogy győződjön meg arról, hogy plt.show -t használunk , amely szükséges a Python-szkriptben. Adja hozzá a plt.show-t a kód utolsó sorához, és kattintson a futtatás ikonra a szkriptszerkesztő jobb felső sarkában.
A nagyobb látvány érdekében feszítse meg egy kicsit a dobozt, hogy lássuk a sarokban futó szkriptet. Megvan a vizuális térképünk a hőtérképünkhöz, ami nagyon jól néz ki.
A LuckyTemplatesben pedig határozottan láthatjuk, hogyan változhat ez a látvány az adatkészlet szerint. Például rákattinthatunk a Szeletelő ikonra a Vizualizációk ablaktáblában, és a Mezők panelen a Típus lehetőségre léphetünk.
Ez megadja nekünk az adatkészletünkben szereplő két típust, a hagyományos és az organikus . Ha rákattintunk egy típusra, mondjuk organikusra , láthatjuk, hogy változik a hőtérkép.
A változtatások akkor is érvénybe lépnek, amikor legközelebb a hagyományos típusra kattintunk .
Ne feledje, hogy a szűrők működéséhez szükségünk van egy kategorikus változóra a szkriptünk adatkészletében. Amint látjuk, az általunk létrehozott adatkészlet tartalmazta a típust , amely lehetővé teszi a vizualizáció ilyen módon történő szűrését.
Következtetés
Ebben a blogban megtanulta, hogyan lehet megjeleníteni a korrelációkat Pythonban és LuckyTemplates különböző módszerekkel, például Pearson-korrelációval és Spearman-rangkorrelációval.
Mostantól szóródási diagramokat, regressziós diagramokat, korrelációs mátrixot, hőtérképeket és lépcsőházi vizualizációkat hozhat létre, hogy a legjobb képet kapja adatkészletéhez. Számos paramétert használhat a stílusok és látványelemek javítására.
Minden jót,
Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.
Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.
Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.
Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.
Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.
Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.
Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.
Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.
Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.
Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.