Python-korreláció: Útmutató a látványelemek létrehozásához

A mai blogban végigvezetjük a korreláció megjelenítésének folyamatát, és azt, hogyan importálhatjuk ezeket a látványelemeket a LuckyTemplatesbe. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Tartalomjegyzék

Az összefüggések megértése

Itt van egy szép kép, amely bemutatja a különböző típusú összefüggéseket. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Balról kiindulva tökéletes pozitív korrelációt kapunk , ami azt jelenti, hogy a korrelációs értéke 1. Ezt követően csökkenő sorrendben pozitív korrelációk következnek, ami 0-hoz vezet. 

A középső grafikon nem mutat összefüggést , ami 0-val egyenlő korrelációs értékre utalna. 

Végül a jobb oldalon 0-ról csökkenő negatív korrelációs értékek láthatók. A jobb szélső gráf a tökéletes negatív korreláció , melynek korrelációs értéke -1.

Csomagok Python korrelációhoz

Ehhez az oktatóanyaghoz négy csomagot fogunk használni. Első csomagunk a Pandas , amelyet adatkezelésre használunk és változó pd- ként mentünk el . 

A megjelenítéshez a Matplotlib-et fogjuk használni, amely plt változóként van elmentve a funkciók könnyebb használatához. A Seaborn , a statisztikai vizualizációs könyvtárunk sns néven lesz elmentve . Végül pedig a Numpy , amelyet np néven kell elmenteni , a lineáris algebrához lesz használva. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatokhoz egy Seaborn-beli mintaadatkészletet fogunk használni. Ezután az sns változó használatával behozzuk a gyémánt adatkészletet az alábbiak szerint. .

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatok attribútumai

Adataink attribútumait a dataset.info függvény segítségével tekinthetjük meg . Ez a függvény megmutatja nekünk az összes különböző adattípust, amint az az alábbi utolsó oszlopban látható.

Python-korreláció: Útmutató a látványelemek létrehozásához

Vegye figyelembe, hogy a korreláció csak numerikus változókon működik, ezért legtöbbször a numerikus változókat fogjuk nézni. Megtanuljuk azonban azt is, hogyan használhatunk fel néhány kategorikus változót a vizualizációhoz. 

A Python korrelációs adatkészlet

A dataset.head néven írt head függvény használatával megkaphatjuk adataink felső öt sorát, amelyeknek így kell kinézniük.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az első oszlopban karát található , ezt követi a cut , color és clear kategorikus változók , majd a többi adat numerikus értékei. 

Python-korreláció: Scatter Plot létrehozása

Amikor összefüggéseket vizualizálunk és két változót nézünk, általában a . 

Így a Seaborn könyvtárat használva elkészítettük a szóródiagramunkat a scatter plot függvény segítségével, ahol a fent elmentett adatokat data=dataset néven továbbítottuk . Ezután azonosítottuk az X és Y változókat – karát és ár

Python-korreláció: Útmutató a látványelemek létrehozásához

Íme a Seaborn könyvtárral készített szóródási tervünk. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Látható, hogy ez a szórványrajz meglehetősen sűrű. Ennek az az oka, hogy körülbelül 54 000 adatsorunk van, és a pontok nem feltétlenül a legjobb módon vannak ábrázolva.

A Shift + Tab billentyűk lenyomásával láthatjuk a szóródiagram stílusának különböző módjait. Ez megmutatja nekünk a különböző paraméterek listáját, amelyeket hozzáadhatunk a szórási diagramunkhoz. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha tovább görget, információt kap arról, hogy a felsorolt ​​paraméterek mindegyike mit csinál. 

Python-korreláció: Útmutató a látványelemek létrehozásához

További Scatter Plot paraméterek

Merüljünk el egy kicsit. A linewidth=0-t azért tehetjük meg, mert az alább látható első szóródiagramunk fehér vonalai némileg elfedik a dolgokat. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Az alfát is be akarjuk állítani, hogy szabályozni tudjuk az átlátszatlanságot. Példánkban használjuk az alfa=0,2 értéket . De természetesen ezt is módosíthatja 0,1-re. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha hozzáadjuk ezeket a paramétereket, és rákattintunk a Futtatás gombra , láthatjuk, hogy a szóródiagramunk átlátszatlanabb lesz a fehér vonalak nélkül. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Játszhat a paraméterekkel, hogy a legjobb látványt kapja, amit keres. 

A kategorikus változók használata

Használhatunk néhány kategorikus változónkat is a látvány fejlesztésére. Például tudjuk, hogy adatainknak van egy vágása a gyémántunknak. 

Amit tehetünk, hogy átadjuk a vágási kategóriát a hue paraméter használatával, mint hue='cut'. Ez lehetővé teszi számunkra, hogy a színek megváltoztatásával megjelenítsük ezeket a pontokat. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Természetesen további paramétereket is hozzáadhatunk, mint például az alfa. Ezt újra hozzáadhatjuk 0,2-re állítva, és meglátjuk, hogy ez hogyan változtatja meg a látványt. Kattintson a Futtatás gombra , és láthat egy kis különbséget. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Játszhatunk a paraméterekkel, hogy megkapjuk a keresett látványt. Különféle kategóriákat is használhatunk, például a tisztaságot, amely megadja a tisztasági kategóriákat, és egy kicsit más képet ad a szóródásról.

Python-korreláció: Útmutató a látványelemek létrehozásához

Korreláció más változókkal

Érdekelheti az is, hogy az ár és a karáton kívül más értékek hogyan kapcsolódnak egymáshoz. Tehát ha megnézzük a táblázat szórásdiagramját , amely a gyémánt és a mélység numerikus dimenziója  , akkor láthatjuk, hogy nincs egy-egy lineáris kapcsolat.

Python-korreláció: Útmutató a látványelemek létrehozásához

Két másik változót is megvizsgálhatunk, például a mélységet és az árat . A grafikon alapján láthatjuk, hogy az adatok a középső terület köré összpontosulnak.

Python-korreláció: Útmutató a látványelemek létrehozásához

Python-korreláció: Regressziós diagram létrehozása

Térjünk át az úgynevezett regressziós diagramra, amely lehetővé teszi két változó közötti lineáris kapcsolat értékelését. 

Tehát a scatter plot függvény helyett ezúttal a regplot függvényt fogjuk használni. Ugyanabban a struktúrában adjuk át az adatainkat, majd az X és Y változókat. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Az eredmény egy vonalat mutat, amely a változók közötti lineáris kapcsolatot méri. Az is nyilvánvaló, hogy értékeink hogyan keringenek a regressziós egyenes körül.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez jelenleg nem túl szép látvány, de még mindig tudjuk optimalizálni, hogy jobb legyen. Például átadhatunk egy stílust a Matplotlib változó használatával. A stílust sötét háttérre változtathatjuk a plt.style.use('dark_background') kóddal. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Vegyük ugyanazt a regressziós diagramot, és adjunk meg néhány kulcsszót a szóráshoz és az egyeneshez. Használjunk vörös színt és 1-es vonalszélességet a regressziós egyenesünkhöz. Ezt a következőképpen írjuk : line_kws={“color” : “red”, 'linewidth' : 1). 

Scatter kulcsszavainknál állítsuk be a színt fehérre, az élszínt szürkere, az átlátszatlanságot pedig 0,4-re, és ezt a következőképpen írjuk: scatter_kws={“color” : „white”, 'edgecolor' : 'grey', 'alpha' : 0,4 ). 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a paraméterek egy kicsit más nézetet adnak az alábbiakban. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Python korreláció: korrelációs mátrix létrehozása

Eddig csak két változót tartalmazó szóródási diagramokat néztünk, de érdemes megnéznünk az összes változókorrelációnkat is.

Ezt az adatkészletünk segítségével hajtjuk végre egy adatkeret-függvénnyel, az úgynevezett korrelációval, amely dataset.corr. És amit kapunk, az egy mátrix, amely megmutatja nekünk az egyes változók közötti összefüggéseket. 

Python-korreláció: Útmutató a látványelemek létrehozásához

A fenti táblázatban szereplő számok a Pearson-korrelációt jelentik , amely az összes változó közötti lineáris kapcsolatra összpontosít. 

De ha nem vagyunk biztosak abban, hogy a változóink teljesen lineárisan korrelálnak-e, használhatunk más típusú korrelációt, amely inkább a hatásra összpontosít, mint a lineáris részre. Ezt Spearman-korrelációnak hívják . 

Python-korreláció: Útmutató a látványelemek létrehozásához

Mindezekről a dolgokról pedig információkat láthatunk a Shift + Tab megnyomásával. Ha lefelé görget, láthatjuk a Spearman-féle rangkorrelációt, a Pearson-korrelációs együtthatót, és nagyon sok különböző módszert az adatok mérésére. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha visszatekintünk a korrelációs mátrixunkra, tudjuk, hogy az ár és a karát meglehetősen jól korrelál.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a mi ábrázolásunkból származnak, ami azt mutatja, hogy meglehetősen lineárisak 0,92-nél. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha most inkább a Spearman-korrelációt használjuk, akkor a hatás vagy a rang egy kicsit magasabb lesz, 0,96.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a különböző típusú korrelációk lehetővé teszik számunkra, hogy a változók közötti korreláció különböző attribútumait vegyük fel. 

Több x egyváltozós korreláció

Néha nem akarjuk látni az a-t, mert jobban aggódunk az összes változó és egyetlen változó korrelációja miatt (pl. ár).

Amit tehetünk, hogy elkülönítjük az árat a dataset.corr használatával, amelyet a „price” követ . 

Python-korreláció: Útmutató a látványelemek létrehozásához

Most láthatjuk, hogy az ár korrelál a táblázatban szereplő összes különböző numerikus változónkkal. És ennek oka a vizuális cselekmények miatt van. 

Nézzük tehát a korrelációs mátrixunkat hőtérképpel.

Python-korreláció: Hőtérkép készítése

Ezt a korrelációs változót átadhatjuk egy Seaborn-nek az sns.heatmap függvény segítségével.

Python-korreláció: Útmutató a látványelemek létrehozásához

Így kapunk egy hőtérképet, amely így néz ki.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ismét hozzáadhatunk paramétereket a preferenciánkhoz. Átadhatjuk a linewidths=1 paramétert, és az annot=True használatával megjegyzéseket adhatunk hozzá . 

Python-korreláció: Útmutató a látványelemek létrehozásához

És láthatja, hogy a hőtérképünk most egészen másképp néz ki. Most van egy nagyon szép hőtérképünk. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Láthatjuk a sorok és a megjegyzések hozzáadásának hasznosságát. Ismét, ha megnyomjuk a Shift + Tab billentyűket, akkor megjelenik az összes különböző paraméter, amelybe beleférhet. 

Ezután próbálja meg hozzáadni a method='spearman ' paramétert a kódunkhoz, így tudni fogja, hogyan kell más típusú korrelációt használni a használati esettől függően. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Hőtérkép egy változóval

Ezután izolálunk egy változót, és létrehozunk egy hőtérképet, amelyben a korreláció negatívról pozitívra megy.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez az alábbi hőtérképet kapja.

Python-korreláció: Útmutató a látványelemek létrehozásához

Természetesen a stíluson is változtathatunk. Használhatjuk például a cmap paramétert a következőképpen: cmap='coolwarm' . Ez a színeket hidegre és melegre változtatja, és megszünteti a fekete hátterünket is. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha a Futtatás gombra kattintunk , ezt a hőtérképet kapjuk alább. A hideghez a kék, a meleghez pedig a piros sávok vannak. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Az irányt is megváltoztathatjuk, hogy a térképünket a színsávhoz igazítsuk. Ezt a sort_values ​​paraméterünk szerkesztésével és az ascending=False hozzáadásával teheti meg . 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez a leginkább korrelálttól (piros sáv) a legkevésbé korreláltig (kék sáv) fog menni. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Python-korreláció: Lépcsővizuál létrehozása

A korreláció megjelenítésének egyik fejlett módja az, ha egy maszkot használunk, amely blokkolja az összes már meglévő összefüggést. 

Ezt megtehetjük a Numpy-val, néhány IGAZ és HAMIS függvény segítségével, hogy egy lépcsőházat vizualizáljunk összefüggéseinkhez. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Így kell kinéznie az eredményeknek.

Python-korreláció: Útmutató a látványelemek létrehozásához

Lássuk, hogyan tudjuk ezt átvezetni a LuckyTemplates-be.

Vizuális lépcsőház a LuckyTemplatesben

Először nyissa meg a LuckyTemplates alkalmazást. Behoztam egy avokádó adatkészletet, hogy más látványt lássunk. Ezt az adatkészletet a Mezők ablaktáblában láthatja. Inicializálja a vizualizációt a Python ikonra kattintva a Vizualizációk panelen. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatkészletet úgy kell létrehoznunk, hogy hozzáadjuk az összes numerikus változót, amelyet a ? . Adja hozzá őket a változók melletti jelölőnégyzetekre kattintva. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Most, hogy van adatkészletünk, átléphetünk a Jupyter notebookunkba, és kimásolhatjuk a korábban birtokolt kódot.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezután átmásoljuk a kódot a LuckyTemplates Python szkriptszerkesztőjébe. 

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezután kiválasztjuk a látványtervünket, ami a lépcsőházi látvány lenne. Visszamegyünk a Jupyterhez, és kimásoljuk a kódot, amelyet a lépcsőház vizualizációjához használtunk.

Python-korreláció: Útmutató a látványelemek létrehozásához

Illessze be a kódot a Python szkriptszerkesztőbe.

Python-korreláció: Útmutató a látványelemek létrehozásához

Utolsó teendő, hogy győződjön meg arról, hogy plt.show -t használunk , amely szükséges a Python-szkriptben. Adja hozzá a plt.show-t a kód utolsó sorához, és kattintson a futtatás ikonra a szkriptszerkesztő jobb felső sarkában.

Python-korreláció: Útmutató a látványelemek létrehozásához

A nagyobb látvány érdekében feszítse meg egy kicsit a dobozt, hogy lássuk a sarokban futó szkriptet. Megvan a vizuális térképünk a hőtérképünkhöz, ami nagyon jól néz ki.

Python-korreláció: Útmutató a látványelemek létrehozásához

A LuckyTemplatesben pedig határozottan láthatjuk, hogyan változhat ez a látvány az adatkészlet szerint. Például rákattinthatunk a Szeletelő ikonra a Vizualizációk ablaktáblában, és a Mezők panelen a  Típus lehetőségre léphetünk.

Ez megadja nekünk az adatkészletünkben szereplő két típust, a hagyományos és az organikus . Ha rákattintunk egy típusra, mondjuk organikusra , láthatjuk, hogy változik a hőtérkép. 

Python-korreláció: Útmutató a látványelemek létrehozásához

A változtatások akkor is érvénybe lépnek, amikor legközelebb a hagyományos típusra kattintunk .

Python-korreláció: Útmutató a látványelemek létrehozásához

Ne feledje, hogy a szűrők működéséhez szükségünk van egy kategorikus változóra a szkriptünk adatkészletében. Amint látjuk, az általunk létrehozott adatkészlet tartalmazta a típust , amely lehetővé teszi a vizualizáció ilyen módon történő szűrését. 

Python-korreláció: Útmutató a látványelemek létrehozásához




Következtetés

Ebben a blogban megtanulta, hogyan lehet megjeleníteni a korrelációkat Pythonban és LuckyTemplates különböző módszerekkel, például Pearson-korrelációval és Spearman-rangkorrelációval. 

Mostantól szóródási diagramokat, regressziós diagramokat, korrelációs mátrixot, hőtérképeket és lépcsőházi vizualizációkat hozhat létre, hogy a legjobb képet kapja adatkészletéhez. Számos paramétert használhat a stílusok és látványelemek javítására. 

Minden jót,


Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.

Gyakori SQL-függvények: Áttekintés

Gyakori SQL-függvények: Áttekintés

Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.

LuckyTemplates sablonok létrehozása: útmutató és tippek

LuckyTemplates sablonok létrehozása: útmutató és tippek

Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.

LuckyTemplates rangsor és egyéni csoportosítás

LuckyTemplates rangsor és egyéni csoportosítás

Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.