Python-korreláció: Útmutató a látványelemek létrehozásához

A mai blogban végigvezetjük a korreláció megjelenítésének folyamatát, és azt, hogyan importálhatjuk ezeket a látványelemeket a LuckyTemplatesbe. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Tartalomjegyzék

Az összefüggések megértése
Csomagok Python korrelációhoz
Az adatok attribútumai
A Python korrelációs adatkészlet
Python-korreláció: Scatter Plot létrehozása
Python-korreláció: Regressziós diagram létrehozása
Python korreláció: korrelációs mátrix létrehozása
- Több x egyváltozós korreláció
Python-korreláció: Hőtérkép készítése
- Hőtérkép egy változóval
Python-korreláció: Lépcsővizuál létrehozása
- Vizuális lépcsőház a LuckyTemplatesben
Következtetés

Az összefüggések megértése

Itt van egy szép kép, amely bemutatja a különböző típusú összefüggéseket.

Python-korreláció: Útmutató a látványelemek létrehozásához

Balról kiindulva tökéletes pozitív korrelációt kapunk , ami azt jelenti, hogy a korrelációs értéke 1. Ezt követően csökkenő sorrendben pozitív korrelációk következnek, ami 0-hoz vezet.

A középső grafikon nem mutat összefüggést , ami 0-val egyenlő korrelációs értékre utalna.

Végül a jobb oldalon 0-ról csökkenő negatív korrelációs értékek láthatók. A jobb szélső gráf a tökéletes negatív korreláció , melynek korrelációs értéke -1.

Csomagok Python korrelációhoz

Ehhez az oktatóanyaghoz négy csomagot fogunk használni. Első csomagunk a Pandas , amelyet adatkezelésre használunk és változó pd- ként mentünk el .

A megjelenítéshez a Matplotlib-et fogjuk használni, amely plt változóként van elmentve a funkciók könnyebb használatához. A Seaborn , a statisztikai vizualizációs könyvtárunk sns néven lesz elmentve . Végül pedig a Numpy , amelyet np néven kell elmenteni , a lineáris algebrához lesz használva.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatokhoz egy Seaborn-beli mintaadatkészletet fogunk használni. Ezután az sns változó használatával behozzuk a gyémánt adatkészletet az alábbiak szerint. .

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatok attribútumai

Adataink attribútumait a dataset.info függvény segítségével tekinthetjük meg . Ez a függvény megmutatja nekünk az összes különböző adattípust, amint az az alábbi utolsó oszlopban látható.

Python-korreláció: Útmutató a látványelemek létrehozásához

Vegye figyelembe, hogy a korreláció csak numerikus változókon működik, ezért legtöbbször a numerikus változókat fogjuk nézni. Megtanuljuk azonban azt is, hogyan használhatunk fel néhány kategorikus változót a vizualizációhoz.

A Python korrelációs adatkészlet

A dataset.head néven írt head függvény használatával megkaphatjuk adataink felső öt sorát, amelyeknek így kell kinézniük.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az első oszlopban karát található , ezt követi a cut , color és clear kategorikus változók , majd a többi adat numerikus értékei.

Python-korreláció: Scatter Plot létrehozása

Amikor összefüggéseket vizualizálunk és két változót nézünk, általában a .

Így a Seaborn könyvtárat használva elkészítettük a szóródiagramunkat a scatter plot függvény segítségével, ahol a fent elmentett adatokat data=dataset néven továbbítottuk . Ezután azonosítottuk az X és Y változókat – karát és ár .

Python-korreláció: Útmutató a látványelemek létrehozásához

Íme a Seaborn könyvtárral készített szóródási tervünk.

Python-korreláció: Útmutató a látványelemek létrehozásához

Látható, hogy ez a szórványrajz meglehetősen sűrű. Ennek az az oka, hogy körülbelül 54 000 adatsorunk van, és a pontok nem feltétlenül a legjobb módon vannak ábrázolva.

A Shift + Tab billentyűk lenyomásával láthatjuk a szóródiagram stílusának különböző módjait. Ez megmutatja nekünk a különböző paraméterek listáját, amelyeket hozzáadhatunk a szórási diagramunkhoz.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha tovább görget, információt kap arról, hogy a felsorolt paraméterek mindegyike mit csinál.

Python-korreláció: Útmutató a látványelemek létrehozásához

További Scatter Plot paraméterek

Merüljünk el egy kicsit. A linewidth=0-t azért tehetjük meg, mert az alább látható első szóródiagramunk fehér vonalai némileg elfedik a dolgokat.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az alfát is be akarjuk állítani, hogy szabályozni tudjuk az átlátszatlanságot. Példánkban használjuk az alfa=0,2 értéket . De természetesen ezt is módosíthatja 0,1-re.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha hozzáadjuk ezeket a paramétereket, és rákattintunk a Futtatás gombra , láthatjuk, hogy a szóródiagramunk átlátszatlanabb lesz a fehér vonalak nélkül.

Python-korreláció: Útmutató a látványelemek létrehozásához

Játszhat a paraméterekkel, hogy a legjobb látványt kapja, amit keres.

A kategorikus változók használata

Használhatunk néhány kategorikus változónkat is a látvány fejlesztésére. Például tudjuk, hogy adatainknak van egy vágása a gyémántunknak.

Amit tehetünk, hogy átadjuk a vágási kategóriát a hue paraméter használatával, mint hue='cut'. Ez lehetővé teszi számunkra, hogy a színek megváltoztatásával megjelenítsük ezeket a pontokat.

Python-korreláció: Útmutató a látványelemek létrehozásához

Természetesen további paramétereket is hozzáadhatunk, mint például az alfa. Ezt újra hozzáadhatjuk 0,2-re állítva, és meglátjuk, hogy ez hogyan változtatja meg a látványt. Kattintson a Futtatás gombra , és láthat egy kis különbséget.

Python-korreláció: Útmutató a látványelemek létrehozásához

Játszhatunk a paraméterekkel, hogy megkapjuk a keresett látványt. Különféle kategóriákat is használhatunk, például a tisztaságot, amely megadja a tisztasági kategóriákat, és egy kicsit más képet ad a szóródásról.

Python-korreláció: Útmutató a látványelemek létrehozásához

Korreláció más változókkal

Érdekelheti az is, hogy az ár és a karáton kívül más értékek hogyan kapcsolódnak egymáshoz. Tehát ha megnézzük a táblázat szórásdiagramját , amely a gyémánt és a mélység numerikus dimenziója , akkor láthatjuk, hogy nincs egy-egy lineáris kapcsolat.

Python-korreláció: Útmutató a látványelemek létrehozásához

Két másik változót is megvizsgálhatunk, például a mélységet és az árat . A grafikon alapján láthatjuk, hogy az adatok a középső terület köré összpontosulnak.

Python-korreláció: Útmutató a látványelemek létrehozásához

Python-korreláció: Regressziós diagram létrehozása

Térjünk át az úgynevezett regressziós diagramra, amely lehetővé teszi két változó közötti lineáris kapcsolat értékelését.

Tehát a scatter plot függvény helyett ezúttal a regplot függvényt fogjuk használni. Ugyanabban a struktúrában adjuk át az adatainkat, majd az X és Y változókat.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az eredmény egy vonalat mutat, amely a változók közötti lineáris kapcsolatot méri. Az is nyilvánvaló, hogy értékeink hogyan keringenek a regressziós egyenes körül.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez jelenleg nem túl szép látvány, de még mindig tudjuk optimalizálni, hogy jobb legyen. Például átadhatunk egy stílust a Matplotlib változó használatával. A stílust sötét háttérre változtathatjuk a plt.style.use('dark_background') kóddal.

Python-korreláció: Útmutató a látványelemek létrehozásához

Vegyük ugyanazt a regressziós diagramot, és adjunk meg néhány kulcsszót a szóráshoz és az egyeneshez. Használjunk vörös színt és 1-es vonalszélességet a regressziós egyenesünkhöz. Ezt a következőképpen írjuk : line_kws={“color” : “red”, 'linewidth' : 1).

Scatter kulcsszavainknál állítsuk be a színt fehérre, az élszínt szürkere, az átlátszatlanságot pedig 0,4-re, és ezt a következőképpen írjuk: scatter_kws={“color” : „white”, 'edgecolor' : 'grey', 'alpha' : 0,4 ).

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a paraméterek egy kicsit más nézetet adnak az alábbiakban.

Python-korreláció: Útmutató a látványelemek létrehozásához

Python korreláció: korrelációs mátrix létrehozása

Eddig csak két változót tartalmazó szóródási diagramokat néztünk, de érdemes megnéznünk az összes változókorrelációnkat is.

Ezt az adatkészletünk segítségével hajtjuk végre egy adatkeret-függvénnyel, az úgynevezett korrelációval, amely dataset.corr. És amit kapunk, az egy mátrix, amely megmutatja nekünk az egyes változók közötti összefüggéseket.

Python-korreláció: Útmutató a látványelemek létrehozásához

A fenti táblázatban szereplő számok a Pearson-korrelációt jelentik , amely az összes változó közötti lineáris kapcsolatra összpontosít.

De ha nem vagyunk biztosak abban, hogy a változóink teljesen lineárisan korrelálnak-e, használhatunk más típusú korrelációt, amely inkább a hatásra összpontosít, mint a lineáris részre. Ezt Spearman-korrelációnak hívják .

Python-korreláció: Útmutató a látványelemek létrehozásához

Mindezekről a dolgokról pedig információkat láthatunk a Shift + Tab megnyomásával. Ha lefelé görget, láthatjuk a Spearman-féle rangkorrelációt, a Pearson-korrelációs együtthatót, és nagyon sok különböző módszert az adatok mérésére.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha visszatekintünk a korrelációs mátrixunkra, tudjuk, hogy az ár és a karát meglehetősen jól korrelál.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a mi ábrázolásunkból származnak, ami azt mutatja, hogy meglehetősen lineárisak 0,92-nél.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha most inkább a Spearman-korrelációt használjuk, akkor a hatás vagy a rang egy kicsit magasabb lesz, 0,96.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezek a különböző típusú korrelációk lehetővé teszik számunkra, hogy a változók közötti korreláció különböző attribútumait vegyük fel.

Több x egyváltozós korreláció

Néha nem akarjuk látni az a-t, mert jobban aggódunk az összes változó és egyetlen változó korrelációja miatt (pl. ár).

Amit tehetünk, hogy elkülönítjük az árat a dataset.corr használatával, amelyet a „price” követ .

Python-korreláció: Útmutató a látványelemek létrehozásához

Most láthatjuk, hogy az ár korrelál a táblázatban szereplő összes különböző numerikus változónkkal. És ennek oka a vizuális cselekmények miatt van.

Nézzük tehát a korrelációs mátrixunkat hőtérképpel.

Python-korreláció: Hőtérkép készítése

Ezt a korrelációs változót átadhatjuk egy Seaborn-nek az sns.heatmap függvény segítségével.

Python-korreláció: Útmutató a látványelemek létrehozásához

Így kapunk egy hőtérképet, amely így néz ki.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ismét hozzáadhatunk paramétereket a preferenciánkhoz. Átadhatjuk a linewidths=1 paramétert, és az annot=True használatával megjegyzéseket adhatunk hozzá .

Python-korreláció: Útmutató a látványelemek létrehozásához

És láthatja, hogy a hőtérképünk most egészen másképp néz ki. Most van egy nagyon szép hőtérképünk.

Python-korreláció: Útmutató a látványelemek létrehozásához

Láthatjuk a sorok és a megjegyzések hozzáadásának hasznosságát. Ismét, ha megnyomjuk a Shift + Tab billentyűket, akkor megjelenik az összes különböző paraméter, amelybe beleférhet.

Ezután próbálja meg hozzáadni a method='spearman ' paramétert a kódunkhoz, így tudni fogja, hogyan kell más típusú korrelációt használni a használati esettől függően.

Python-korreláció: Útmutató a látványelemek létrehozásához

Hőtérkép egy változóval

Ezután izolálunk egy változót, és létrehozunk egy hőtérképet, amelyben a korreláció negatívról pozitívra megy.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez az alábbi hőtérképet kapja.

Python-korreláció: Útmutató a látványelemek létrehozásához

Természetesen a stíluson is változtathatunk. Használhatjuk például a cmap paramétert a következőképpen: cmap='coolwarm' . Ez a színeket hidegre és melegre változtatja, és megszünteti a fekete hátterünket is.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ha a Futtatás gombra kattintunk , ezt a hőtérképet kapjuk alább. A hideghez a kék, a meleghez pedig a piros sávok vannak.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az irányt is megváltoztathatjuk, hogy a térképünket a színsávhoz igazítsuk. Ezt a sort_values paraméterünk szerkesztésével és az ascending=False hozzáadásával teheti meg .

Python-korreláció: Útmutató a látványelemek létrehozásához

Ez a leginkább korrelálttól (piros sáv) a legkevésbé korreláltig (kék sáv) fog menni.

Python-korreláció: Útmutató a látványelemek létrehozásához

Python-korreláció: Lépcsővizuál létrehozása

A korreláció megjelenítésének egyik fejlett módja az, ha egy maszkot használunk, amely blokkolja az összes már meglévő összefüggést.

Ezt megtehetjük a Numpy-val, néhány IGAZ és HAMIS függvény segítségével, hogy egy lépcsőházat vizualizáljunk összefüggéseinkhez.

Python-korreláció: Útmutató a látványelemek létrehozásához

Így kell kinéznie az eredményeknek.

Python-korreláció: Útmutató a látványelemek létrehozásához

Lássuk, hogyan tudjuk ezt átvezetni a LuckyTemplates-be.

Vizuális lépcsőház a LuckyTemplatesben

Először nyissa meg a LuckyTemplates alkalmazást. Behoztam egy avokádó adatkészletet, hogy más látványt lássunk. Ezt az adatkészletet a Mezők ablaktáblában láthatja. Inicializálja a vizualizációt a Python ikonra kattintva a Vizualizációk panelen.

Python-korreláció: Útmutató a látványelemek létrehozásához

Az adatkészletet úgy kell létrehoznunk, hogy hozzáadjuk az összes numerikus változót, amelyet a ? . Adja hozzá őket a változók melletti jelölőnégyzetekre kattintva.

Python-korreláció: Útmutató a látványelemek létrehozásához

Most, hogy van adatkészletünk, átléphetünk a Jupyter notebookunkba, és kimásolhatjuk a korábban birtokolt kódot.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezután átmásoljuk a kódot a LuckyTemplates Python szkriptszerkesztőjébe.

Python-korreláció: Útmutató a látványelemek létrehozásához

Ezután kiválasztjuk a látványtervünket, ami a lépcsőházi látvány lenne. Visszamegyünk a Jupyterhez, és kimásoljuk a kódot, amelyet a lépcsőház vizualizációjához használtunk.

Python-korreláció: Útmutató a látványelemek létrehozásához

Illessze be a kódot a Python szkriptszerkesztőbe.

Python-korreláció: Útmutató a látványelemek létrehozásához

Utolsó teendő, hogy győződjön meg arról, hogy plt.show -t használunk , amely szükséges a Python-szkriptben. Adja hozzá a plt.show-t a kód utolsó sorához, és kattintson a futtatás ikonra a szkriptszerkesztő jobb felső sarkában.

Python-korreláció: Útmutató a látványelemek létrehozásához

A nagyobb látvány érdekében feszítse meg egy kicsit a dobozt, hogy lássuk a sarokban futó szkriptet. Megvan a vizuális térképünk a hőtérképünkhöz, ami nagyon jól néz ki.

Python-korreláció: Útmutató a látványelemek létrehozásához

A LuckyTemplatesben pedig határozottan láthatjuk, hogyan változhat ez a látvány az adatkészlet szerint. Például rákattinthatunk a Szeletelő ikonra a Vizualizációk ablaktáblában, és a Mezők panelen a Típus lehetőségre léphetünk.

Ez megadja nekünk az adatkészletünkben szereplő két típust, a hagyományos és az organikus . Ha rákattintunk egy típusra, mondjuk organikusra , láthatjuk, hogy változik a hőtérkép.

Python-korreláció: Útmutató a látványelemek létrehozásához

A változtatások akkor is érvénybe lépnek, amikor legközelebb a hagyományos típusra kattintunk .

Python-korreláció: Útmutató a látványelemek létrehozásához

Ne feledje, hogy a szűrők működéséhez szükségünk van egy kategorikus változóra a szkriptünk adatkészletében. Amint látjuk, az általunk létrehozott adatkészlet tartalmazta a típust , amely lehetővé teszi a vizualizáció ilyen módon történő szűrését.

Python-korreláció: Útmutató a látványelemek létrehozásához

Következtetés

Ebben a blogban megtanulta, hogyan lehet megjeleníteni a korrelációkat Pythonban és LuckyTemplates különböző módszerekkel, például Pearson-korrelációval és Spearman-rangkorrelációval.

Mostantól szóródási diagramokat, regressziós diagramokat, korrelációs mátrixot, hőtérképeket és lépcsőházi vizualizációkat hozhat létre, hogy a legjobb képet kapja adatkészletéhez. Számos paramétert használhat a stílusok és látványelemek javítására.

Minden jót,

E-mail melléklet mentése SharePointba a Power Automate segítségével

Ebből a blogból megtudhatja, hogyan mentheti automatikusan az e-mail mellékleteket a SharePointba, majd törölheti az e-maileket a Power Automate segítségével.

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Power Automate folyamatok létrehozása a semmiből

Ismerje meg, hogyan hozhat létre <strong>Power Automate</strong> folyamatokat a semmiből. Sablon használata helyett mi magunk hozzuk létre a kiváltó okokat és a műveleteket.

4 módszer a Pi használatára a Pythonban példákkal

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Ebben az útmutatóban bemutatom, hogyan lehet Pénzügyi információk mátrixát létrehozni a Profit és veszteség (P&L) kimutatással a LuckyTemplates alkalmazásban.

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Fedezze fel, hogyan lehet dinamikusan egyesíteni oszlopokat a Power Query Table.CombineColumns függvény segítségével.

SharePoint-fájlok hozzáadása a számítógéphez

Ismerje meg, hogyan adhatjuk hozzá és szinkronizálhatjuk SharePoint-fájljainkat az asztalon és a OneDrive-on.

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.

Python-korreláció: Útmutató a látványelemek létrehozásához

Leave a Comment

E-mail melléklet mentése SharePointba a Power Automate segítségével

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Power Automate folyamatok létrehozása a semmiből

4 módszer a Pi használatára a Pythonban példákkal

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

SharePoint-fájlok hozzáadása a számítógéphez

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

LuckyTemplates mobil jelentéskészítési tippek és technikák

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben