Python-korrelaatio: opas visuaalien luomiseen

Tämänpäiväisessä blogissa käymme läpi korrelaation visualisointiprosessin ja näiden visuaalien tuomisen LuckyTemplatesiin. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Sisällysluettelo

Korrelaatioiden ymmärtäminen

Tässä on hieno kuva, joka näyttää erityyppiset korrelaatiot. 

Python-korrelaatio: opas visuaalien luomiseen

Vasemmalta alkaen meillä on täydellinen positiivinen korrelaatio , mikä tarkoittaa, että sen korrelaatioarvo on 1. Sitten sitä seuraavat positiiviset korrelaatiot laskevassa järjestyksessä, mikä johtaa 0:aan. 

Keskimmäinen kaavio ei näytä korrelaatiota, mikä viittaa korrelaatioarvoon, joka on yhtä suuri kuin 0. 

Lopuksi oikealla puolella on laskevia negatiivisten korrelaatioiden arvoja nollasta. Oikeanpuoleisin kaavio on täydellinen negatiivinen korrelaatio , jonka korrelaatioarvo on -1.

Python-korrelaatiopaketit

Käytämme tässä opetusohjelmassa neljää pakettia. Ensimmäinen pakettimme on Pandas , jota käytetään tietojen käsittelyyn ja tallennetaan muuttujaksi pd

Visualisointiin käytämme Matplotlib , joka on tallennettu plt- muuttujaksi näiden toimintojen helpottamiseksi. Seaborn , tilastollinen visualisointikirjastomme, tallennetaan nimellä sns . Ja lopuksi Numpy , joka tallennetaan nimellä np , käytetään lineaarisessa algebrassa. 

Python-korrelaatio: opas visuaalien luomiseen

Dataa varten käytämme Seabornin mallitietojoukkoa. Sitten sns-muuttujan avulla tuomme timanttitietojoukon alla olevan kuvan mukaisesti. .

Python-korrelaatio: opas visuaalien luomiseen

Tietojen attribuutit

Voimme tarkastella tietojemme attribuutteja dataset.info-funktion avulla . Tämä toiminto näyttää meille kaikki eri tietotyypit, kuten alla olevassa viimeisessä sarakkeessa näkyy.

Python-korrelaatio: opas visuaalien luomiseen

Huomaa, että korrelaatio toimii vain numeeristen muuttujien kanssa, joten aiomme tarkastella numeerisia muuttujia suurimman osan ajasta. Opimme kuitenkin myös käyttämään joitakin kategorisista muuttujista visualisointiin. 

Python-korrelaatiotietojoukko

Käyttämällä funktiopäätä, joka on kirjoitettu muodossa dataset.head , saamme datamme viisi ylintä riviä, joiden pitäisi näyttää tältä.

Python-korrelaatio: opas visuaalien luomiseen

Ensimmäisessä sarakkeessa on karaatti , jota seuraavat kategoriset muuttujat leikkaus , väri ja selkeys sekä loput tiedoista numeeriset arvot. 

Python-korrelaatio: Sirontakuvaajan luominen

Kun visualisoidaan korrelaatioita ja tarkastellaan kahta muuttujaa, katsomme yleensä . 

Siten olemme Seaborn-kirjastoa käyttämällä luoneet sirontakuvaajamme käyttämällä sirontadiagrammitoimintoa, jossa välitimme yllä tallentamamme tiedot data=tietojoukkona . Sitten tunnistimme X- ja Y-muuttujat - karaatti ja hinta

Python-korrelaatio: opas visuaalien luomiseen

Tässä on Seaborn-kirjastolla tehty sirontakuvamme. 

Python-korrelaatio: opas visuaalien luomiseen

Voit nähdä, että tämä sirontakuvaaja on melko tiheä. Tämä johtuu siitä, että meillä on noin 54 000 riviä tietoja, eivätkä pisteet välttämättä ole esitetty parhaalla tavalla.

Voimme painaa Shift + Tab-näppäimiä nähdäksesi erilaisia ​​tapoja muotoilla sirontakuvaajaa. Se näyttää meille luettelon erilaisista parametreista, jotka voimme lisätä sirontakaavioomme. 

Python-korrelaatio: opas visuaalien luomiseen

Vieritä alaspäin antaa meille tietoa siitä, mitä kukin luetelluista parametreista tekee. 

Python-korrelaatio: opas visuaalien luomiseen

Muut sirontakuvaajan parametrit

Sukellaanpa vähän. Voimme tehdä viivanleveydeksi 0, koska valkoiset viivat ensimmäisessä, alla esitetyssä sirontakuvaajassamme hämärtävät asioita. 

Python-korrelaatio: opas visuaalien luomiseen

Haluamme myös säätää alfaa, jotta voimme hallita opasiteettia. Käytämme esimerkissämme arvoa alfa=0.2 . Mutta tietysti voit muuttaa sen myös 0,1:ksi. 

Python-korrelaatio: opas visuaalien luomiseen

Jos lisäämme nämä parametrit ja napsautamme Suorita , voit nähdä, että sirontakuvaamme muuttuu läpinäkymättömämmiksi ilman valkoisia viivoja. 

Python-korrelaatio: opas visuaalien luomiseen

Voit leikkiä parametreilla saadaksesi parhaan etsimäsi visuaalisen kuvan. 

Kategoristen muuttujien käyttö

Voimme myös hyödyntää joitain kategorisista muuttujistamme visuaalisuuden parantamiseksi. Tiedämme esimerkiksi, että tiedoissamme on timanttihionta

Voimme ohittaa leikkausluokan käyttämällä sävyparametria muodossa hue ='cut'. Tämä antaa meille mahdollisuuden visualisoida nämä kohdat vaihtamalla värejä. 

Python-korrelaatio: opas visuaalien luomiseen

Tietysti voimme lisätä muita parametreja, kuten esimerkiksi alfa. Voimme lisätä sen uudelleen, asettamalla arvoksi 0,2, ja nähdä, kuinka se muuttaa visuaalista ilmettä. Napsauta Suorita ja näet pienen eron. 

Python-korrelaatio: opas visuaalien luomiseen

Voimme leikkiä parametreilla saadaksemme etsimämme visuaalin. Voimme myös käyttää erilaisia ​​luokkia, kuten selkeyttä, mikä antaa meille selkeysluokat ja antaa myös hieman erilaisen kuvan tuosta sironnasta.

Python-korrelaatio: opas visuaalien luomiseen

Korrelaatio muiden muuttujien kanssa

Saatat myös olla kiinnostunut siitä, miten muut arvot korreloivat keskenään kuin hinta ja karaatti. Joten jos tarkastelemme taulukon sirontakuvaajaa , joka on timantin ja  syvyyden numeerinen ulottuvuus , voimme nähdä, ettei yksi-yhteen lineaarista suhdetta ole.

Python-korrelaatio: opas visuaalien luomiseen

Voimme myös tarkastella kahta muuta muuttujaa, kuten syvyyttä ja hintaa . Kaavion perusteella voimme nähdä, että data keskittyy keskialueen ympärille.

Python-korrelaatio: opas visuaalien luomiseen

Python-korrelaatio: Regressiokaavion luominen

Siirrytään siihen, mitä kutsumme regressiokaavioksi, jonka avulla voimme arvioida kahden muuttujan välisen lineaarisen suhteen. 

Joten scatter plot -funktion sijasta käytämme tällä kertaa regplot- funktiota. Välitämme samassa rakenteessa – tietomme sitten X- ja Y-muuttujat. 

Python-korrelaatio: opas visuaalien luomiseen

Tulos näyttää rivin, joka mittaa muuttujien välistä lineaarista suhdetta. On myös ilmeistä, kuinka arvomme kiertävät tuon regressioviivan ympärillä.

Python-korrelaatio: opas visuaalien luomiseen

Tämä ei ole kovin kaunis visuaalinen tällä hetkellä, mutta voimme silti optimoida sen saadaksemme paremman. Voimme esimerkiksi välittää tyylissä Matplotlib-muuttujan avulla. Voimme muuttaa tyylin tummaksi käyttämällä koodia plt.style.use('dark_background'). 

Python-korrelaatio: opas visuaalien luomiseen

Otetaan tämä sama regressiokaavio ja välitetään joitain avainsanoja sirontallemme ja viivallemme. Käytämme punaista väriä ja viivan leveyttä 1 regressioviivaamme. Tämä kirjoitetaan muodossa line_kws={"color" : "red", 'linewidth' : 1). 

Aseta hajonta-avainsanoillemme väriksi valkoinen, reunaväriksi harmaaksi ja peittävyydeksi 0,4, joka kirjoitetaan muodossa scatter_kws={“color” : “white”, 'edgecolor' : 'grey', 'alpha' : 0,4 ). 

Python-korrelaatio: opas visuaalien luomiseen

Nämä parametrit antavat meille hieman erilaisen kuvan alla. 

Python-korrelaatio: opas visuaalien luomiseen

Python-korrelaatio: Korrelaatiomatriisin luominen

Toistaiseksi olemme tarkastelleet sirontakaavioita, joissa on vain kaksi muuttujaa, mutta voimme myös haluta tarkastella kaikkia muuttujien korrelaatioita.

Tämä suoritetaan käyttämällä tietojoukkoamme datakehysfunktiolla, jota kutsutaan korrelaatioksi ja jota edustaa dataset.corr. Ja saamme matriisin, joka näyttää meille korrelaatiot kunkin näistä muuttujista. 

Python-korrelaatio: opas visuaalien luomiseen

Yllä olevan taulukon luvut edustavat Pearson-korrelaatiota , joka keskittyy kaikkien näiden muuttujien väliseen lineaariseen suhteeseen. 

Mutta jos emme ole varmoja, korreloivatko muuttujamme täysin lineaarisesti, voimme käyttää erityyppistä korrelaatiota, joka keskittyy enemmän vaikutukseen kuin lineaariseen osaan. Sitä kutsutaan Spearman-korrelaatioksi

Python-korrelaatio: opas visuaalien luomiseen

Ja voimme nähdä tiedot kaikista näistä asioista painamalla Shift + Tab. Jos vierität alaspäin, näemme Spearman-arvokorrelaation, Pearson-korrelaatiokertoimen ja melko paljon erilaisia ​​tapoja mitata tietojamme. 

Python-korrelaatio: opas visuaalien luomiseen

Kun katsomme takaisin korrelaatiomatriisiimme aikaisemmin, tiedämme, että hinta ja karaatti korreloivat melko hyvin.

Python-korrelaatio: opas visuaalien luomiseen

Ne ovat meidän tontistamme osoittaen, että ne ovat melko lineaarisia 0,92:ssa. 

Python-korrelaatio: opas visuaalien luomiseen

Jos nyt käytämme sen sijaan Spearman-korrelaatiota, vaikutus tai sijoitus on hieman korkeampi, 0,96.

Python-korrelaatio: opas visuaalien luomiseen

Nämä erityyppiset korrelaatiot antavat meille mahdollisuuden poimia erilaisia ​​korrelaatioattribuutteja näiden muuttujien välillä. 

Multiple x Single Variable Correlation

Joskus emme halua nähdä aa, koska olemme enemmän huolissamme kaikkien muuttujien korrelaatiosta vain yhden muuttujan kanssa (esim. hinta).

Voimme sitten eristää hinnan käyttämällä dataset.corr-komentoa , jota seuraa 'price'

Python-korrelaatio: opas visuaalien luomiseen

Nyt voimme nähdä, että hinta korreloi kaikkien tässä taulukossa olevien numeeristen muuttujiemme kanssa. Ja syy, miksi saatamme haluta tehdä tämän, on visuaalinen juoni. 

Tarkastellaanpa siis korrelaatiomatriisimme visualisointia lämpökartalla.

Python-korrelaatio: lämpökartan luominen

Voimme välittää tämän korrelaatiomuuttujan Seaborniin funktiolla sns.heatmap.

Python-korrelaatio: opas visuaalien luomiseen

Tämä antaa meille lämpökartan, joka näyttää tältä.

Python-korrelaatio: opas visuaalien luomiseen

Jälleen voimme lisätä parametreja mieltymyksiimme. Voimme välittää parametrin linewidths=1 ja lisätä huomautuksia komennolla annot=True

Python-korrelaatio: opas visuaalien luomiseen

Ja voit nähdä, että lämpökarttamme näyttää nyt aivan erilaiselta. Tällä hetkellä meillä on aika kiva lämpökartta. 

Python-korrelaatio: opas visuaalien luomiseen

Näemme rivien ja merkintöjen lisäämisen hyödyllisyyden. Jälleen, jos painamme Shift + Tab, kaikki eri parametrit, jotka voivat mennä siihen, tulevat näkyviin. 

Yritä seuraavaksi lisätä method='spearman ' koodiimme, jotta tiedät kuinka käyttää erityyppistä korrelaatiota käyttötapauksestasi riippuen. 

Python-korrelaatio: opas visuaalien luomiseen

Lämpökartta yhdellä muuttujalla

Seuraavaksi eristetään yksi muuttuja ja luodaan lämpökartta, jossa korrelaatio siirtyy negatiivisesta positiiviseen.

Python-korrelaatio: opas visuaalien luomiseen

Tämä antaa meille tämän lämpökartan alla.

Python-korrelaatio: opas visuaalien luomiseen

Voimme varmasti muuttaa myös tyyliä. Voimme esimerkiksi käyttää cmap- parametria muodossa cmap='coolwarm' . Tämä muuttaa värit viileiksi ja lämpimiksi ja poistaa myös mustan taustamme. 

Python-korrelaatio: opas visuaalien luomiseen

Jos napsautamme Suorita , saamme tämän lämpökartan alla. Viileälle meillä on sininen ja sitten lämpimälle punaiset palkit. 

Python-korrelaatio: opas visuaalien luomiseen

Voimme myös muuttaa suuntaa kohdistaaksemme karttamme väripalkin kanssa. Tämä tehdään muokkaamalla sort_values- parametriamme ja lisäämällä ascending=False

Python-korrelaatio: opas visuaalien luomiseen

Tämä siirtyy eniten korreloivasta (punainen palkki) vähiten korreloituvaan (siniseen palkkiin). 

Python-korrelaatio: opas visuaalien luomiseen

Python-korrelaatio: Portaikkovisuaalin luominen

Yksi kehittynyt tapa visualisoida korrelaatiomme on käyttää maskia estämään kaikki korrelaatiot, jotka olemme jo tehneet. 

Voimme tehdä tämän Numpylla käyttämällä joitain TRUE- ja FALSE-funktioita luodaksemme visuaalisen portaat korrelaatioillemme. 

Python-korrelaatio: opas visuaalien luomiseen

Tältä tulosten pitäisi näyttää.

Python-korrelaatio: opas visuaalien luomiseen

Katsotaanpa, kuinka voimme siirtää tämän LuckyTemplatesiin.

Staircase Visual LuckyTemplatesissa

Avaa ensin LuckyTemplates. Olen tuonut avokadotietojoukon, jotta voimme nähdä erilaisen visuaalisen kuvan. Näet tämän tietojoukon Kentät-ruudussa. Alusta visualisointi napsauttamalla Python-kuvaketta Visualisoinnit-ruudun alla. 

Python-korrelaatio: opas visuaalien luomiseen

Meidän on luotava tietojoukko lisäämällä kaikki numeeriset muuttujat, jotka on merkitty ? . Lisää ne napsauttamalla näiden muuttujien vieressä olevia valintaruutuja. 

Python-korrelaatio: opas visuaalien luomiseen

Nyt kun meillä on tietojoukko, voimme siirtyä Jupyter-muistikirjaamme ja kopioida tämän koodin, joka meillä oli aiemmin.

Python-korrelaatio: opas visuaalien luomiseen

Sitten kopioimme koodin LuckyTemplatesin Python-skriptieditoriin. 

Python-korrelaatio: opas visuaalien luomiseen

Seuraavaksi valitsemme visuaalimme, joka olisi portaikkovisuaali. Palaamme Jupyteriin, kopioimme koodin, jota käytimme portaikkovisuaalissamme.

Python-korrelaatio: opas visuaalien luomiseen

Liitä koodi Python-skriptieditoriin.

Python-korrelaatio: opas visuaalien luomiseen

Viimeinen asia on varmistaa, että käytämme plt.show -tiedostoa , joka vaaditaan Python-skriptissäsi. Lisää koodin viimeiselle riville plt.show ja napsauta komentosarjaeditorin oikeassa yläkulmassa olevaa suorituskuvaketta .

Python-korrelaatio: opas visuaalien luomiseen

Suuremman visuaalisen kuvan saamiseksi venyttele laatikkoa hieman, jotta voimme nähdä skriptin kulmassa. Meillä on visuaalinen lämpökarttamme, joka näyttää melko hyvältä.

Python-korrelaatio: opas visuaalien luomiseen

Ja LuckyTemplatesissa voimme varmasti nähdä, kuinka visuaalinen ilme voi muuttua tietojoukon mukaan. Voimme esimerkiksi napsauttaa Slicer- kuvaketta Visualisoinnit-ruudussa ja siirtyä kohtaan Kirjoita Kentät-ruudussa. 

Se antaa meille kaksi tyyppiä tietojoukostamme, perinteisen ja orgaanisen . Jos napsautamme yhtä tyyppiä, esimerkiksi orgaanista , voit nähdä lämpökartan muuttuvan. 

Python-korrelaatio: opas visuaalien luomiseen

Muutokset tulevat voimaan myös, kun napsautamme seuraavaksi perinteistä tyyppiä.

Python-korrelaatio: opas visuaalien luomiseen

Muista, että skriptimme tietojoukossa on oltava kategorinen muuttuja, jotta nämä suodattimet toimivat. Kuten näemme, luomamme tietojoukko sisälsi tyypin , jonka avulla pystyimme suodattamaan visuaalista sisältöä tällä tavalla. 

Python-korrelaatio: opas visuaalien luomiseen




Johtopäätös

Tässä blogissa opit visualisoimaan korrelaatioita Pythonissa ja LuckyTemplatesissa eri menetelmillä, kuten Pearson-korrelaatiolla ja Spearman-arvokorrelaatiolla. 

Nyt voit luoda sirontakaavioita, regressiokaavioita, korrelaatiomatriisia, lämpökarttoja ja portaikkovisuaalisia kuvia saadaksesi parhaan visuaalisen kuvan tietojoukostasi. Voit myös käyttää erilaisia ​​parametreja parantaaksesi tyylejä ja visuaalisia ominaisuuksia. 

Kaikki parhaat,


Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Opi lataamaan ja asentamaan DAX Studio ja Tabular Editor 3 ja miten ne määritetään käytettäväksi LuckyTemplatesissa ja Excelissä.

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

Tämä blogi sisältää Shape Map -visualisoinnin tilaanalyysiä varten LuckyTemplatesissa. Näytän sinulle, kuinka voit käyttää tätä visualisointia tehokkaasti sen ominaisuuksien ja elementtien kanssa.

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

Tässä opetusohjelmassa esittelen ainutlaatuisen idean talousraportoinnista, joka allokoi tulokset LuckyTemplatesin sisällä olevien taulukkopohjien ennalta määrittämiseen.

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

Luo DAX-suureita LuckyTemplatesissa käyttämällä olemassa olevia suureita tai kaavoja. Tätä kutsun mittahaaroitustekniikaksi.

Tehokkain toimintopuhelu LuckyTemplatesissa

Tehokkain toimintopuhelu LuckyTemplatesissa

Tässä blogissa tutustu LuckyTemplates-tietojoukkoon, tehokkaimpaan funktiokutsuun, joka tuo tuhansia M- ja DAX-funktioita sormiesi ulottuville.

Datamallinnustekniikat DAX-mittausten järjestämiseen

Datamallinnustekniikat DAX-mittausten järjestämiseen

Tämän päivän opetusohjelmassa jaan muutamia datamallinnustekniikoita DAX-mittausten järjestämiseksi paremmin tehokkaamman työnkulun aikaansaamiseksi.

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates on loistava työkalu talousraportointiin. Tässä on opetusohjelma räätälöityjen taulukoiden luomisesta LuckyTemplates-talouden hallintapaneelillesi.

Power Queryn kielivirran parhaat käytännöt

Power Queryn kielivirran parhaat käytännöt

Tässä opetusohjelmassa keskustellaan Power Query Language Flowsta ja siitä, kuinka se voi auttaa luomaan sujuvan ja tehokkaan dataraportin.

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

Keskustelen yhdestä suosikkitekniikoistani mukautettujen LuckyTemplates-kuvakkeiden ympärillä, joka käyttää mukautettuja kuvakkeita dynaamisella tavalla LuckyTemplates-visuaaleissa.

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

Tässä blogissa näytän sinulle, kuinka voit luoda LuckyTemplates-taulukoita käyttämällä kaavaa, joka yhdistää UNION-funktion ja ROW-funktion.