Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Kun työskentelet useista muuttujista koostuvan tietojoukon kanssa, on parasta pystyä ymmärtämään, miten nämä eroavat toisistaan ​​ja miten ne ovat vuorovaikutuksessa keskenään. Tässä opetusohjelmassa aion osoittaa, kuinka voit käyttää Pythonin Seaborn-funktiota visualisoidaksesi vaihtoehtoja muuttujan jakaumille. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Sisällysluettelo

Seaborn-funktion käyttäminen Pythonissa

Näytän tämän MPG-tietojoukossa, joka on saatavilla Seabornissa. Joten mennään eteenpäin ja tuodaan kaikki tarvitsemamme paketit sekä kaikki tarvitsemamme tiedot. Aiomme tarkastella MPG-muuttujien jakautumista täällä ja kuinka ne vaihtelevat. Kaksi yleistä tapaa tehdä tämä ovat histogrammi ja boxplot .

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Joten aion käyttää dispot -toimintoa (DIS jakeluun). Sitten minun on määritettävä, mikä tietojoukko se on ja mikä muuttuja laitamme X-akselille. Ja sen myötä meillä on jakelu.

Tämä on aika hyvä. Tästä on erittäin helppo nähdä koko jakauma ja muoto. Pari puutetta tässä jakelun visualisoinnissa kuitenkin. Yksi on se, että käyttämiemme roskakorien määrä on luultavasti mielivaltainen. Toinen asia on, että emme välttämättä voi tietää heti, mikä muuttujan keskiarvo on.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Hienoa Seabornissa on se, että kun olen määrittänyt haluamasi muuttujan, missä ja mitä datajoukkoa käytän, se on todella plug and-chug uuden visualisoinnin tekeminen. Nyt mennään boxplotille. Boxplot ei käytä roskakoria.

Ajatuksena tässä on, että voimme nähdä kvartiilin arvon todella selkeästi, erityisesti mediaanin, ja näemme muut kvartiiliarvot. Näemme, että siellä on poikkeama, ja tämä on erittäin tarkka juoni. Ongelma boxplotissa on, että se on tarkka asioissa, joista monet yrityskäyttäjät eivät yleensä välitä.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Joten, tämä juoni on hieman vaikea ei-tilastollisten ihmisten saada todella paljon arvoa. Ja jälleen kerran, se kokoaa tietoja, joten menetämme paljon yksityiskohtia. On vaikea tietää tarkalleen, miltä tämä näyttää. Voimme nähdä, että siellä on poikkeama. Näemme, että suurin osa arvoista on täällä. Histogrammi antaa meille intuitiivisemman tavan tarkastella sitä.

Nämä ovat molemmat hyviä juonia. Molemmilla on tarkoituksensa. Katsotaanpa joitain vaihtoehtoja käyttämällä Seabornia visualisointiin. Pysymme MPG:ssä tuon muuttujan jakamisessa.

Kuten boxplotissa, näet tässä, että mediaani on selvästi merkitty. Näemme myös kvartiilialueen ja voimme saada paremman kuvan kokonaisjakaumasta. Tämä on myös eräänlainen histogrammi. Sitä kutsutaan ytimen tiheysestimaattikuvaajaksi tai KDE-kuvaajaksi. Se on sileä versio histogrammista. Emme käytä mielivaltaista binningiä. Täällä kaikki on tasoitettu jatkuvaksi alueeksi.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Tämä on eräänlainen näiden kahden lähestymistavan yhdistelmä ja todella hoitaa joitakin puutteita. Yleisöstäsi riippuen heillä saattaa kuitenkin olla vaikeuksia katsoa tätä. He eivät ehkä ole tottuneet siihen, mutta sillä on joitain etuja perinteisiin lähestymistapoihin verrattuna.

Tässä lähestymistavassa emme enää kokoa tietoja. Jokainen yksittäinen piste piirretään. Tämä vie osia sirontakuvasta, eikö niin? Jos ajattelet sirontakuvaajaa, piirrämme jokaisen yksittäisen pisteen X- ja Y-koordinaateille.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Lopuksi meillä on stripplot . Me otamme sen jakelun ja hajoamme satunnaisesti. Tämä on satunnainen prosessi. Emme yritä enää tehdä tuota jakelumuotoa. Ongelma tässä on, että meillä on kaikki nämä rypäleet törmäävät toisiinsa, joten se ei ehkä ole hyvä riippuen siitä, mitä yrität tehdä. Ehkä haluat värittää nämä ryhmittäin tai jotain vastaavaa, joten siihen on vaihtoehto.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Voimme muuttaa värinän arvoon 0,25 ja nähdä, että kun lisäämme värinää, nämä kohdat leviävät hieman enemmän.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Kuitenkin joka kerta kun käytän niitä, ne näyttävät hieman erilaisilta. Joten jos haluat päästä eroon siitä ja tehdä siitä samanlaisen joka kerta, voit tuoda numpyn nimellä np . Tämä on niin sanottu satunnaisen siemenen asettaminen.

Joka kerta kun suoritan jotain, joka liittyy satunnaislukuihin, se käyttää samoja satunnaislukuja. Asiat eivät muutu satunnaisesti, kun suoritat sen uudelleen. Tämä voisi olla hyvä kaikenlaisessa tekemässäsi simulaatiossa, jota tapahtuu paljon datatieteessä ja analytiikassa myös tällä visualisoinnilla. Joten nyt, joka kerta kun toteutan tätä juoni, saamme siitä saman ilmeen.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Voin myös lisätä tähän Y-alkuperän, ja nyt näemme, että olemme luomassa kaksivarianttijakaumaa. Otamme mittarilukemajakauman ja segmentoimme sen alkuperän mukaan.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi




Johtopäätös

Nämä ovat vaihtoehtoja yhden muuttujan jakaumien visualisoinnille. Niillä kaikilla on hyvät ja huonot puolensa. Tämä ei tarkoita sitä, että älä koskaan käytä boxplotia tai histogrammia, mutta se tarkoittaa vain, että tässä on joitain muita vaihtoehtoja sen mukaan, mitä yrität näyttää.

Ne ovat kaikki yhtä helppoja tehdä kuin muutkin, kun käytämme Pythonissa Seaborn-toimintoa. Jos haluat tietää lisää, tutustu alla oleviin linkkeihin.

Kaikki parhaat!


Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Opi lataamaan ja asentamaan DAX Studio ja Tabular Editor 3 ja miten ne määritetään käytettäväksi LuckyTemplatesissa ja Excelissä.

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

Tämä blogi sisältää Shape Map -visualisoinnin tilaanalyysiä varten LuckyTemplatesissa. Näytän sinulle, kuinka voit käyttää tätä visualisointia tehokkaasti sen ominaisuuksien ja elementtien kanssa.

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

Tässä opetusohjelmassa esittelen ainutlaatuisen idean talousraportoinnista, joka allokoi tulokset LuckyTemplatesin sisällä olevien taulukkopohjien ennalta määrittämiseen.

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

Luo DAX-suureita LuckyTemplatesissa käyttämällä olemassa olevia suureita tai kaavoja. Tätä kutsun mittahaaroitustekniikaksi.

Tehokkain toimintopuhelu LuckyTemplatesissa

Tehokkain toimintopuhelu LuckyTemplatesissa

Tässä blogissa tutustu LuckyTemplates-tietojoukkoon, tehokkaimpaan funktiokutsuun, joka tuo tuhansia M- ja DAX-funktioita sormiesi ulottuville.

Datamallinnustekniikat DAX-mittausten järjestämiseen

Datamallinnustekniikat DAX-mittausten järjestämiseen

Tämän päivän opetusohjelmassa jaan muutamia datamallinnustekniikoita DAX-mittausten järjestämiseksi paremmin tehokkaamman työnkulun aikaansaamiseksi.

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates on loistava työkalu talousraportointiin. Tässä on opetusohjelma räätälöityjen taulukoiden luomisesta LuckyTemplates-talouden hallintapaneelillesi.

Power Queryn kielivirran parhaat käytännöt

Power Queryn kielivirran parhaat käytännöt

Tässä opetusohjelmassa keskustellaan Power Query Language Flowsta ja siitä, kuinka se voi auttaa luomaan sujuvan ja tehokkaan dataraportin.

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

Keskustelen yhdestä suosikkitekniikoistani mukautettujen LuckyTemplates-kuvakkeiden ympärillä, joka käyttää mukautettuja kuvakkeita dynaamisella tavalla LuckyTemplates-visuaaleissa.

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

Tässä blogissa näytän sinulle, kuinka voit luoda LuckyTemplates-taulukoita käyttämällä kaavaa, joka yhdistää UNION-funktion ja ROW-funktion.