Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Kun työskentelet useista muuttujista koostuvan tietojoukon kanssa, on parasta pystyä ymmärtämään, miten nämä eroavat toisistaan ​​ja miten ne ovat vuorovaikutuksessa keskenään. Tässä opetusohjelmassa aion osoittaa, kuinka voit käyttää Pythonin Seaborn-funktiota visualisoidaksesi vaihtoehtoja muuttujan jakaumille. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Sisällysluettelo

Seaborn-funktion käyttäminen Pythonissa

Näytän tämän MPG-tietojoukossa, joka on saatavilla Seabornissa. Joten mennään eteenpäin ja tuodaan kaikki tarvitsemamme paketit sekä kaikki tarvitsemamme tiedot. Aiomme tarkastella MPG-muuttujien jakautumista täällä ja kuinka ne vaihtelevat. Kaksi yleistä tapaa tehdä tämä ovat histogrammi ja boxplot .

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Joten aion käyttää dispot -toimintoa (DIS jakeluun). Sitten minun on määritettävä, mikä tietojoukko se on ja mikä muuttuja laitamme X-akselille. Ja sen myötä meillä on jakelu.

Tämä on aika hyvä. Tästä on erittäin helppo nähdä koko jakauma ja muoto. Pari puutetta tässä jakelun visualisoinnissa kuitenkin. Yksi on se, että käyttämiemme roskakorien määrä on luultavasti mielivaltainen. Toinen asia on, että emme välttämättä voi tietää heti, mikä muuttujan keskiarvo on.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Hienoa Seabornissa on se, että kun olen määrittänyt haluamasi muuttujan, missä ja mitä datajoukkoa käytän, se on todella plug and-chug uuden visualisoinnin tekeminen. Nyt mennään boxplotille. Boxplot ei käytä roskakoria.

Ajatuksena tässä on, että voimme nähdä kvartiilin arvon todella selkeästi, erityisesti mediaanin, ja näemme muut kvartiiliarvot. Näemme, että siellä on poikkeama, ja tämä on erittäin tarkka juoni. Ongelma boxplotissa on, että se on tarkka asioissa, joista monet yrityskäyttäjät eivät yleensä välitä.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Joten, tämä juoni on hieman vaikea ei-tilastollisten ihmisten saada todella paljon arvoa. Ja jälleen kerran, se kokoaa tietoja, joten menetämme paljon yksityiskohtia. On vaikea tietää tarkalleen, miltä tämä näyttää. Voimme nähdä, että siellä on poikkeama. Näemme, että suurin osa arvoista on täällä. Histogrammi antaa meille intuitiivisemman tavan tarkastella sitä.

Nämä ovat molemmat hyviä juonia. Molemmilla on tarkoituksensa. Katsotaanpa joitain vaihtoehtoja käyttämällä Seabornia visualisointiin. Pysymme MPG:ssä tuon muuttujan jakamisessa.

Kuten boxplotissa, näet tässä, että mediaani on selvästi merkitty. Näemme myös kvartiilialueen ja voimme saada paremman kuvan kokonaisjakaumasta. Tämä on myös eräänlainen histogrammi. Sitä kutsutaan ytimen tiheysestimaattikuvaajaksi tai KDE-kuvaajaksi. Se on sileä versio histogrammista. Emme käytä mielivaltaista binningiä. Täällä kaikki on tasoitettu jatkuvaksi alueeksi.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Tämä on eräänlainen näiden kahden lähestymistavan yhdistelmä ja todella hoitaa joitakin puutteita. Yleisöstäsi riippuen heillä saattaa kuitenkin olla vaikeuksia katsoa tätä. He eivät ehkä ole tottuneet siihen, mutta sillä on joitain etuja perinteisiin lähestymistapoihin verrattuna.

Tässä lähestymistavassa emme enää kokoa tietoja. Jokainen yksittäinen piste piirretään. Tämä vie osia sirontakuvasta, eikö niin? Jos ajattelet sirontakuvaajaa, piirrämme jokaisen yksittäisen pisteen X- ja Y-koordinaateille.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Lopuksi meillä on stripplot . Me otamme sen jakelun ja hajoamme satunnaisesti. Tämä on satunnainen prosessi. Emme yritä enää tehdä tuota jakelumuotoa. Ongelma tässä on, että meillä on kaikki nämä rypäleet törmäävät toisiinsa, joten se ei ehkä ole hyvä riippuen siitä, mitä yrität tehdä. Ehkä haluat värittää nämä ryhmittäin tai jotain vastaavaa, joten siihen on vaihtoehto.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Voimme muuttaa värinän arvoon 0,25 ja nähdä, että kun lisäämme värinää, nämä kohdat leviävät hieman enemmän.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Kuitenkin joka kerta kun käytän niitä, ne näyttävät hieman erilaisilta. Joten jos haluat päästä eroon siitä ja tehdä siitä samanlaisen joka kerta, voit tuoda numpyn nimellä np . Tämä on niin sanottu satunnaisen siemenen asettaminen.

Joka kerta kun suoritan jotain, joka liittyy satunnaislukuihin, se käyttää samoja satunnaislukuja. Asiat eivät muutu satunnaisesti, kun suoritat sen uudelleen. Tämä voisi olla hyvä kaikenlaisessa tekemässäsi simulaatiossa, jota tapahtuu paljon datatieteessä ja analytiikassa myös tällä visualisoinnilla. Joten nyt, joka kerta kun toteutan tätä juoni, saamme siitä saman ilmeen.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi

Voin myös lisätä tähän Y-alkuperän, ja nyt näemme, että olemme luomassa kaksivarianttijakaumaa. Otamme mittarilukemajakauman ja segmentoimme sen alkuperän mukaan.

Seaborn-funktio Pythonissa muuttujan jakauman visualisoimiseksi




Johtopäätös

Nämä ovat vaihtoehtoja yhden muuttujan jakaumien visualisoinnille. Niillä kaikilla on hyvät ja huonot puolensa. Tämä ei tarkoita sitä, että älä koskaan käytä boxplotia tai histogrammia, mutta se tarkoittaa vain, että tässä on joitain muita vaihtoehtoja sen mukaan, mitä yrität näyttää.

Ne ovat kaikki yhtä helppoja tehdä kuin muutkin, kun käytämme Pythonissa Seaborn-toimintoa. Jos haluat tietää lisää, tutustu alla oleviin linkkeihin.

Kaikki parhaat!


Päivämäärätaulukon luominen LuckyTemplatesissa

Päivämäärätaulukon luominen LuckyTemplatesissa

Ota selvää, miksi LuckyTemplatesissa on tärkeää pitää oma päivämäärätaulukko ja opi nopein ja tehokkain tapa tehdä se.

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

Tämä lyhyt opetusohjelma korostaa LuckyTemplates-mobiiliraportointiominaisuutta. Näytän sinulle, kuinka voit kehittää raportteja tehokkaasti mobiililaitteille.

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Tässä LuckyTemplates Showcase -esittelyssä käymme läpi raportteja, jotka näyttävät ammattitaitoisen palveluanalytiikan yritykseltä, jolla on useita sopimuksia ja asiakkaiden sitoumuksia.

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Käy läpi tärkeimmät Power Appsin ja Power Automaten päivitykset sekä niiden edut ja vaikutukset Microsoft Power Platformiin.

Yleiset SQL-funktiot: Yleiskatsaus

Yleiset SQL-funktiot: Yleiskatsaus

Tutustu joihinkin yleisiin SQL-toimintoihin, joita voimme käyttää, kuten merkkijono, päivämäärä ja joitain lisätoimintoja tietojen käsittelyyn tai käsittelyyn.

LuckyTemplates-mallin luominen: opas ja vinkkejä

LuckyTemplates-mallin luominen: opas ja vinkkejä

Tässä opetusohjelmassa opit luomaan täydellisen LuckyTemplates-mallin, joka on määritetty tarpeidesi ja mieltymystesi mukaan.

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Tässä blogissa esittelemme, kuinka kerrostat kenttäparametreja pienillä kerroilla uskomattoman hyödyllisten näkemysten ja visuaalien luomiseksi.

LuckyTemplates-sijoitus ja mukautettu ryhmittely

LuckyTemplates-sijoitus ja mukautettu ryhmittely

Tässä blogissa opit käyttämään LuckyTemplates-sijoitus- ja mukautettuja ryhmittelyominaisuuksia näytetietojen segmentoimiseen ja luokitteluun kriteerien mukaan.

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

Tässä opetusohjelmassa käsittelen tiettyä tekniikkaa, jolla voit näyttää kumulatiivisen kokonaissumman LuckyTemplates-visuaaleissasi vain tiettyyn päivämäärään asti.

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Opi luomaan ja mukauttamaan Bullet-kaavioita LuckyTemplatesissa, joita käytetään pääasiassa suorituskyvyn mittaamiseen suhteessa tavoitteeseen tai edellisiin vuosiin.