Tietojoukot Pandaissa ProfileReport() -sovelluksella | Python LuckyTemplatesissa

Yksi yleisimmistä kysymyksistä, joita kohtaat tietoanalyytikona, on, mikä on paras tapa tutkia tiettyä tietojoukkoa. Tämä on tärkeä näkökohta ensisijaisesti, jos haluat koota kaikki tiedot yhteen raporttiin, jonka itse tai tiimisi on helppo tulkita. Tässä opetusohjelmassa aion näyttää, kuinka voit tutkia tehokkaasti Pandassa olevia tietojoukkoja ProfileReport()-toiminnon avulla. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Mitä teet, kun saat tietojoukon? Miten tutkit tietojoukkoa? Ensisijaisesti, jos haluat koota kaiken helposti luettavaksi raportiksi itsellesi, työtovereillesi jne., sinulla on paljon pohdittavaa.

Ensinnäkin mietit, minkälaisia ​​muuttujia ne ovat, koska se vaikuttaa siihen, miten analysoit niitä ja miten käsittelet niitä. Data tarkoittaa sitä, mitä annetaan. Joten puuttuu se tieto, jota meillä ei ole. Toinen asia on visualisoida nuo suhteet. Miltä he näyttävät? Haluamme käyttää tuota visualisointivoimaa aikaisin ja usein.

Nämä ovat monia toisiinsa liittyviä monimutkaisia ​​kysymyksiä. Hyvä asia on, että saatavilla on tämä profilointiraporttitoiminto, joka antaa meille vastaukset. Katsotaanpa siis kaikkea sitä Pythonissa.

Sisällysluettelo

Tutustu Pandan tietosarjoihin ProfileReport()-funktion avulla

Ensin aiomme ladata tietojoukon.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Sitten tuomme pandas_profiling -sovelluksesta tämän profiilin raportin. Nyt, jos saat virheilmoituksen, sinun on luultavasti asennettava se. Käytän Anacondaa. Suosittelen sinuakin käyttämään sitä. Suoritetaan tämä ja tulostetaan se.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Joten tässä se on. Meillä on yleiskatsaus . Tämä antaa meille erittelyn muuttujatyypeistä. Meillä on tietojoukon tilastot. Näemme rivisarakkeiden määrän, niin edelleen ja niin edelleen. Hienoa tässä raportissa on, että se on kuin yhden luukun palvelu ja se näyttää myös todella mukavalta. Siinä on erittäin houkutteleva esitys.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Selaamme tänne alas ja meillä on. Saamme visualisoinnin ja voimme vaihtaa muuttujan lisätietoja. Meillä on liput, jotka osoittavat asioita, jotka voivat olla hieman epätavallisia. Meillä on myös nämä hälytykset ja monet muut ominaisuudet, jotka antavat meille lisätietoja. Ja tämä koskee jokaista muuttujaa.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Kun jatkamme vierittämistä alaspäin, löydämme Interactions-kohdan, jossa se luo sirontakaavioita tietojen visualisoimiseksi.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Ja sitten meillä on Korrelaatiot , joka tiivisti suhteen.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Seuraava on, jotka ovat erittäin tärkeitä. Kuten näet, meiltä puuttuu joitakin arvoja, ja haluamme tietää miksi. Näiden visualisointien tarkoitus on auttaa meitä siinä. Voimme napsauttaa jokaisen visuaalin läpi ja analysoida tiedot.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa

Lopuksi meillä on näyte. Voisimme saada tämän monella tapaa, mutta kaikki tämä on vain muutaman ensimmäisen rivin tulostaminen, mikä on hyvä tietää.

Tietojoukot Pandaissa ProfileReport() -sovelluksella |  Python LuckyTemplatesissa




Johtopäätös

Näin voit tutkia tietojoukkoja Pandasissa ProfileReport()-funktion avulla. On monia tapoja viipaloida ja pilkkoa tietoja. Ajattele kaikkia datan permutaatioiden yhdistelmiä. Tämä ei voi tehdä kaikkea puolestasi, mutta se on todella hyvä alku.

Kun tutkimme dataa, se on todella iteratiivinen prosessi. Ei ole olemassa yksittäistä taikapilleriä niin paljon kuin haluaisimme. ProfilerReport() on kuitenkin todella loistava työkalu. Saamme paljon tietoa ja vain yhden rivin koodia. Tämä on ilmainen työkalu, joten toivon, että voit käyttää sitä omassa työssäsi. Kerro meille, miten teet sen.

Kaikki parhaat!


Päivämäärätaulukon luominen LuckyTemplatesissa

Päivämäärätaulukon luominen LuckyTemplatesissa

Ota selvää, miksi LuckyTemplatesissa on tärkeää pitää oma päivämäärätaulukko ja opi nopein ja tehokkain tapa tehdä se.

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

Tämä lyhyt opetusohjelma korostaa LuckyTemplates-mobiiliraportointiominaisuutta. Näytän sinulle, kuinka voit kehittää raportteja tehokkaasti mobiililaitteille.

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Tässä LuckyTemplates Showcase -esittelyssä käymme läpi raportteja, jotka näyttävät ammattitaitoisen palveluanalytiikan yritykseltä, jolla on useita sopimuksia ja asiakkaiden sitoumuksia.

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Käy läpi tärkeimmät Power Appsin ja Power Automaten päivitykset sekä niiden edut ja vaikutukset Microsoft Power Platformiin.

Yleiset SQL-funktiot: Yleiskatsaus

Yleiset SQL-funktiot: Yleiskatsaus

Tutustu joihinkin yleisiin SQL-toimintoihin, joita voimme käyttää, kuten merkkijono, päivämäärä ja joitain lisätoimintoja tietojen käsittelyyn tai käsittelyyn.

LuckyTemplates-mallin luominen: opas ja vinkkejä

LuckyTemplates-mallin luominen: opas ja vinkkejä

Tässä opetusohjelmassa opit luomaan täydellisen LuckyTemplates-mallin, joka on määritetty tarpeidesi ja mieltymystesi mukaan.

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Tässä blogissa esittelemme, kuinka kerrostat kenttäparametreja pienillä kerroilla uskomattoman hyödyllisten näkemysten ja visuaalien luomiseksi.

LuckyTemplates-sijoitus ja mukautettu ryhmittely

LuckyTemplates-sijoitus ja mukautettu ryhmittely

Tässä blogissa opit käyttämään LuckyTemplates-sijoitus- ja mukautettuja ryhmittelyominaisuuksia näytetietojen segmentoimiseen ja luokitteluun kriteerien mukaan.

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

Tässä opetusohjelmassa käsittelen tiettyä tekniikkaa, jolla voit näyttää kumulatiivisen kokonaissumman LuckyTemplates-visuaaleissasi vain tiettyyn päivämäärään asti.

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Opi luomaan ja mukauttamaan Bullet-kaavioita LuckyTemplatesissa, joita käytetään pääasiassa suorituskyvyn mittaamiseen suhteessa tavoitteeseen tai edellisiin vuosiin.