Datasett i pandaer med profilrapport() | Python i LuckyTemplates

Et av de vanligste spørsmålene du vil møte som dataanalytiker er hva som er den beste måten å utforske et gitt datasett. Dette er en viktig faktor først og fremst hvis du ønsker å sette alle dataene sammen i en rapport som skal være enkel å tolke av deg selv eller teamet ditt. I denne opplæringen skal jeg demonstrere hvordan du effektivt kan utforske datasett i Pandas ved å bruke ProfileReport(). Du kan se hele videoen av denne opplæringen nederst på denne bloggen.

Når du får et datasett, hva gjør du? Hvordan utforsker du datasettet? Primært, hvis du ønsker å sette det hele sammen i en lettlest rapport for deg selv, for kollegaer osv., har du mange ting å vurdere.

Først tenker du på hva slags variabler de er fordi det kommer til å påvirke hvordan du analyserer dem og hvordan du behandler dem. Data betyr det som er gitt. Så det som mangler kommer til å være hvilke data vi ikke har. En annen ting er å visualisere disse forholdene. Hvordan ser de ut? Vi ønsker å bruke den visualiseringskraften tidlig og ofte.

Dette er mange komplekse spørsmål som henger sammen. Det gode er at det er denne profileringsrapportfunksjonen tilgjengelig som vil gi oss disse svarene. Så la oss se på alt dette i Python.

Innholdsfortegnelse

Utforsk datasett i pandaer ved å bruke ProfileReport()-funksjonen

Først skal vi laste inn datasettet.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Så, fra pandas_profiling , skal vi importere denne tingen som kalles profilrapport. Nå, hvis du får en feilmelding her, må du sannsynligvis installere den. Jeg bruker Anaconda. Jeg foreslår at du bruker det også. La oss kjøre dette, og så skrive det ut.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Så her er det. Vi har en oversikt . Dette gir oss en oversikt over variabeltypene. Vi har datasettstatistikken. Vi ser antall radkolonner, så videre og så videre. Det fine med denne rapporten er at den er som en one-stop shop, og den ser også veldig fin ut. Den har en veldig tiltalende presentasjon.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Vi scroller ned her og vi har. Vi får en visualisering, og vi kan bytte flere detaljer om variabelen. Vi har flagg som peker på ting som kan være litt uvanlige. Vi har også disse varslene, og mange andre funksjoner som vil gi oss mer informasjon. Og dette er for hver enkelt variabel.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Når vi fortsetter å rulle nedover, finner vi Interactions, hvor det er laget spredningsplott for å visualisere dataene.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Og så har vi Korrelasjoner , som oppsummerte forholdet.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Neste er, som er veldig viktige. Som du kan se, mangler vi noen verdier her, og vi vil vite hvorfor. Disse visualiseringene her er ment å hjelpe oss med det. Vi kan klikke gjennom hver visualisering og analysere dataene.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Til slutt har vi prøven. Vi kan få dette på mange måter, men alt dette gjør er bare å skrive ut de første radene, noe som er greit å vite.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates




Konklusjon

Det er slik du utforsker datasett i Pandas ved å bruke ProfileReport()-funksjonen. Det er mange måter å kutte og kutte dataene på. Tenk på alle kombinasjonene av permutasjoner av dataene. Dette kommer ikke til å kunne gjøre alt for deg, men det er en veldig god start.

Når vi utforsker data, er det egentlig en iterativ prosess. Det er ingen en-og-gjort magisk pille så mye som vi kanskje vil ha en. Imidlertid er ProfilerReport() virkelig et flott verktøy. Vi får mye informasjon og bare én kodelinje. Dette er et gratis verktøy, så jeg håper du kan bruke det i ditt eget arbeid. Fortell oss hvordan du gjør det.

Beste ønsker!

Leave a Comment

DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

Lær å bruke DAX Studio EVALUATE nøkkelordet med grunnleggende eksempler og få en bedre forståelse av hvordan dette kan hjelpe deg med databehandling.

Opprette en datotabell i LuckyTemplates

Opprette en datotabell i LuckyTemplates

Finn ut hvorfor det er viktig å ha en dedikert datotabell i LuckyTemplates, og lær den raskeste og mest effektive måten å gjøre det på.

LuckyTemplates Mobile Reporting Tips og teknikker

LuckyTemplates Mobile Reporting Tips og teknikker

Denne korte opplæringen fremhever LuckyTemplates mobilrapporteringsfunksjon. Jeg skal vise deg hvordan du kan utvikle rapporter effektivt for mobil.

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

I denne LuckyTemplates-utstillingen vil vi gå gjennom rapporter som viser profesjonell tjenesteanalyse fra et firma som har flere kontrakter og kundeengasjementer.

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Gå gjennom de viktigste oppdateringene for Power Apps og Power Automate og deres fordeler og implikasjoner for Microsoft Power Platform.

Vanlige SQL-funksjoner: en oversikt

Vanlige SQL-funksjoner: en oversikt

Oppdag noen vanlige SQL-funksjoner som vi kan bruke som streng, dato og noen avanserte funksjoner for å behandle eller manipulere data.

LuckyTemplates Template Creation: Guide og tips

LuckyTemplates Template Creation: Guide og tips

I denne opplæringen lærer du hvordan du lager din perfekte LuckyTemplates-mal som er konfigurert til dine behov og preferanser.

Feltparametre og små multipler i LuckyTemplates

Feltparametre og små multipler i LuckyTemplates

I denne bloggen vil vi demonstrere hvordan du legger feltparametere sammen med små multipler for å skape utrolig nyttig innsikt og grafikk.

LuckyTemplates-rangering og tilpasset gruppering

LuckyTemplates-rangering og tilpasset gruppering

I denne bloggen vil du lære hvordan du bruker LuckyTemplates rangering og tilpassede grupperingsfunksjoner for å segmentere et eksempeldata og rangere det i henhold til kriterier.

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

I denne opplæringen skal jeg dekke en spesifikk teknikk rundt hvordan du viser kumulativ total kun opp til en bestemt dato i grafikken i LuckyTemplates.