Datasett i pandaer med profilrapport() | Python i LuckyTemplates

Et av de vanligste spørsmålene du vil møte som dataanalytiker er hva som er den beste måten å utforske et gitt datasett. Dette er en viktig faktor først og fremst hvis du ønsker å sette alle dataene sammen i en rapport som skal være enkel å tolke av deg selv eller teamet ditt. I denne opplæringen skal jeg demonstrere hvordan du effektivt kan utforske datasett i Pandas ved å bruke ProfileReport(). Du kan se hele videoen av denne opplæringen nederst på denne bloggen.

Når du får et datasett, hva gjør du? Hvordan utforsker du datasettet? Primært, hvis du ønsker å sette det hele sammen i en lettlest rapport for deg selv, for kollegaer osv., har du mange ting å vurdere.

Først tenker du på hva slags variabler de er fordi det kommer til å påvirke hvordan du analyserer dem og hvordan du behandler dem. Data betyr det som er gitt. Så det som mangler kommer til å være hvilke data vi ikke har. En annen ting er å visualisere disse forholdene. Hvordan ser de ut? Vi ønsker å bruke den visualiseringskraften tidlig og ofte.

Dette er mange komplekse spørsmål som henger sammen. Det gode er at det er denne profileringsrapportfunksjonen tilgjengelig som vil gi oss disse svarene. Så la oss se på alt dette i Python.

Innholdsfortegnelse

Utforsk datasett i pandaer ved å bruke ProfileReport()-funksjonen

Først skal vi laste inn datasettet.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Så, fra pandas_profiling , skal vi importere denne tingen som kalles profilrapport. Nå, hvis du får en feilmelding her, må du sannsynligvis installere den. Jeg bruker Anaconda. Jeg foreslår at du bruker det også. La oss kjøre dette, og så skrive det ut.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Så her er det. Vi har en oversikt . Dette gir oss en oversikt over variabeltypene. Vi har datasettstatistikken. Vi ser antall radkolonner, så videre og så videre. Det fine med denne rapporten er at den er som en one-stop shop, og den ser også veldig fin ut. Den har en veldig tiltalende presentasjon.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Vi scroller ned her og vi har. Vi får en visualisering, og vi kan bytte flere detaljer om variabelen. Vi har flagg som peker på ting som kan være litt uvanlige. Vi har også disse varslene, og mange andre funksjoner som vil gi oss mer informasjon. Og dette er for hver enkelt variabel.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Når vi fortsetter å rulle nedover, finner vi Interactions, hvor det er laget spredningsplott for å visualisere dataene.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Og så har vi Korrelasjoner , som oppsummerte forholdet.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Neste er, som er veldig viktige. Som du kan se, mangler vi noen verdier her, og vi vil vite hvorfor. Disse visualiseringene her er ment å hjelpe oss med det. Vi kan klikke gjennom hver visualisering og analysere dataene.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates

Til slutt har vi prøven. Vi kan få dette på mange måter, men alt dette gjør er bare å skrive ut de første radene, noe som er greit å vite.

Datasett i pandaer med profilrapport() |  Python i LuckyTemplates




Konklusjon

Det er slik du utforsker datasett i Pandas ved å bruke ProfileReport()-funksjonen. Det er mange måter å kutte og kutte dataene på. Tenk på alle kombinasjonene av permutasjoner av dataene. Dette kommer ikke til å kunne gjøre alt for deg, men det er en veldig god start.

Når vi utforsker data, er det egentlig en iterativ prosess. Det er ingen en-og-gjort magisk pille så mye som vi kanskje vil ha en. Imidlertid er ProfilerReport() virkelig et flott verktøy. Vi får mye informasjon og bare én kodelinje. Dette er et gratis verktøy, så jeg håper du kan bruke det i ditt eget arbeid. Fortell oss hvordan du gjør det.

Beste ønsker!


Hva er Power Query & M Language: En detaljert oversikt

Hva er Power Query & M Language: En detaljert oversikt

Denne opplæringen gir en oversikt over Power Query Editor og M-språket på LuckyTemplates-skrivebordet.

Lag en paginert rapport: Legge til tekster og bilder

Lag en paginert rapport: Legge til tekster og bilder

Lær hvordan du lager en paginert rapport, legger til tekster og bilder og deretter eksporterer rapporten til ulike dokumentformater.

SharePoint Automate-funksjonen | En introduksjon

SharePoint Automate-funksjonen | En introduksjon

Lær hvordan du bruker SharePoint-automatiseringsfunksjonen til å lage arbeidsflyter og hjelpe deg med å mikroadministrere SharePoint-brukere, -biblioteker og -lister.

Løs en dataanalyseutfordring med LuckyTemplates Accelerator

Løs en dataanalyseutfordring med LuckyTemplates Accelerator

Utvid rapportutviklingsferdighetene dine ved å bli med i en dataanalyseutfordring. Akseleratoren kan hjelpe deg å bli en LuckyTemplates-superbruker!

Løpende totaler i LuckyTemplates ved hjelp av DAX

Løpende totaler i LuckyTemplates ved hjelp av DAX

Lær hvordan du beregner løpende totaler i LuckyTemplates ved hjelp av DAX. Løpende totaler lar deg ikke bli fanget opp i et individuelt resultat.

LuckyTemplates Dax-variabler er konstante: Hva betyr dette?

LuckyTemplates Dax-variabler er konstante: Hva betyr dette?

Forstå konseptet med variabler i DAX i LuckyTemplates og implikasjonene av variabler for hvordan målene dine beregnes.

LuckyTemplates Slope Chart: En oversikt

LuckyTemplates Slope Chart: En oversikt

Lær mer om det tilpassede visuelle bildet kalt LuckyTemplates Slope-diagram, som brukes til å vise økning/reduksjon for en enkelt eller flere beregninger.

LuckyTemplates fargetemaer for enhetlige visualiseringer

LuckyTemplates fargetemaer for enhetlige visualiseringer

Oppdag fargetemaene i LuckyTemplates. Disse er avgjørende for at rapportene og visualiseringene dine skal se ut og fungere sømløst.

Beregne gjennomsnitt i LuckyTemplates: Isolere ukedag- eller helgeresultater ved hjelp av DAX

Beregne gjennomsnitt i LuckyTemplates: Isolere ukedag- eller helgeresultater ved hjelp av DAX

Å beregne et gjennomsnitt i LuckyTemplates kan gjøres på mange måter for å gi deg nøyaktig informasjon for bedriftsrapportene dine.

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

La oss fordype oss i Standard LuckyTemplates-tema, og gjennomgå noen av funksjonene som er innebygd i selve LuckyTemplates Desktop-applikasjonen.