Datasæt i pandaer med profilrapport() | Python i LuckyTemplates

Et af de mest almindelige spørgsmål, du vil støde på som dataanalytiker, er, hvad der er den bedste måde at udforske et givet datasæt. Dette er en vigtig overvejelse primært, hvis du ønsker at samle alle dataene i en rapport, der vil være let at fortolke af dig selv eller dit team. I denne vejledning vil jeg demonstrere, hvordan du effektivt kan udforske datasæt i Pandas ved hjælp af ProfileReport(). Du kan se den fulde video af denne tutorial nederst på denne blog.

Når du får et datasæt, hvad gør du så? Hvordan udforsker du datasættet? Primært, hvis du ønsker at samle det hele i en letlæselig rapport for dig selv, for kolleger osv., har du mange ting at overveje.

Først tænker du over, hvilken slags variabler de er, fordi det vil påvirke, hvordan du analyserer dem, og hvordan du behandler dem. Data betyder, hvad der gives. Så det, der mangler, vil være, hvilke data vi ikke har. En anden ting er at visualisere disse forhold. Hvordan ser de ud? Vi ønsker at bruge denne visualiseringskraft tidligt og ofte.

Det er mange komplekse spørgsmål, der hænger sammen. Det gode er, at der er denne profileringsrapportfunktion tilgængelig, som vil give os disse svar. Så lad os se på alt det i Python.

Indholdsfortegnelse

Udforsk datasæt i Pandas ved hjælp af ProfileReport()-funktionen

Først skal vi indlæse datasættet.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Derefter, fra pandas_profiling , vil vi importere denne ting, der kaldes profilrapport. Nu, hvis du får en fejl her, skal du sandsynligvis installere den. Jeg bruger Anaconda. Jeg foreslår, at du også bruger det. Lad os køre dette, og så udskrive det.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Så her er det. Vi har et overblik . Dette giver os en opdeling af variabeltyperne. Vi har datasætstatistikken. Vi ser antallet af rækkesøjler, så videre og så videre. Det fine ved denne rapport er, at det er som en one-stop-shop, og det ser også rigtig flot ud. Det har en meget tiltalende præsentation.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Vi scroller ned her, og vi har. Vi får en visualisering, og vi kan skifte flere detaljer om variablen. Vi har flag, der peger på ting, der kan være lidt usædvanlige. Vi har også disse advarsler, og mange andre funktioner, der vil give os mere information. Og dette er for hver enkelt variabel.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Mens vi fortsætter med at rulle ned, finder vi Interactions, hvor det er lavet scatterplot for at visualisere dataene.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Og så har vi Korrelationer , som opsummerer forholdet.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Næste er, som er meget vigtige. Som du kan se, mangler vi nogle værdier her, og vi vil gerne vide hvorfor. Disse visualiseringer her er beregnet til at hjælpe os med at gøre det. Vi kan klikke gennem hver visualisering og analysere dataene.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates

Til sidst har vi prøven. Vi kunne få dette på mange måder, men alt hvad dette gør er bare at udskrive de første rækker, hvilket er godt at vide.

Datasæt i pandaer med profilrapport() |  Python i LuckyTemplates




Konklusion

Det er sådan, du udforsker datasæt i Pandas ved hjælp af ProfileReport()-funktionen. Der er mange måder at opdele data på. Tænk på alle kombinationerne af permutationer af dataene. Dette vil ikke være i stand til at gøre alt for dig, men det er en rigtig god start.

Når vi udforsker data, er det virkelig en iterativ proces. Der er ingen en-og-gjort magisk pille så meget, som vi måske ønsker en. ProfilerReport() er dog virkelig et fantastisk værktøj. Vi får en masse information og kun én linje kode. Dette er et gratis værktøj, så jeg håber du kan bruge det i dit eget arbejde. Fortæl os, hvordan du gør det.

Alt det bedste!


Løs en dataanalyseudfordring med LuckyTemplates Accelerator

Løs en dataanalyseudfordring med LuckyTemplates Accelerator

Udvid dine rapportudviklingsevner ved at deltage i en dataanalyseudfordring. Acceleratoren kan hjælpe dig med at blive LuckyTemplates-superbruger!

Løbende totaler i LuckyTemplates ved hjælp af DAX

Løbende totaler i LuckyTemplates ved hjælp af DAX

Lær, hvordan du beregner løbende totaler i LuckyTemplates ved hjælp af DAX. Løbende totaler giver dig mulighed for ikke at blive fanget af et individuelt resultat.

LuckyTemplates Dax-variabler er konstante: Hvad betyder det?

LuckyTemplates Dax-variabler er konstante: Hvad betyder det?

Forstå konceptet med variabler i DAX i LuckyTemplates og betydningen af ​​variabler for, hvordan dine mål beregnes.

LuckyTemplates hældningsdiagram: en oversigt

LuckyTemplates hældningsdiagram: en oversigt

Lær mere om det brugerdefinerede visuelle kaldet LuckyTemplates Slope-diagrammet, som bruges til at vise stigning/fald for en enkelt eller flere metrics.

LuckyTemplates farvetemaer til ensartede visualiseringer

LuckyTemplates farvetemaer til ensartede visualiseringer

Opdag farvetemaerne i LuckyTemplates. Disse er afgørende for, at dine rapporter og visualiseringer kan se ud og fungere problemfrit.

Beregning af gennemsnit i LuckyTemplates: Isolering af resultater på ugedage eller weekender ved hjælp af DAX

Beregning af gennemsnit i LuckyTemplates: Isolering af resultater på ugedage eller weekender ved hjælp af DAX

Beregning af et gennemsnit i LuckyTemplates kan gøres på mange måder for at give dig præcise oplysninger til dine virksomhedsrapporter.

LuckyTemplates tema | LuckyTemplates Desktop Standard Theming

LuckyTemplates tema | LuckyTemplates Desktop Standard Theming

Lad os dykke ned i Standard LuckyTemplates-temaer og gennemgå nogle af de funktioner, der er indbygget i selve LuckyTemplates Desktop-applikationen.

LuckyTemplates kortvisuelt: Sådan opretter og tilføjer du en brugerdefineret forklaring i LuckyTemplates

LuckyTemplates kortvisuelt: Sådan opretter og tilføjer du en brugerdefineret forklaring i LuckyTemplates

I dette selvstudie lærer du, hvordan du bygger en brugerdefineret forklaring i en LuckyTemplates-kortvisual for at vise dine foretrukne farver og segmentering.

LuckyTemplates baggrundsbillede til rapporter, der bruger PPT

LuckyTemplates baggrundsbillede til rapporter, der bruger PPT

Lær, hvordan du opsætter et LuckyTemplates-baggrundsbillede ved hjælp af PowerPoint. Dette er en af ​​mine teknikker til at skabe mine LuckyTemplates-rapporter.

Indkøbsbeslutningsmodel og analyse i LuckyTemplates

Indkøbsbeslutningsmodel og analyse i LuckyTemplates

I denne tutorial skal vi dykke ned i nogle indkøbsanalyser i en organisation ved at bruge en interagerende funktion og kraften i datamodellen.