Løs en dataanalyseudfordring med LuckyTemplates Accelerator
Udvid dine rapportudviklingsevner ved at deltage i en dataanalyseudfordring. Acceleratoren kan hjælpe dig med at blive LuckyTemplates-superbruger!
Et af de mest almindelige spørgsmål, du vil støde på som dataanalytiker, er, hvad der er den bedste måde at udforske et givet datasæt. Dette er en vigtig overvejelse primært, hvis du ønsker at samle alle dataene i en rapport, der vil være let at fortolke af dig selv eller dit team. I denne vejledning vil jeg demonstrere, hvordan du effektivt kan udforske datasæt i Pandas ved hjælp af ProfileReport(). Du kan se den fulde video af denne tutorial nederst på denne blog.
Når du får et datasæt, hvad gør du så? Hvordan udforsker du datasættet? Primært, hvis du ønsker at samle det hele i en letlæselig rapport for dig selv, for kolleger osv., har du mange ting at overveje.
Først tænker du over, hvilken slags variabler de er, fordi det vil påvirke, hvordan du analyserer dem, og hvordan du behandler dem. Data betyder, hvad der gives. Så det, der mangler, vil være, hvilke data vi ikke har. En anden ting er at visualisere disse forhold. Hvordan ser de ud? Vi ønsker at bruge denne visualiseringskraft tidligt og ofte.
Det er mange komplekse spørgsmål, der hænger sammen. Det gode er, at der er denne profileringsrapportfunktion tilgængelig, som vil give os disse svar. Så lad os se på alt det i Python.
Indholdsfortegnelse
Udforsk datasæt i Pandas ved hjælp af ProfileReport()-funktionen
Først skal vi indlæse datasættet.
Derefter, fra pandas_profiling , vil vi importere denne ting, der kaldes profilrapport. Nu, hvis du får en fejl her, skal du sandsynligvis installere den. Jeg bruger Anaconda. Jeg foreslår, at du også bruger det. Lad os køre dette, og så udskrive det.
Så her er det. Vi har et overblik . Dette giver os en opdeling af variabeltyperne. Vi har datasætstatistikken. Vi ser antallet af rækkesøjler, så videre og så videre. Det fine ved denne rapport er, at det er som en one-stop-shop, og det ser også rigtig flot ud. Det har en meget tiltalende præsentation.
Vi scroller ned her, og vi har. Vi får en visualisering, og vi kan skifte flere detaljer om variablen. Vi har flag, der peger på ting, der kan være lidt usædvanlige. Vi har også disse advarsler, og mange andre funktioner, der vil give os mere information. Og dette er for hver enkelt variabel.
Mens vi fortsætter med at rulle ned, finder vi Interactions, hvor det er lavet scatterplot for at visualisere dataene.
Og så har vi Korrelationer , som opsummerer forholdet.
Næste er, som er meget vigtige. Som du kan se, mangler vi nogle værdier her, og vi vil gerne vide hvorfor. Disse visualiseringer her er beregnet til at hjælpe os med at gøre det. Vi kan klikke gennem hver visualisering og analysere dataene.
Til sidst har vi prøven. Vi kunne få dette på mange måder, men alt hvad dette gør er bare at udskrive de første rækker, hvilket er godt at vide.
Konklusion
Det er sådan, du udforsker datasæt i Pandas ved hjælp af ProfileReport()-funktionen. Der er mange måder at opdele data på. Tænk på alle kombinationerne af permutationer af dataene. Dette vil ikke være i stand til at gøre alt for dig, men det er en rigtig god start.
Når vi udforsker data, er det virkelig en iterativ proces. Der er ingen en-og-gjort magisk pille så meget, som vi måske ønsker en. ProfilerReport() er dog virkelig et fantastisk værktøj. Vi får en masse information og kun én linje kode. Dette er et gratis værktøj, så jeg håber du kan bruge det i dit eget arbejde. Fortæl os, hvordan du gør det.
Alt det bedste!
Udvid dine rapportudviklingsevner ved at deltage i en dataanalyseudfordring. Acceleratoren kan hjælpe dig med at blive LuckyTemplates-superbruger!
Lær, hvordan du beregner løbende totaler i LuckyTemplates ved hjælp af DAX. Løbende totaler giver dig mulighed for ikke at blive fanget af et individuelt resultat.
Forstå konceptet med variabler i DAX i LuckyTemplates og betydningen af variabler for, hvordan dine mål beregnes.
Lær mere om det brugerdefinerede visuelle kaldet LuckyTemplates Slope-diagrammet, som bruges til at vise stigning/fald for en enkelt eller flere metrics.
Opdag farvetemaerne i LuckyTemplates. Disse er afgørende for, at dine rapporter og visualiseringer kan se ud og fungere problemfrit.
Beregning af et gennemsnit i LuckyTemplates kan gøres på mange måder for at give dig præcise oplysninger til dine virksomhedsrapporter.
Lad os dykke ned i Standard LuckyTemplates-temaer og gennemgå nogle af de funktioner, der er indbygget i selve LuckyTemplates Desktop-applikationen.
I dette selvstudie lærer du, hvordan du bygger en brugerdefineret forklaring i en LuckyTemplates-kortvisual for at vise dine foretrukne farver og segmentering.
Lær, hvordan du opsætter et LuckyTemplates-baggrundsbillede ved hjælp af PowerPoint. Dette er en af mine teknikker til at skabe mine LuckyTemplates-rapporter.
I denne tutorial skal vi dykke ned i nogle indkøbsanalyser i en organisation ved at bruge en interagerende funktion og kraften i datamodellen.