Datauppsättningar i pandor med ProfileReport() | Python i LuckyTemplates

En av de vanligaste frågorna du kommer att stöta på som dataanalytiker är vad som är det bästa sättet att utforska en given datamängd. Detta är ett viktigt övervägande i första hand om du vill sammanställa all data i en rapport som kommer att vara lätt att tolka av dig själv eller ditt team. I den här handledningen ska jag demonstrera hur du effektivt kan utforska datauppsättningar i Pandas med hjälp av ProfileReport(). Du kan se hela videon av denna handledning längst ner på den här bloggen.

När du får en datamängd, vad gör du? Hur utforskar du datamängden? I första hand, om du vill sammanställa allt i en lättläst rapport för dig själv, för kollegor, etc., har du många saker att tänka på.

Först tänker du på vilka typer av variabler de är eftersom det kommer att påverka hur du analyserar dem och hur du behandlar dem. Data betyder vad som ges. Så det som saknas kommer att vara vilken data vi inte har. En annan sak är att visualisera dessa relationer. Hur ser de ut? Vi vill använda den visualiseringskraften tidigt och ofta.

Det här är många sammankopplade komplexa frågor. Det som är bra är att det finns denna profileringsrapportfunktion tillgänglig som kommer att ge oss de svaren. Så låt oss titta på allt detta i Python.

Innehållsförteckning

Utforska datamängder i Pandas med hjälp av ProfileReport()-funktionen

Först ska vi ladda datamängden.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Sedan, från pandas_profiling , kommer vi att importera det här som kallas profilrapport. Nu, om du får ett fel här, måste du förmodligen installera det. Jag använder Anaconda. Jag föreslår att du använder det också. Låt oss köra det här och sedan skriva ut det.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Så här är det. Vi har en översikt . Detta ger oss en uppdelning av variabeltyperna. Vi har datauppsättningsstatistiken. Vi ser antalet radkolumner, så vidare och så vidare. Det fina med den här rapporten är att det är som en one-stop-shop och det ser också riktigt snyggt ut. Den har en mycket tilltalande presentation.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Vi scrollar ner här och vi har. Vi får en visualisering och vi kan växla mer detaljer om variabeln. Vi har flaggor som pekar ut saker som kan vara lite ovanliga. Vi har också dessa varningar, och många andra funktioner som ger oss mer information. Och detta är för varje enskild variabel.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

När vi fortsätter att scrolla ner hittar vi Interactions, där det skapas spridningsdiagram för att visualisera data.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Och så har vi Correlations , som sammanfattar förhållandet.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Nästa är, som är mycket viktiga. Som du kan se saknar vi några värden här och vi vill veta varför. Dessa visualiseringar här är avsedda att hjälpa oss att göra det. Vi kan klicka igenom varje bild och analysera data.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Till sist har vi provet. Vi skulle kunna få det här på många sätt, men allt detta gör är att bara skriva ut de första raderna, vilket är bra att veta.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates




Slutsats

Det är så du utforskar datauppsättningar i Pandas med hjälp av ProfileReport()-funktionen. Det finns många sätt att skära och tärna data. Tänk på alla kombinationer av permutationer av data. Det här kommer inte att kunna göra allt för dig, men det är en riktigt bra början.

När vi utforskar data är det verkligen en iterativ process. Det finns inget en-och-gjort magiskt piller så mycket som vi kanske vill ha ett. Men ProfilerReport() är verkligen ett bra verktyg. Vi får mycket information och bara en rad kod. Detta är ett gratis verktyg, så jag hoppas att du kan använda det i ditt eget arbete. Låt oss veta hur du gör det.

Med vänliga hälsningar!


Lös en dataanalysutmaning med LuckyTemplates Accelerator

Lös en dataanalysutmaning med LuckyTemplates Accelerator

Finslipa dina färdigheter i rapportutveckling genom att gå med i en dataanalysutmaning. Acceleratorn kan hjälpa dig att bli en LuckyTemplates superanvändare!

Löpande summor i LuckyTemplates med DAX

Löpande summor i LuckyTemplates med DAX

Lär dig hur du beräknar löpande summor i LuckyTemplates med DAX. Löpande summor låter dig inte fastna i ett individuellt resultat.

LuckyTemplates Dax-variabler är konstanta: Vad betyder detta?

LuckyTemplates Dax-variabler är konstanta: Vad betyder detta?

Förstå konceptet med variabler i DAX inom LuckyTemplates och konsekvenserna av variabler för hur dina mått beräknas.

LuckyTemplates Slope Chart: En översikt

LuckyTemplates Slope Chart: En översikt

Lär dig mer om den anpassade visual som kallas LuckyTemplates Slope-diagram, som används för att visa ökning/minskning för en enstaka eller flera mätvärden.

LuckyTemplates färgteman för enhetliga visualiseringar

LuckyTemplates färgteman för enhetliga visualiseringar

Upptäck färgteman i LuckyTemplates. Dessa är viktiga för att dina rapporter och visualiseringar ska se ut och fungera sömlöst.

Beräkna medelvärde i LuckyTemplates: Isolera veckodags- eller helgresultat med DAX

Beräkna medelvärde i LuckyTemplates: Isolera veckodags- eller helgresultat med DAX

Att beräkna ett genomsnitt i LuckyTemplates kan göras på många sätt för att ge dig exakt information för dina affärsrapporter.

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

Låt oss fördjupa oss i Standard LuckyTemplates-teman och granska några av funktionerna som är inbyggda i själva LuckyTemplates Desktop-applikationen.

LuckyTemplates Map Visual: Hur man skapar och lägger till en anpassad legend i LuckyTemplates

LuckyTemplates Map Visual: Hur man skapar och lägger till en anpassad legend i LuckyTemplates

I den här handledningen lär du dig hur du bygger en anpassad förklaring i en LuckyTemplates Map Visual för att visa dina föredragna färger och segmentering.

LuckyTemplates bakgrundsbild för rapporter som använder PPT

LuckyTemplates bakgrundsbild för rapporter som använder PPT

Lär dig hur du ställer in en LuckyTemplates-bakgrundsbild med PowerPoint. Detta är en av mina tekniker för att skapa mina LuckyTemplates-rapporter.

Upphandlingsbeslutsmodell och analys i LuckyTemplates

Upphandlingsbeslutsmodell och analys i LuckyTemplates

I den här handledningen kommer vi att dyka in i en del inköpsanalyser inom en organisation, med hjälp av en interagerande funktion och kraften i datamodellen.