Datauppsättningar i pandor med ProfileReport() | Python i LuckyTemplates

En av de vanligaste frågorna du kommer att stöta på som dataanalytiker är vad som är det bästa sättet att utforska en given datamängd. Detta är ett viktigt övervägande i första hand om du vill sammanställa all data i en rapport som kommer att vara lätt att tolka av dig själv eller ditt team. I den här handledningen ska jag demonstrera hur du effektivt kan utforska datauppsättningar i Pandas med hjälp av ProfileReport(). Du kan se hela videon av denna handledning längst ner på den här bloggen.

När du får en datamängd, vad gör du? Hur utforskar du datamängden? I första hand, om du vill sammanställa allt i en lättläst rapport för dig själv, för kollegor, etc., har du många saker att tänka på.

Först tänker du på vilka typer av variabler de är eftersom det kommer att påverka hur du analyserar dem och hur du behandlar dem. Data betyder vad som ges. Så det som saknas kommer att vara vilken data vi inte har. En annan sak är att visualisera dessa relationer. Hur ser de ut? Vi vill använda den visualiseringskraften tidigt och ofta.

Det här är många sammankopplade komplexa frågor. Det som är bra är att det finns denna profileringsrapportfunktion tillgänglig som kommer att ge oss de svaren. Så låt oss titta på allt detta i Python.

Innehållsförteckning

Utforska datamängder i Pandas med hjälp av ProfileReport()-funktionen

Först ska vi ladda datamängden.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Sedan, från pandas_profiling , kommer vi att importera det här som kallas profilrapport. Nu, om du får ett fel här, måste du förmodligen installera det. Jag använder Anaconda. Jag föreslår att du använder det också. Låt oss köra det här och sedan skriva ut det.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Så här är det. Vi har en översikt . Detta ger oss en uppdelning av variabeltyperna. Vi har datauppsättningsstatistiken. Vi ser antalet radkolumner, så vidare och så vidare. Det fina med den här rapporten är att det är som en one-stop-shop och det ser också riktigt snyggt ut. Den har en mycket tilltalande presentation.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Vi scrollar ner här och vi har. Vi får en visualisering och vi kan växla mer detaljer om variabeln. Vi har flaggor som pekar ut saker som kan vara lite ovanliga. Vi har också dessa varningar, och många andra funktioner som ger oss mer information. Och detta är för varje enskild variabel.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

När vi fortsätter att scrolla ner hittar vi Interactions, där det skapas spridningsdiagram för att visualisera data.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Och så har vi Correlations , som sammanfattar förhållandet.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Nästa är, som är mycket viktiga. Som du kan se saknar vi några värden här och vi vill veta varför. Dessa visualiseringar här är avsedda att hjälpa oss att göra det. Vi kan klicka igenom varje bild och analysera data.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates

Till sist har vi provet. Vi skulle kunna få det här på många sätt, men allt detta gör är att bara skriva ut de första raderna, vilket är bra att veta.

Datauppsättningar i pandor med ProfileReport() |  Python i LuckyTemplates




Slutsats

Det är så du utforskar datauppsättningar i Pandas med hjälp av ProfileReport()-funktionen. Det finns många sätt att skära och tärna data. Tänk på alla kombinationer av permutationer av data. Det här kommer inte att kunna göra allt för dig, men det är en riktigt bra början.

När vi utforskar data är det verkligen en iterativ process. Det finns inget en-och-gjort magiskt piller så mycket som vi kanske vill ha ett. Men ProfilerReport() är verkligen ett bra verktyg. Vi får mycket information och bara en rad kod. Detta är ett gratis verktyg, så jag hoppas att du kan använda det i ditt eget arbete. Låt oss veta hur du gör det.

Med vänliga hälsningar!

Leave a Comment

Skapa en datumtabell i LuckyTemplates

Skapa en datumtabell i LuckyTemplates

Ta reda på varför det är viktigt att ha en dedikerad datumtabell i LuckyTemplates och lär dig det snabbaste och mest effektiva sättet att göra det.

LuckyTemplates mobilrapporteringstips och tekniker

LuckyTemplates mobilrapporteringstips och tekniker

Denna korta handledning belyser LuckyTemplates mobilrapporteringsfunktion. Jag ska visa dig hur du kan utveckla rapporter effektivt för mobila enheter.

Professional Service Analytics-rapporter i LuckyTemplates

Professional Service Analytics-rapporter i LuckyTemplates

I denna LuckyTemplates Showcase går vi igenom rapporter som visar professionell serviceanalys från ett företag som har flera kontrakt och kundengagemang.

Microsoft Power Platform-uppdateringar | Microsoft Ignite 2021

Microsoft Power Platform-uppdateringar | Microsoft Ignite 2021

Gå igenom de viktigaste uppdateringarna för Power Apps och Power Automate och deras fördelar och konsekvenser för Microsoft Power Platform.

Vanliga SQL-funktioner: En översikt

Vanliga SQL-funktioner: En översikt

Upptäck några vanliga SQL-funktioner som vi kan använda som sträng, datum och några avancerade funktioner för att bearbeta eller manipulera data.

LuckyTemplates Skapa mall: Guide och tips

LuckyTemplates Skapa mall: Guide och tips

I den här handledningen kommer du att lära dig hur du skapar din perfekta LuckyTemplates-mall som är konfigurerad efter dina behov och preferenser.

Fältparametrar och små multiplar i LuckyTemplates

Fältparametrar och små multiplar i LuckyTemplates

I den här bloggen kommer vi att visa hur man lager fältparametrar med små multiplar för att skapa otroligt användbara insikter och bilder.

LuckyTemplates Rank och anpassad gruppering

LuckyTemplates Rank och anpassad gruppering

I den här bloggen kommer du att lära dig hur du använder LuckyTemplates ranknings- och anpassade grupperingsfunktioner för att segmentera en exempeldata och rangordna den enligt kriterier.

Visar kumulativ total endast upp till ett visst datum i LuckyTemplates

Visar kumulativ total endast upp till ett visst datum i LuckyTemplates

I den här handledningen kommer jag att täcka en specifik teknik kring hur man visar Kumulativ total endast upp till ett specifikt datum i dina bilder i LuckyTemplates.

Punktdiagram: Avancerade anpassade bilder för LuckyTemplates

Punktdiagram: Avancerade anpassade bilder för LuckyTemplates

Lär dig hur du skapar och anpassar punktdiagram i LuckyTemplates, som huvudsakligen används för att mäta prestanda mot mål eller tidigare år.