Hva er Power Query & M Language: En detaljert oversikt
Denne opplæringen gir en oversikt over Power Query Editor og M-språket på LuckyTemplates-skrivebordet.
Et av de vanligste spørsmålene du vil møte som dataanalytiker er hva som er den beste måten å utforske et gitt datasett. Dette er en viktig faktor først og fremst hvis du ønsker å sette alle dataene sammen i en rapport som skal være enkel å tolke av deg selv eller teamet ditt. I denne opplæringen skal jeg demonstrere hvordan du effektivt kan utforske datasett i Pandas ved å bruke ProfileReport(). Du kan se hele videoen av denne opplæringen nederst på denne bloggen.
Når du får et datasett, hva gjør du? Hvordan utforsker du datasettet? Primært, hvis du ønsker å sette det hele sammen i en lettlest rapport for deg selv, for kollegaer osv., har du mange ting å vurdere.
Først tenker du på hva slags variabler de er fordi det kommer til å påvirke hvordan du analyserer dem og hvordan du behandler dem. Data betyr det som er gitt. Så det som mangler kommer til å være hvilke data vi ikke har. En annen ting er å visualisere disse forholdene. Hvordan ser de ut? Vi ønsker å bruke den visualiseringskraften tidlig og ofte.
Dette er mange komplekse spørsmål som henger sammen. Det gode er at det er denne profileringsrapportfunksjonen tilgjengelig som vil gi oss disse svarene. Så la oss se på alt dette i Python.
Innholdsfortegnelse
Utforsk datasett i pandaer ved å bruke ProfileReport()-funksjonen
Først skal vi laste inn datasettet.
Så, fra pandas_profiling , skal vi importere denne tingen som kalles profilrapport. Nå, hvis du får en feilmelding her, må du sannsynligvis installere den. Jeg bruker Anaconda. Jeg foreslår at du bruker det også. La oss kjøre dette, og så skrive det ut.
Så her er det. Vi har en oversikt . Dette gir oss en oversikt over variabeltypene. Vi har datasettstatistikken. Vi ser antall radkolonner, så videre og så videre. Det fine med denne rapporten er at den er som en one-stop shop, og den ser også veldig fin ut. Den har en veldig tiltalende presentasjon.
Vi scroller ned her og vi har. Vi får en visualisering, og vi kan bytte flere detaljer om variabelen. Vi har flagg som peker på ting som kan være litt uvanlige. Vi har også disse varslene, og mange andre funksjoner som vil gi oss mer informasjon. Og dette er for hver enkelt variabel.
Når vi fortsetter å rulle nedover, finner vi Interactions, hvor det er laget spredningsplott for å visualisere dataene.
Og så har vi Korrelasjoner , som oppsummerte forholdet.
Neste er, som er veldig viktige. Som du kan se, mangler vi noen verdier her, og vi vil vite hvorfor. Disse visualiseringene her er ment å hjelpe oss med det. Vi kan klikke gjennom hver visualisering og analysere dataene.
Til slutt har vi prøven. Vi kan få dette på mange måter, men alt dette gjør er bare å skrive ut de første radene, noe som er greit å vite.
Konklusjon
Det er slik du utforsker datasett i Pandas ved å bruke ProfileReport()-funksjonen. Det er mange måter å kutte og kutte dataene på. Tenk på alle kombinasjonene av permutasjoner av dataene. Dette kommer ikke til å kunne gjøre alt for deg, men det er en veldig god start.
Når vi utforsker data, er det egentlig en iterativ prosess. Det er ingen en-og-gjort magisk pille så mye som vi kanskje vil ha en. Imidlertid er ProfilerReport() virkelig et flott verktøy. Vi får mye informasjon og bare én kodelinje. Dette er et gratis verktøy, så jeg håper du kan bruke det i ditt eget arbeid. Fortell oss hvordan du gjør det.
Beste ønsker!
Denne opplæringen gir en oversikt over Power Query Editor og M-språket på LuckyTemplates-skrivebordet.
Lær hvordan du lager en paginert rapport, legger til tekster og bilder og deretter eksporterer rapporten til ulike dokumentformater.
Lær hvordan du bruker SharePoint-automatiseringsfunksjonen til å lage arbeidsflyter og hjelpe deg med å mikroadministrere SharePoint-brukere, -biblioteker og -lister.
Utvid rapportutviklingsferdighetene dine ved å bli med i en dataanalyseutfordring. Akseleratoren kan hjelpe deg å bli en LuckyTemplates-superbruker!
Lær hvordan du beregner løpende totaler i LuckyTemplates ved hjelp av DAX. Løpende totaler lar deg ikke bli fanget opp i et individuelt resultat.
Forstå konseptet med variabler i DAX i LuckyTemplates og implikasjonene av variabler for hvordan målene dine beregnes.
Lær mer om det tilpassede visuelle bildet kalt LuckyTemplates Slope-diagram, som brukes til å vise økning/reduksjon for en enkelt eller flere beregninger.
Oppdag fargetemaene i LuckyTemplates. Disse er avgjørende for at rapportene og visualiseringene dine skal se ut og fungere sømløst.
Å beregne et gjennomsnitt i LuckyTemplates kan gjøres på mange måter for å gi deg nøyaktig informasjon for bedriftsrapportene dine.
La oss fordype oss i Standard LuckyTemplates-tema, og gjennomgå noen av funksjonene som er innebygd i selve LuckyTemplates Desktop-applikasjonen.