Slik bruker du ECDF-plott i Python- og LuckyTemplates

Denne bloggen vil demonstrere hvordan du bruker et kumulativt distribusjonsplott , også kjent som Empirical Cumulative Distribution Function eller ECDF-plott, og vise frem fordelene ved å bruke denne plottvariasjonen fremfor andre plotttyper. Du kan se hele videoen av denne opplæringen nederst på denne bloggen .

De fleste foretrekker ECDF-plott fremfor å visualisere dataene ettersom de plotter hvert datapunkt direkte, og denne funksjonen gjør det enkelt for brukeren å samhandle med plottet. I dag vil du lære hvordan du bruker en ECDF i Python og LuckyTemplates og forbedrer presentasjonene og rapportene om datadistribusjon.

Innholdsfortegnelse

Typer distribusjonsplott

Jeg starter med å filtrere dataene mine på en bestemt dag, lørdag, og vi kan nedenfor se alle disse Python-plottene som brukes til å beskrive distribusjoner. Vi har her vårt ECDF-plott, et histogram, et KDE-plott og et Box-plott.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Alle disse plottene vil beskrive hvordan data er spredt på tvers eller distribuert. For eksempel, hvis vi går ned og ser på histogrammet, kan vi se at de fleste av disse høye søppelkassene vil være der dataene våre er plassert.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Til rundt $3,50 har vi den høyeste boksen for tipsdataene våre i datasettet nedenfor.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Vi kan også bruke et KDE-plott som gir oss en annen metrikk når vi ser på distribusjon. Histogram tar for seg antall som kommer til å være i disse hyllene, mens KDE tar for seg tetthet.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Med et KDE-plott kan du se hvor de fleste dataene våre er ved å se den største tettheten eller den høyeste bulen i plottet om du vil. Så i bildet ovenfor kan vi si at det er distribuert et sted mellom $2 og $4.

Det samme gjelder i et Box-plott, som viser at fordelingen er $2 til $4, og det er her de fleste dataene våre vil være. Den bruker en median, den horisontale linjen som deler boksen, for å gi oss en ide om hvor den største fordelingen er.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Og så har vi ECDF-plottet der du på venstre side av y-aksen kan se ordet proporsjon , som representerer våre persentiler. Basert på plottet, til $3,50, ser vi på omtrent 50 % av dataene våre, og på $5 og under er 80% av dataene våre distribuert.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Histogramplottkode

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Nå vil jeg vise deg koden for hvert av disse plottene, og starter med histogrammet. De har alle svært like og , slik at du raskt kan trekke dem opp ved å bruke én kode, som en mal.

Vi må først importere  og lagre den som  sb,  etterfulgt av  matplotlib.pyplot  som  plt. Vi bruker en bakgrunnsstil kalt  ggplot  og den  matplotlib-  variabelen for å sende i forskjellige stiler.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

For eksempel, i bildet nedenfor, kan vi se at i den 11. linjen legger vi til en tittel for histogram og hakestørrelser i de følgende linjene. Yticks  og  xticks  representerer x- og y-størrelsene tilsvarende

Slik bruker du ECDF-plott i Python- og LuckyTemplates

I den 14. linjen bruker vi en Seaborn-variabel for å hente inn det aktuelle plottet, som histplotet  eksemplet ovenfor, som representerer et histogramplott. Vi sender deretter dataene fra 4. linje inn i funksjonen som et datasett.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Alt du tar med i verdiene representerer datasettet ditt og vil slette duplikatene. Deretter bruker vi  for tipsene ,  og en  fargetone,  som  sammen med seaborn lar deg skille dataene dine etter kategori. Hvis vi går tilbake til vårt visuelle, kan vi at det har kategorier, inkludert tiden, eller røykeren.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

KDE-plott

For KDE-plottet er alt nesten identisk. Vi trenger bare å sende inn en ny parameter kalt skygge for å ha det skyggelagte utseendet. Annet enn det er fargetonen, dataene og resten de samme.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Med Box-plottet er det stort sett likt andre plott bortsett fra noen få mindre forskjeller. Her bruker vi  boxplot-funksjonen  der  x  er dagen og  y  er tipsene. Vi bruker heller ikke  fargetone  for dette plottet.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Så det er den samme strukturen som ECDF-plottet, og den eneste forskjellen er i Seaborn-variabelen, der vi passerer inn et ECDF-plott og bruker fargetone som dag. Men vi kan også endre den fargen til en annen kategori vi har, som røyker.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Hvis vi sender denne kategorien inn, ender vi opp med et ECDF-plott som har to forskjellige linjer. I disse fordelingene kan vi se at røykerne har mer angående vår spesielle linjebredde.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Ikke-røykere har hundre prosent av disse dataene under $6, mens røykere har det til $6. Så interessant nok kan røykerne våre legge igjen et større tips på en bestemt dag.

Styling av ECDF-plott

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Nå kan vi style ECDF-plottene våre ytterligere for å gjøre dem mer presentable. På bildet nedenfor er forskjellige ECDF-plott. I det første plottet gjorde jeg linjene større og brukte en annen fargepalett.

I det første plottet brukte jeg forskjellige parametere inne i funksjonen. Som du kan se nedenfor, passerte jeg i paletten som  sommer  og linjebredden som  5. 

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Jeg sammenlignet også lørdag og søndag, derfor er det to forskjellige grønne streker. Her kan vi se at $3-tipset er på 45. persentil for søndag og 70. persentil for torsdag, noe som forteller oss at folk har en tendens til å legge igjen høyere tips på søndag.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Vi kan også bytte X- og Y-akse, bytte proporsjoner og spissen inne i plottet vårt, og endre paletten, akkurat som i bildet nedenfor.

Her kan vi se at $2-spissen er på den 20. persentilen for søndag, som er den lilla linjen i plottet. Så dataene er de samme med forrige ECDF-plott, og bare presentasjonen er annerledes.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Vi har nå et annet plott med samme datasett og beholder de opprinnelige akseposisjonene som vist på bildet ovenfor. Forskjellen denne gangen er retningen på linjene er invertert.

ECDF-plottstil

Hvis vi ser på koden, er alt vi gjør å sende inn parameteren  komplementær lik = sann. Denne handlingen  vil tillate oss å si at 80 % av dataene våre distribueres i $2-intervallet og høyere, i stedet for å si at under $2-området er 20% av dataene våre distribuert. Igjen, det er de samme dataene med et annet utseende eller en annen måte å presentere dem på.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Og i vårt fjerde og siste ECDF-plott bruker vi Count i stedet for proporsjoner.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Denne tilnærmingen er nyttig når vi har mer enn noen få tomter. Ved å se på tellespalten i bildet nedenfor, kan vi se at det ikke er mange observasjoner på fredag, noe som forteller oss at folk ikke legger igjen mange tips den dagen.

Slik bruker du ECDF-plott i Python- og LuckyTemplates

ECDF Plots Code Essentials

Hvis vi ser på koden, finner du  Seaborn , som er hovedtingen for å lage akkurat dette plottet. Vi har også  matplotlib.pyplot  for styling, som du kan lagre som en variabel kalt  plt .

Slik bruker du ECDF-plott i Python- og LuckyTemplates

Vi kan deretter bruke den variabelen til å lage forskjellige stiler for vårt spesielle plot, som å legge til titler og skriftstørrelser. Hoveddelen av koden din vil være ECDF-plottfunksjonen din som vi tar inn med Seaborn.




Konklusjon

Dette var måtene du kan bruke forskjellige distribusjonsplott, inkludert Histogram, KDE, Box og ECDF plott. Du lærte også fire måter å presentere et ECDF-plott ved å bruke det samme datasettet. Du kan bruke hvilken som helst tilnærming avhengig av dine preferanser.

Husk alltid å ta med de nødvendige bibliotekene for å lage din tomt og for å bruke riktig funksjon. Etter det er det bare et spørsmål om å endre visuelle og stilistiske aspekter ved plottet ditt som akseposisjonering og fargetoner.

Beste ønsker,


Oppdag unik innsikt ved å bruke LuckyTemplates TOPN-funksjon

Oppdag unik innsikt ved å bruke LuckyTemplates TOPN-funksjon

Denne bloggen inneholder LuckyTemplates TOPN DAX-funksjonen, som lar deg få unik innsikt fra dataene dine, og hjelper deg med å ta bedre markedsføringsbeslutninger.

Datamodellering i LuckyTemplates ved hjelp av støttetabeller

Datamodellering i LuckyTemplates ved hjelp av støttetabeller

Lær noen fantastiske analytiske teknikker som vi kan gjøre for datamodellering i LuckyTemplates ved å bruke DAX-støttetabeller.

Avansert DAX for LuckyTemplates: Implementering av rangeringslogikk på tvers av unik innsikt

Avansert DAX for LuckyTemplates: Implementering av rangeringslogikk på tvers av unik innsikt

Her dykker vi ned i LuckyTemplates Advanced DAX og implementerer rangeringslogikk for å få en helt unik innsikt. Jeg viser også frem målegrening i dette eksemplet.

LuckyTemplates What-If-parameterfunksjon

LuckyTemplates What-If-parameterfunksjon

Denne bloggen introduserer den nye funksjonen i LuckyTemplates, What-If-analyseparameteren. Du vil se hvordan det gjør alt raskt og enkelt for scenarioanalysen din.

Bruk LuckyTemplates Mål forgrening for å sjekke om marginene dine øker ettersom inntektene vokser

Bruk LuckyTemplates Mål forgrening for å sjekke om marginene dine øker ettersom inntektene vokser

Finn ut hvordan du kan finne ut om inntektsveksten din er god ved å sjekke om marginene dine økte ved å bruke LuckyTemplates som måler forgrening.

LuckyTemplates Parameters Via Query Editor

LuckyTemplates Parameters Via Query Editor

Lær og forstå hvordan du kan lage og bruke LuckyTemplates Parameters som er en kraftig funksjon i spørringsredigereren.

Rundt stolpediagram – en visualisering for dashbordet ditt

Rundt stolpediagram – en visualisering for dashbordet ditt

Denne opplæringen vil diskutere hvordan du lager et rundt søylediagram ved hjelp av Charticulator. Du vil lære hvordan du designer dem for LuckyTemplates-rapporten.

PowerApps funksjoner og formler | En introduksjon

PowerApps funksjoner og formler | En introduksjon

Lær hvordan du bruker PowerApps-funksjoner og -formler for å forbedre funksjonaliteten og endre atferd i Power Apps-lerretsappen vår.

Pipe In R: Koblingsfunksjoner med Dplyr

Pipe In R: Koblingsfunksjoner med Dplyr

I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.