Power Query Modulo: Hvordan håndtere stablede data

I denne opplæringen skal jeg demonstrere hvordan du kan forvandle rotete stablede data til et mer organisert format. Det er en ganske enkel måte å gjøre dette på, og det er en som kommer til å være utrolig nyttig og har mange forskjellige applikasjoner. Vi skal bruke Power Query modulo. Du kan se hele videoen av denne opplæringen nederst på denne bloggen.

Min kone kom ned på kontoret og sa at hun hadde kopiert en haug med adresser fra en kalenderinvitasjon, og at den ble limt inn i dette formatet. Hun hadde 28 e-postadresser og navn som endte opp i et slikt merkelig, stablet format. Det var en liste over navn med en haug med sitater, kommaer, søppelpost og e-postadresser. Hun ville vite hvordan man bruker Power Query for å få det til et bedre format.

Power Query Modulo: Hvordan håndtere stablede data

Så la oss hoppe inn i Power Query, så ser vi rådataene. La oss beholde rådataene intakte og bare referere til dem. Vi kaller denne referansefilen, TestData .

Power Query Modulo: Hvordan håndtere stablede data

Det første vi skal gjøre er å legge til en indeks, og det spiller ingen rolle for disse formålene om det er en null-basert indeks eller en en-basert indeks. Vi vil bare bruke en null-basert indeks for denne demonstrasjonen. Det er enkelt å klikke uten å måtte gå gjennom andre alternativer.

Power Query Modulo: Hvordan håndtere stablede data

Dette kommer til å involvere en pivot fordi en pivot tar rader og gjør dem om til kolonner. I dette tilfellet ønsker vi å ta dette settet med rader og gjøre dem om til tre kolonner - en for fornavnet, en for etternavnet og en for e-postadressen.

Vi skal pivotere de i kolonnene, men vi må ha en måte for pivoten å vite hvilket element som går inn i hvilken kolonne. Det er her Power Query Modulo kommer inn.

Innholdsfortegnelse

Håndtering av stablede data ved hjelp av Power Query Modulo

Modulo gir oss resten når vi deler et bestemt tall. For å få tilgang til Modulo går vi til fanen Legg til kolonne, så finner vi Standard, klikker på rullegardinpilen og blar nedover.

Power Query Modulo: Hvordan håndtere stablede data

Når vi klikker på Modulo, får vi en popup-boks som spør om antall kolonner vi ønsker. I dette tilfellet ønsker vi tre kolonner.

Power Query Modulo: Hvordan håndtere stablede data

Hvis vi deler tre på tre, får vi en med resten av null. Tre til fire gir resten av én, tre til fem gir resten av to, og deretter tre til seks gir oss resten av null. Så det produserer dette fine repeterende mønsteret som vi kan bruke for vår pivot.

Men før vi gjør det, la oss rydde opp i dataene. Det er to måter vi kan gjøre dette på. Den ene er at vi rett og slett kan erstatte verdier. For eksempel, for sitatene, kan vi bare sette sitatet der og deretter erstatte det med ingenting. Det tar og renser disse sitatene.

Power Query Modulo: Hvordan håndtere stablede data

Den andre måten å gjøre dette på, hvor vi samtidig kan rydde opp og lagre noen trinn, er ved å bruke en funksjon kalt Text.Remove . Først legger vi til en egendefinert kolonne, og deretter lister vi ned alle verdiene vi ønsker å bli kvitt.

Power Query Modulo: Hvordan håndtere stablede data

Som du kan se, fjerner det alt pent og enkelt. Og så, nå kan vi bli kvitt den første kolonnen, og deretter flytte den tilpassede kolonnen over.

Power Query Modulo: Hvordan håndtere stablede data

Vi kan nå gjøre vårt pivot rent. Vi tar på oss Modulo, går til Transform, og deretter Pivot Column, og vi kommer til å pivotere på Custom, men vi vil ikke at den skal samles. Så vi velger Ikke aggregér og klikker OK.

Power Query Modulo: Hvordan håndtere stablede data

Vi erstatter det bare med disse verdiene i kolonnen. Deretter lager den de tre kolonnene for oss. Vi kan se etternavnet, fornavnet og e-postadressen der inne, men det er ikke akkurat det formatet vi ønsker.

For å fikse det, kan vi ta disse kolonnene, og deretter gjøre en Fyll opp .

Power Query Modulo: Hvordan håndtere stablede data

Og nå har vi disse ekstra radene på grunn av det gjentatte mønsteret til Modulo.

Power Query Modulo: Hvordan håndtere stablede data

Vi kan enkelt bli kvitt det ved å fjerne alternative rader. Vi kan gjøre det i alternativet Fjern rader.

Power Query Modulo: Hvordan håndtere stablede data

Vi kan si at den første raden som skal fjernes er to. Fjern så den andre og tredje raden, og behold den fjerde og gjør det som et repeterende mønster.

Power Query Modulo: Hvordan håndtere stablede data

Du kan nå se at vi har renset alle de riktige dataene på en fin måte, og vi har fortsatt de 28 originale e-postadressene.

Power Query Modulo: Hvordan håndtere stablede data

Nå kan vi bli kvitt indekskolonnen og gi nytt navn til kolonneoverskriftene deretter.




Konklusjon

Du kan se at med bare Modulo-trikset, og deretter pivotering av dataene og med litt rengjøring, er det ganske enkelt å gjøre. Når du først har fått taket på det, tar det sannsynligvis bare et minutt å gjøre hele greia.

Så forhåpentligvis har dette gitt deg noen flere ideer og verktøy. Du kan også sjekke ut min neste veiledning . I det skal vi ta en nærmere titt på noen av tingene vi dekket i denne opplæringen, og også se på hvordan vi kan automatisere denne prosessen på en repeterbar måte ved å bruke tilpassede funksjoner. Jeg skal også vise deg noen kule triks for å feilsøke dine egendefinerte funksjoner.

Jeg håper du fant det nyttig. Du kan se hele videoen nedenfor og sjekk ut lenkene nedenfor for mer relatert innhold.

Beste ønsker!


Pipe In R: Koblingsfunksjoner med Dplyr

Pipe In R: Koblingsfunksjoner med Dplyr

I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

Python i LuckyTemplates: Hvordan installere og sette opp

Python i LuckyTemplates: Hvordan installere og sette opp

Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.

Sortering av datotabellkolonner i LuckyTemplates

Sortering av datotabellkolonner i LuckyTemplates

Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.