Variabler og uttrykk i Power Query Editor
Denne opplæringen vil diskutere om variabler og uttrykk i Power Query Editor. Du lærer hvordan du skriver og bygger dem riktig.
I denne bloggen lærer du hvordan du bruker repeterbare koder eller funksjoner for å produsere samme type utdata. Dette vil hjelpe deg å være mer effektiv og anstrenge deg mindre for å hente opp visse data fra forskjellige datasett. I denne opplæringen skal vi bruke en eksisterende kode som jeg tidligere har laget som et eksempel.
Du vil også lære hvordan du lager kopier av datasett for å unngå å skade den opprinnelige versjonen av datasettet, importere biblioteker og funksjoner med repeterbare koder og .
For denne bloggen anbefaler jeg deg å hente CSV- filen hele tiden og ta den over til LuckyTemplates. Jeg skal også demonstrere hvordan vi kan ta med denne CSV-filen og plassere den rett inn i LuckyTemplates, i tilfelle du må gjøre det.
Innholdsfortegnelse
Henter en CSV-fil i LuckyTemplates
For å bringe en CSV-fil til LuckyTemplates, er det første du må gjøre å klikke på " Hent data "-menyen i Hjem- båndet.
Etter å ha klikket, vil en rullegardinmeny vises, og du må velge alternativet " Tekst/CSV " fra menyen.
Når du velger alternativet " Tekst/CSV ", åpnes et vindu der vi kan velge filen vi ønsker å ta med i LuckyTemplates. For dette eksemplet, la oss bruke IMDB- datasettfilen.
Når du åpner filen IMDB Dataset.csv , vil du se et annet vindu som viser dataene i den filen. Siden denne filen inneholder en stor mengde data, forhåndsviser den bare noen av dataene.
Det første vi skal gjøre i denne filen er å transformere den. For å gjøre det, klikker du bare på " Transform Data "-alternativet nederst til høyre i vinduet.
Lage en kopi av Python-datasettet
Før vi gjør noen endringer i dette datasettet, er det viktig å lage en kopi av det originale datasettet. For å gjøre dette, høyreklikk bare på datasettet.
Velg deretter " Kopier " fra menyen .
Til slutt, høyreklikk på Spørringspanelet og velg deretter " Lim inn " fra alternativene.
Etter å ha tatt i bruk disse trinnene, bør du ha en kopi av det originale IMDB-datasettet i Spørringspanelet .
Transformere et datasett ved å kjøre et Python-skript
Ved å transformere en CSV-fil, vil du kunne bryte store mengder Python-datasett til mindre. Vi kan gjøre det ved å bruke et Python-skript i denne filen.
Men først må vi sørge for at overskriftene er riktig stilt opp. Klikk på Hjem -menyen og se etter alternativet " Bruk første rad som overskrifter " og klikk på det.
Etter å ha klikket på " Bruk første rad som overskrifter "-alternativet, endret overskriftene nå til data fra de forrige første radene som er " gjennomgang " og " sentiment ".
Deretter går du til Transform- menyen og klikker på alternativet " Kjør Python-skript " i " Skript "-gruppen med alternativer.
Etter det vil et " Kjør Python Script "-vindu dukke opp. I dette vinduet kan du kjøre hvilket som helst Python-skript du ønsker for å transformere den gjeldende filen du bruker. For dette eksempelet skal jeg gjøre datasettet mindre ved å kjøre følgende kode.
Jeg brukte .iloc- funksjonen på datasettet for å velge de spesifikke radene og kolonnene fra IMDB-datasettet. Så, i parametrene, valgte jeg alle de første 500 radene og alle kolonnene i IMDB-datasettet. Jeg lagret den i en variabel kalt " datasett ".
Etter å ha kjørt skriptet, bør vi se "datasettet" som er variabelen vi har laget i forrige trinn. Den inneholder dataene vi har endret ved hjelp av Python-skriptet.
Sjekker datasettet
For å åpne datasetttabellen klikker du bare på " Tabell " under Verdi- kolonnen.
Vi kan se at dette datasettet nå er nede på 500 rader .
Nå som vi har brutt ned datasettet vårt i 500 rader, er det neste vi skal gjøre å importere bibliotekene vi trenger. Vi vil gjøre det ved å bruke samme prosedyre som vi gjorde ved å endre innholdet i IMDB-datasettet. Dette er for å sikre at koden vår kan håndteres i visse scenarier med færre endringer.
Importere biblioteker og funksjoner ved hjelp av repeterbare koder
For å importere bibliotekene, la oss gå tilbake til notatboken og kopiere bibliotekene vi trenger. Husk at før denne opplæringen har jeg allerede laget disse bibliotekene vi er i ferd med å kopiere. Jeg gjenbruker bare disse for at du tydelig skal få ideen om bruken av funksjoner som repeterbare koder.
Når bibliotekene er kopiert, limer du dem inn i " Kjør skript "-vinduet, og ikke glem å inkludere linjen " fra samlinger import Counter " på slutten av skriptet.
Deretter kopierer vi datarensingsfunksjonen fra notatboken vår og legger den til skriptet i LuckyTemplates.
Vi legger det til under bibliotekene.
Vi kopierer også koden for å kalle funksjonen vi nettopp la til.
Deretter limer du det inn i Python-skriptet i LuckyTemplates.
Generering av datatabeller
Nå som vi har lagt til koden for å kalle funksjonen, må vi endre " df2 " til " datasett " og " tittel " til " anmeldelse ". Vi gjorde dette på grunn av endringene vi har gjort i datasettet.
Vi endret "df2" til " datasett " fordi vi lagret dataene med 500 rader i "datasett". Så for "tittel" oppdaterte vi den til "review" som et resultat av å endre overskriftene til kolonnene.
Med disse kodene lagt til, bør vi være i stand til å få eller generere 3 tabeller som er data1 for ordfrekvens, data2 for bigramfrekvens og data3 for trigramfrekvens.
Du kan også lage en annen kopi av dette endrede IMDB-datasettet (2) for å åpne en annen tabell senere.
Nå i IMDB Dataset (2) , la oss åpne data1- tabellen .
Når data1-tabellen er åpnet, kan vi se listen over ord så vel som frekvensen.
Som du kan se, er vi i stand til å utføre visse prosedyrer fra hoveddatasettet med bruk av repeterbare koder som vi tok fra Jupyter Notebook. Med disse repeterbare kodene er vi i stand til å transformere et Python-datasett og generere en tabell for ordfrekvens, bigramfrekvens og trigramfrekvens uten å skrive inn kodene på nytt.
I IMDB Dataset (3) , la oss åpne data2-tabellen for å se bigramfrekvensen.
I bigramfrekvenstabellen kan du se " br " inkludert i listen. Dette er sannsynligvis koblet til en HTML-kode. Vi kan ganske enkelt gå tilbake og legge til noe annet, men vi kommer ikke til å gjøre det i denne opplæringen.
Nå som dataene er lastet inn ved hjelp av de repeterbare kodene, kan vi begynne å lage visualiseringer om det i LuckyTemplates. For eksempel a for frekvensen til hvert ord.
Konklusjon
For å oppsummere kan repeterbare koder hjelpe deg med å utføre visse prosedyrer på et datasett med mindre innsats. Du har lært hvordan du bruker repeterbare koder for å transformere et Python-datasett i LuckyTemplates. Du var også i stand til å bruke .iloc -funksjonen til å spesifisere rader og kolonner som skal velges ved endring av et datasett.
I tillegg har du laget kopier av datasett og laget en visualisering ved hjelp av et stolpediagram. Denne visualiseringen er basert på Python-datasettene som vi har laget og endret ved hjelp av repeterbare koder.
Beste ønsker,
Gaellim
Denne opplæringen vil diskutere om variabler og uttrykk i Power Query Editor. Du lærer hvordan du skriver og bygger dem riktig.
Et LuckyTemplates-varmekart er en type visualisering som brukes til å vise datatetthet på et kart. I denne opplæringen vil jeg diskutere hvordan vi kan lage en – ikke gå glipp av noe!
Jeg skal lære deg et veldig interessant eksempel rundt Pareto-prinsippet og hvordan du lager et Pareto-diagram ved hjelp av viktige DAX-formler.
Lær hvordan et tilpasset stolpediagram på markedsplassen kan brukes til datasammenligning og hvordan du kan lage dem ved å bruke eksempler i LuckyTemplates.
Lær hvordan Power Automate Static Results-funksjonen fungerer og hvorfor det er bra å bli lagt til de beste praksisene når du lager flytdiagrammer.
eDNA demonstrerer hvordan du utfører språk- eller tekstoversettelse ved hjelp av Python og overfører det til LuckyTemplates. LuckyTemplates Python-opplæring.
I denne opplæringen lærer du hvordan du bruker Gauge Bullet Graph til å lage et Gantt-diagram i LuckyTemplates Report Builder.
I denne opplæringen lærer du hvordan du lager et tredimensjonalt (3D) spredningsplott ved å bruke Python i LuckyTemplates.
Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting
Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet