Python-datasett: Bruk av repeterbare koder

I denne bloggen lærer du hvordan du bruker repeterbare koder eller funksjoner for å produsere samme type utdata. Dette vil hjelpe deg å være mer effektiv og anstrenge deg mindre for å hente opp visse data fra forskjellige datasett. I denne opplæringen skal vi bruke en eksisterende kode som jeg tidligere har laget som et eksempel.

Du vil også lære hvordan du lager kopier av datasett for å unngå å skade den opprinnelige versjonen av datasettet, importere biblioteker og funksjoner med repeterbare koder og .

For denne bloggen anbefaler jeg deg å hente CSV- filen hele tiden og ta den over til LuckyTemplates. Jeg skal også demonstrere hvordan vi kan ta med denne CSV-filen og plassere den rett inn i LuckyTemplates, i tilfelle du må gjøre det.

Innholdsfortegnelse

Henter en CSV-fil i LuckyTemplates

For å bringe en CSV-fil til LuckyTemplates, er det første du må gjøre å klikke på " Hent data "-menyen i Hjem- båndet.

Python-datasett: Bruk av repeterbare koder

Etter å ha klikket, vil en rullegardinmeny vises, og du må velge alternativet " Tekst/CSV " fra menyen.

Python-datasett: Bruk av repeterbare koder

Når du velger alternativet " Tekst/CSV ", åpnes et vindu der vi kan velge filen vi ønsker å ta med i LuckyTemplates. For dette eksemplet, la oss bruke IMDB- datasettfilen. 

Python-datasett: Bruk av repeterbare koder

Når du åpner filen IMDB Dataset.csv , vil du se et annet vindu som viser dataene i den filen. Siden denne filen inneholder en stor mengde data, forhåndsviser den bare noen av dataene.

Det første vi skal gjøre i denne filen er å transformere den. For å gjøre det, klikker du bare på " Transform Data "-alternativet nederst til høyre i vinduet.

Python-datasett: Bruk av repeterbare koder

Lage en kopi av Python-datasettet

Før vi gjør noen endringer i dette datasettet, er det viktig å lage en kopi av det originale datasettet. For å gjøre dette, høyreklikk bare på datasettet. 

Python-datasett: Bruk av repeterbare koder

Velg deretter " Kopier " fra menyen .

Python-datasett: Bruk av repeterbare koder

Til slutt, høyreklikkSpørringspanelet og velg deretter " Lim inn " fra alternativene.

Python-datasett: Bruk av repeterbare koder

Etter å ha tatt i bruk disse trinnene, bør du ha en kopi av det originale IMDB-datasettet i Spørringspanelet .

Python-datasett: Bruk av repeterbare koder

Transformere et datasett ved å kjøre et Python-skript

Ved å transformere en CSV-fil, vil du kunne bryte store mengder Python-datasett til mindre. Vi kan gjøre det ved å bruke et Python-skript i denne filen.

Men først må vi sørge for at overskriftene er riktig stilt opp. Klikk på Hjem -menyen og se etter alternativet " Bruk første rad som overskrifter " og klikk på det.

Python-datasett: Bruk av repeterbare koder

Etter å ha klikket på " Bruk første rad som overskrifter "-alternativet, endret overskriftene nå til data fra de forrige første radene som er " gjennomgang " og " sentiment ".

Python-datasett: Bruk av repeterbare koder

Deretter går du til Transform- menyen og klikker på alternativet " Kjør Python-skript " i " Skript "-gruppen med alternativer.

Python-datasett: Bruk av repeterbare koder

Etter det vil et " Kjør Python Script "-vindu dukke opp. I dette vinduet kan du kjøre hvilket som helst Python-skript du ønsker for å transformere den gjeldende filen du bruker. For dette eksempelet skal jeg gjøre datasettet mindre ved å kjøre følgende kode.

Python-datasett: Bruk av repeterbare koder

Jeg brukte .iloc- funksjonen på datasettet for å velge de spesifikke radene og kolonnene fra IMDB-datasettet. Så, i parametrene, valgte jeg alle de første 500 radene og alle kolonnene i IMDB-datasettet. Jeg lagret den i en variabel kalt " datasett ".

Etter å ha kjørt skriptet, bør vi se "datasettet" som er variabelen vi har laget i forrige trinn. Den inneholder dataene vi har endret ved hjelp av Python-skriptet.

Python-datasett: Bruk av repeterbare koder

Sjekker datasettet

For å åpne datasetttabellen klikker du bare på " Tabell " under Verdi- kolonnen.

Python-datasett: Bruk av repeterbare koder

Vi kan se at dette datasettet nå er nede på 500 rader .

Python-datasett: Bruk av repeterbare koder

Nå som vi har brutt ned datasettet vårt i 500 rader, er det neste vi skal gjøre å importere bibliotekene vi trenger. Vi vil gjøre det ved å bruke samme prosedyre som vi gjorde ved å endre innholdet i IMDB-datasettet. Dette er for å sikre at koden vår kan håndteres i visse scenarier med færre endringer.

Importere biblioteker og funksjoner ved hjelp av repeterbare koder

For å importere bibliotekene, la oss gå tilbake til notatboken og kopiere bibliotekene vi trenger. Husk at før denne opplæringen har jeg allerede laget disse bibliotekene vi er i ferd med å kopiere. Jeg gjenbruker bare disse for at du tydelig skal få ideen om bruken av funksjoner som repeterbare koder.

Python-datasett: Bruk av repeterbare koder

Når bibliotekene er kopiert, limer du dem inn i " Kjør skript "-vinduet, og ikke glem å inkludere linjen " fra samlinger import Counter " på slutten av skriptet. 

Python-datasett: Bruk av repeterbare koder

Deretter kopierer vi datarensingsfunksjonen fra notatboken vår og legger den til skriptet i LuckyTemplates.

Python-datasett: Bruk av repeterbare koder

Vi legger det til under bibliotekene. 

Python-datasett: Bruk av repeterbare koder

Vi kopierer også koden for å kalle funksjonen vi nettopp la til.

Python-datasett: Bruk av repeterbare koder

Deretter limer du det inn i Python-skriptet i LuckyTemplates.

Python-datasett: Bruk av repeterbare koder

Generering av datatabeller

Nå som vi har lagt til koden for å kalle funksjonen, må vi endre " df2 " til " datasett " og " tittel " til " anmeldelse ". Vi gjorde dette på grunn av endringene vi har gjort i datasettet.

Vi endret "df2" til " datasett " fordi vi lagret dataene med 500 rader i "datasett". Så for "tittel" oppdaterte vi den til "review" som et resultat av å endre overskriftene til kolonnene.

Med disse kodene lagt til, bør vi være i stand til å få eller generere 3 tabeller som er data1 for ordfrekvens, data2 for bigramfrekvens og data3 for trigramfrekvens.

Python-datasett: Bruk av repeterbare koder

Du kan også lage en annen kopi av dette endrede IMDB-datasettet (2) for å åpne en annen tabell senere.

Python-datasett: Bruk av repeterbare koder

Nå i IMDB Dataset (2) , la oss åpne data1- tabellen

Python-datasett: Bruk av repeterbare koder

 Når data1-tabellen er åpnet, kan vi se listen over ord så vel som frekvensen.

Python-datasett: Bruk av repeterbare koder

Som du kan se, er vi i stand til å utføre visse prosedyrer fra hoveddatasettet med bruk av repeterbare koder som vi tok fra Jupyter Notebook. Med disse repeterbare kodene er vi i stand til å transformere et Python-datasett og generere en tabell for ordfrekvens, bigramfrekvens og trigramfrekvens uten å skrive inn kodene på nytt.

I IMDB Dataset (3) , la oss åpne data2-tabellen for å se bigramfrekvensen.

Python-datasett: Bruk av repeterbare koder

I bigramfrekvenstabellen kan du se " br " inkludert i listen. Dette er sannsynligvis koblet til en HTML-kode. Vi kan ganske enkelt gå tilbake og legge til noe annet, men vi kommer ikke til å gjøre det i denne opplæringen.

Nå som dataene er lastet inn ved hjelp av de repeterbare kodene, kan vi begynne å lage visualiseringer om det i LuckyTemplates. For eksempel a for frekvensen til hvert ord. 

Python-datasett: Bruk av repeterbare koder




Konklusjon

For å oppsummere kan repeterbare koder hjelpe deg med å utføre visse prosedyrer på et datasett med mindre innsats. Du har lært hvordan du bruker repeterbare koder for å transformere et Python-datasett i LuckyTemplates. Du var også i stand til å bruke .iloc -funksjonen til å spesifisere rader og kolonner som skal velges ved endring av et datasett.

I tillegg har du laget kopier av datasett og laget en visualisering ved hjelp av et stolpediagram. Denne visualiseringen er basert på Python-datasettene som vi har laget og endret ved hjelp av repeterbare koder.

Beste ønsker,

Gaellim


Variabler og uttrykk i Power Query Editor

Variabler og uttrykk i Power Query Editor

Denne opplæringen vil diskutere om variabler og uttrykk i Power Query Editor. Du lærer hvordan du skriver og bygger dem riktig.

Hvordan lage et Lucky Templates-varmekart

Hvordan lage et Lucky Templates-varmekart

Et LuckyTemplates-varmekart er en type visualisering som brukes til å vise datatetthet på et kart. I denne opplæringen vil jeg diskutere hvordan vi kan lage en – ikke gå glipp av noe!

Opprette et Pareto-diagram i LuckyTemplates – Avansert DAX

Opprette et Pareto-diagram i LuckyTemplates – Avansert DAX

Jeg skal lære deg et veldig interessant eksempel rundt Pareto-prinsippet og hvordan du lager et Pareto-diagram ved hjelp av viktige DAX-formler.

Egendefinert stolpediagram i LuckyTemplates: varianter og modifikasjoner

Egendefinert stolpediagram i LuckyTemplates: varianter og modifikasjoner

Lær hvordan et tilpasset stolpediagram på markedsplassen kan brukes til datasammenligning og hvordan du kan lage dem ved å bruke eksempler i LuckyTemplates.

Kraftautomatisering av statiske resultater: En oversikt

Kraftautomatisering av statiske resultater: En oversikt

Lær hvordan Power Automate Static Results-funksjonen fungerer og hvorfor det er bra å bli lagt til de beste praksisene når du lager flytdiagrammer.

LuckyTemplates Python-opplæring: Hvordan oversette tekster

LuckyTemplates Python-opplæring: Hvordan oversette tekster

eDNA demonstrerer hvordan du utfører språk- eller tekstoversettelse ved hjelp av Python og overfører det til LuckyTemplates. LuckyTemplates Python-opplæring.

Lag et Gantt-diagram i LuckyTemplates Report Builder

Lag et Gantt-diagram i LuckyTemplates Report Builder

I denne opplæringen lærer du hvordan du bruker Gauge Bullet Graph til å lage et Gantt-diagram i LuckyTemplates Report Builder.

Lag 3D-spredningsplott ved å bruke Python i LuckyTemplates

Lag 3D-spredningsplott ved å bruke Python i LuckyTemplates

I denne opplæringen lærer du hvordan du lager et tredimensjonalt (3D) spredningsplott ved å bruke Python i LuckyTemplates.

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Effektiv LuckyTemplates-rapportering – øktgjennomgang og ressursnedlasting

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet

Ny kundeanalyse med LuckyTemplates – Neste medlemsbegivenhet