Python-datasett: Bruk av repeterbare koder

I denne bloggen lærer du hvordan du bruker repeterbare koder eller funksjoner for å produsere samme type utdata. Dette vil hjelpe deg å være mer effektiv og anstrenge deg mindre for å hente opp visse data fra forskjellige datasett. I denne opplæringen skal vi bruke en eksisterende kode som jeg tidligere har laget som et eksempel.

Du vil også lære hvordan du lager kopier av datasett for å unngå å skade den opprinnelige versjonen av datasettet, importere biblioteker og funksjoner med repeterbare koder og .

For denne bloggen anbefaler jeg deg å hente CSV- filen hele tiden og ta den over til LuckyTemplates. Jeg skal også demonstrere hvordan vi kan ta med denne CSV-filen og plassere den rett inn i LuckyTemplates, i tilfelle du må gjøre det.

Innholdsfortegnelse

Henter en CSV-fil i LuckyTemplates
Lage en kopi av Python-datasettet
Transformere et datasett ved å kjøre et Python-skript
Sjekker datasettet
Importere biblioteker og funksjoner ved hjelp av repeterbare koder
Generering av datatabeller
Konklusjon

Henter en CSV-fil i LuckyTemplates

For å bringe en CSV-fil til LuckyTemplates, er det første du må gjøre å klikke på " Hent data "-menyen i Hjem- båndet.

Python-datasett: Bruk av repeterbare koder

Etter å ha klikket, vil en rullegardinmeny vises, og du må velge alternativet " Tekst/CSV " fra menyen.

Python-datasett: Bruk av repeterbare koder

Når du velger alternativet " Tekst/CSV ", åpnes et vindu der vi kan velge filen vi ønsker å ta med i LuckyTemplates. For dette eksemplet, la oss bruke IMDB- datasettfilen.

Python-datasett: Bruk av repeterbare koder

Når du åpner filen IMDB Dataset.csv , vil du se et annet vindu som viser dataene i den filen. Siden denne filen inneholder en stor mengde data, forhåndsviser den bare noen av dataene.

Det første vi skal gjøre i denne filen er å transformere den. For å gjøre det, klikker du bare på " Transform Data "-alternativet nederst til høyre i vinduet.

Python-datasett: Bruk av repeterbare koder

Lage en kopi av Python-datasettet

Før vi gjør noen endringer i dette datasettet, er det viktig å lage en kopi av det originale datasettet. For å gjøre dette, høyreklikk bare på datasettet.

Python-datasett: Bruk av repeterbare koder

Velg deretter " Kopier " fra menyen .

Python-datasett: Bruk av repeterbare koder

Til slutt, høyreklikk på Spørringspanelet og velg deretter " Lim inn " fra alternativene.

Python-datasett: Bruk av repeterbare koder

Etter å ha tatt i bruk disse trinnene, bør du ha en kopi av det originale IMDB-datasettet i Spørringspanelet .

Python-datasett: Bruk av repeterbare koder

Transformere et datasett ved å kjøre et Python-skript

Ved å transformere en CSV-fil, vil du kunne bryte store mengder Python-datasett til mindre. Vi kan gjøre det ved å bruke et Python-skript i denne filen.

Men først må vi sørge for at overskriftene er riktig stilt opp. Klikk på Hjem -menyen og se etter alternativet " Bruk første rad som overskrifter " og klikk på det.

Python-datasett: Bruk av repeterbare koder

Etter å ha klikket på " Bruk første rad som overskrifter "-alternativet, endret overskriftene nå til data fra de forrige første radene som er " gjennomgang " og " sentiment ".

Python-datasett: Bruk av repeterbare koder

Deretter går du til Transform- menyen og klikker på alternativet " Kjør Python-skript " i " Skript "-gruppen med alternativer.

Python-datasett: Bruk av repeterbare koder

Etter det vil et " Kjør Python Script "-vindu dukke opp. I dette vinduet kan du kjøre hvilket som helst Python-skript du ønsker for å transformere den gjeldende filen du bruker. For dette eksempelet skal jeg gjøre datasettet mindre ved å kjøre følgende kode.

Python-datasett: Bruk av repeterbare koder

Jeg brukte .iloc- funksjonen på datasettet for å velge de spesifikke radene og kolonnene fra IMDB-datasettet. Så, i parametrene, valgte jeg alle de første 500 radene og alle kolonnene i IMDB-datasettet. Jeg lagret den i en variabel kalt " datasett ".

Etter å ha kjørt skriptet, bør vi se "datasettet" som er variabelen vi har laget i forrige trinn. Den inneholder dataene vi har endret ved hjelp av Python-skriptet.

Python-datasett: Bruk av repeterbare koder

Sjekker datasettet

For å åpne datasetttabellen klikker du bare på " Tabell " under Verdi- kolonnen.

Python-datasett: Bruk av repeterbare koder

Vi kan se at dette datasettet nå er nede på 500 rader .

Python-datasett: Bruk av repeterbare koder

Nå som vi har brutt ned datasettet vårt i 500 rader, er det neste vi skal gjøre å importere bibliotekene vi trenger. Vi vil gjøre det ved å bruke samme prosedyre som vi gjorde ved å endre innholdet i IMDB-datasettet. Dette er for å sikre at koden vår kan håndteres i visse scenarier med færre endringer.

Importere biblioteker og funksjoner ved hjelp av repeterbare koder

For å importere bibliotekene, la oss gå tilbake til notatboken og kopiere bibliotekene vi trenger. Husk at før denne opplæringen har jeg allerede laget disse bibliotekene vi er i ferd med å kopiere. Jeg gjenbruker bare disse for at du tydelig skal få ideen om bruken av funksjoner som repeterbare koder.

Python-datasett: Bruk av repeterbare koder

Når bibliotekene er kopiert, limer du dem inn i " Kjør skript "-vinduet, og ikke glem å inkludere linjen " fra samlinger import Counter " på slutten av skriptet.

Python-datasett: Bruk av repeterbare koder

Deretter kopierer vi datarensingsfunksjonen fra notatboken vår og legger den til skriptet i LuckyTemplates.

Python-datasett: Bruk av repeterbare koder

Vi legger det til under bibliotekene.

Python-datasett: Bruk av repeterbare koder

Vi kopierer også koden for å kalle funksjonen vi nettopp la til.

Python-datasett: Bruk av repeterbare koder

Deretter limer du det inn i Python-skriptet i LuckyTemplates.

Python-datasett: Bruk av repeterbare koder

Generering av datatabeller

Nå som vi har lagt til koden for å kalle funksjonen, må vi endre " df2 " til " datasett " og " tittel " til " anmeldelse ". Vi gjorde dette på grunn av endringene vi har gjort i datasettet.

Vi endret "df2" til " datasett " fordi vi lagret dataene med 500 rader i "datasett". Så for "tittel" oppdaterte vi den til "review" som et resultat av å endre overskriftene til kolonnene.

Med disse kodene lagt til, bør vi være i stand til å få eller generere 3 tabeller som er data1 for ordfrekvens, data2 for bigramfrekvens og data3 for trigramfrekvens.

Python-datasett: Bruk av repeterbare koder

Du kan også lage en annen kopi av dette endrede IMDB-datasettet (2) for å åpne en annen tabell senere.

Python-datasett: Bruk av repeterbare koder

Nå i IMDB Dataset (2) , la oss åpne data1- tabellen .

Python-datasett: Bruk av repeterbare koder

Når data1-tabellen er åpnet, kan vi se listen over ord så vel som frekvensen.

Python-datasett: Bruk av repeterbare koder

Som du kan se, er vi i stand til å utføre visse prosedyrer fra hoveddatasettet med bruk av repeterbare koder som vi tok fra Jupyter Notebook. Med disse repeterbare kodene er vi i stand til å transformere et Python-datasett og generere en tabell for ordfrekvens, bigramfrekvens og trigramfrekvens uten å skrive inn kodene på nytt.

I IMDB Dataset (3) , la oss åpne data2-tabellen for å se bigramfrekvensen.

Python-datasett: Bruk av repeterbare koder

I bigramfrekvenstabellen kan du se " br " inkludert i listen. Dette er sannsynligvis koblet til en HTML-kode. Vi kan ganske enkelt gå tilbake og legge til noe annet, men vi kommer ikke til å gjøre det i denne opplæringen.

Nå som dataene er lastet inn ved hjelp av de repeterbare kodene, kan vi begynne å lage visualiseringer om det i LuckyTemplates. For eksempel a for frekvensen til hvert ord.

Python-datasett: Bruk av repeterbare koder

Konklusjon

For å oppsummere kan repeterbare koder hjelpe deg med å utføre visse prosedyrer på et datasett med mindre innsats. Du har lært hvordan du bruker repeterbare koder for å transformere et Python-datasett i LuckyTemplates. Du var også i stand til å bruke .iloc -funksjonen til å spesifisere rader og kolonner som skal velges ved endring av et datasett.

I tillegg har du laget kopier av datasett og laget en visualisering ved hjelp av et stolpediagram. Denne visualiseringen er basert på Python-datasettene som vi har laget og endret ved hjelp av repeterbare koder.

Beste ønsker,

Gaellim

Leave a Comment

DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

DAX Studio EVALUATE Nøkkelord: Grunnleggende eksempler

Lær å bruke DAX Studio EVALUATE nøkkelordet med grunnleggende eksempler og få en bedre forståelse av hvordan dette kan hjelpe deg med databehandling.

Opprette en datotabell i LuckyTemplates

Opprette en datotabell i LuckyTemplates

Finn ut hvorfor det er viktig å ha en dedikert datotabell i LuckyTemplates, og lær den raskeste og mest effektive måten å gjøre det på.

LuckyTemplates Mobile Reporting Tips og teknikker

LuckyTemplates Mobile Reporting Tips og teknikker

Denne korte opplæringen fremhever LuckyTemplates mobilrapporteringsfunksjon. Jeg skal vise deg hvordan du kan utvikle rapporter effektivt for mobil.

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

Profesjonelle tjenesteanalyserapporter i LuckyTemplates

I denne LuckyTemplates-utstillingen vil vi gå gjennom rapporter som viser profesjonell tjenesteanalyse fra et firma som har flere kontrakter og kundeengasjementer.

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Microsoft Power Platform-oppdateringer | Microsoft Ignite 2021

Gå gjennom de viktigste oppdateringene for Power Apps og Power Automate og deres fordeler og implikasjoner for Microsoft Power Platform.

Vanlige SQL-funksjoner: en oversikt

Vanlige SQL-funksjoner: en oversikt

Oppdag noen vanlige SQL-funksjoner som vi kan bruke som streng, dato og noen avanserte funksjoner for å behandle eller manipulere data.

LuckyTemplates Template Creation: Guide og tips

LuckyTemplates Template Creation: Guide og tips

I denne opplæringen lærer du hvordan du lager din perfekte LuckyTemplates-mal som er konfigurert til dine behov og preferanser.

Feltparametre og små multipler i LuckyTemplates

Feltparametre og små multipler i LuckyTemplates

I denne bloggen vil vi demonstrere hvordan du legger feltparametere sammen med små multipler for å skape utrolig nyttig innsikt og grafikk.

LuckyTemplates-rangering og tilpasset gruppering

LuckyTemplates-rangering og tilpasset gruppering

I denne bloggen vil du lære hvordan du bruker LuckyTemplates rangering og tilpassede grupperingsfunksjoner for å segmentere et eksempeldata og rangere det i henhold til kriterier.

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

Viser kun kumulativ total opp til en bestemt dato i LuckyTemplates

I denne opplæringen skal jeg dekke en spesifikk teknikk rundt hvordan du viser kumulativ total kun opp til en bestemt dato i grafikken i LuckyTemplates.