Python Dataset: Tillämpa repeterbara koder

I den här bloggen kommer du att lära dig hur du använder repeterbara koder eller funktioner för att producera samma typ av utdata. Detta kommer att hjälpa dig att bli mer effektiv och anstränga dig mindre för att hämta vissa data från olika datamängder. I den här handledningen kommer vi att använda en befintlig kod som jag tidigare har skapat som ett exempel.

Du kommer också att lära dig hur du gör kopior av datamängder för att undvika att skada den ursprungliga versionen av datamängden, importera bibliotek och funktioner med repeterbara koder och .

För den här bloggen rekommenderar jag att du skaffar CSV- filen hela tiden och tar över den till LuckyTemplates. Jag kommer också att visa hur vi kan ta med den här CSV-filen och placera den direkt i LuckyTemplates, ifall du skulle behöva göra det.

Innehållsförteckning

Hämtar en CSV-fil i LuckyTemplates

För att ta med en CSV-fil till LuckyTemplates är det första du behöver göra att klicka på menyn " Hämta data " i menyfliksområdet Hem .

Python Dataset: Tillämpa repeterbara koder

Efter att ha klickat visas en rullgardinsmeny och du måste välja alternativet " Text/CSV " från menyn.

Python Dataset: Tillämpa repeterbara koder

När du väljer alternativet " Text/CSV " öppnas ett fönster där vi kan välja filen som vi vill ta med i LuckyTemplates. För det här exemplet, låt oss använda IMDB Dataset- filen. 

Python Dataset: Tillämpa repeterbara koder

När du öppnar filen IMDB Dataset.csv ser du ett annat fönster som visar data i filen. Eftersom den här filen innehåller en stor mängd data, förhandsgranskar den bara en del av datan.

Det första vi ska göra i den här filen är att transformera den. För att göra det klickar du bara på alternativet " Transformera data " längst ner till höger i fönstret.

Python Dataset: Tillämpa repeterbara koder

Att göra en kopia av Python-datasetet

Innan vi gör några ändringar i denna datauppsättning är det viktigt att göra en kopia av den ursprungliga datauppsättningen. För att göra detta, högerklicka bara på datasetet. 

Python Dataset: Tillämpa repeterbara koder

Välj sedan " Kopiera " från menyn .

Python Dataset: Tillämpa repeterbara koder

Slutligen, högerklickafrågepanelen och välj sedan " Klistra in " från alternativen.

Python Dataset: Tillämpa repeterbara koder

Efter att ha tillämpat dessa steg bör du ha en kopia av den ursprungliga IMDB-datauppsättningen i frågepanelen .

Python Dataset: Tillämpa repeterbara koder

Förvandla en datamängd genom att köra ett Python-skript

Genom att omvandla en CSV-fil kommer du att kunna dela upp stora mängder Python-datauppsättningar till mindre. Vi kan göra det genom att använda något Python-skript i den här filen.

Men först måste vi se till att rubrikerna är rätt uppställda. Klicka på Hem -menyn och leta sedan efter alternativet " Använd första raden som rubriker " och klicka på det.

Python Dataset: Tillämpa repeterbara koder

Efter att ha klickat på alternativet " Använd första raden som rubriker " ändrades nu rubrikerna till data från de föregående första raderna som är " recension " och " sentiment ".

Python Dataset: Tillämpa repeterbara koder

Gå sedan till Transform- menyn och klicka på alternativet " Kör Python Script " i gruppen " Skript " med alternativ.

Python Dataset: Tillämpa repeterbara koder

Efter det kommer ett " Kör Python Script "-fönster att dyka upp. I det här fönstret kan du köra vilket Python-skript du vill för att omvandla den aktuella filen du använder. För det här exemplet kommer jag att göra datasetet mindre genom att köra följande kod.

Python Dataset: Tillämpa repeterbara koder

Jag använde .iloc -funktionen på datasetet för att välja specifika rader och kolumner från IMDB-datasetet. Sedan, i parametrarna, valde jag alla de första 500 raderna och alla kolumner i IMDB Dataset. Jag lagrade den i en variabel som heter " dataset ".

Efter att ha kört skriptet bör vi se "dataset" som är variabeln vi skapade i föregående steg. Den innehåller data som vi har ändrat med Python-skriptet.

Python Dataset: Tillämpa repeterbara koder

Kontrollerar datamängden

För att öppna datauppsättningstabellen klickar du bara på " Tabell " under värdekolumnen .

Python Dataset: Tillämpa repeterbara koder

Vi kan se att denna datauppsättning nu är nere på 500 rader .

Python Dataset: Tillämpa repeterbara koder

Nu när vi har delat upp vår datauppsättning i 500 rader, är nästa sak vi ska göra importera de bibliotek vi behöver. Vi kommer att göra det med samma procedur som vi gjorde när vi ändrade innehållet i IMDB Dataset. Detta för att säkerställa att vår kod kan vara hanterbar i vissa scenarier med färre ändringar.

Importera bibliotek och funktioner med hjälp av repeterbara koder

För att importera biblioteken, låt oss gå tillbaka till vår anteckningsbok och kopiera de bibliotek som vi behöver. Tänk på att innan den här handledningen har jag redan skapat de här biblioteken som vi ska kopiera. Jag återanvänder bara dessa för att du tydligt ska få idén om användningen av funktioner som repeterbara koder.

Python Dataset: Tillämpa repeterbara koder

När biblioteken har kopierats, klistra in dem i " Kör skript "-fönstret och glöm inte att inkludera raden " från samlingsimporträknare " i slutet av skriptet. 

Python Dataset: Tillämpa repeterbara koder

Sedan kopierar vi datarensningsfunktionen från vår anteckningsbok och lägger till den i skriptet i LuckyTemplates.

Python Dataset: Tillämpa repeterbara koder

Vi lägger till det under biblioteken. 

Python Dataset: Tillämpa repeterbara koder

Vi kommer också att kopiera koden för att anropa funktionen som vi just lade till.

Python Dataset: Tillämpa repeterbara koder

Klistra sedan in det i Python-skriptet i LuckyTemplates.

Python Dataset: Tillämpa repeterbara koder

Generera datatabeller

Nu när vi har lagt till koden för att anropa funktionen måste vi ändra " df2 " till " dataset " och " titel " till " recension ". Vi gjorde detta på grund av de ändringar vi har gjort i datamängden.

Vi ändrade "df2" till " dataset " eftersom vi lagrade data med 500 rader i "dataset". Sedan för "titel" uppdaterade vi den till "recension" som ett resultat av att vi ändrade rubrikerna i kolumnerna.

Med dessa koder tillagda borde vi kunna få eller generera 3 tabeller som är data1 för ordfrekvens, data2 för bigramfrekvens och data3 för trigramfrekvens.

Python Dataset: Tillämpa repeterbara koder

Du kan också göra en annan kopia av denna ändrade IMDB Dataset (2) för att öppna en annan tabell senare.

Python Dataset: Tillämpa repeterbara koder

Nu i IMDB Dataset (2) , låt oss öppna tabellen data1

Python Dataset: Tillämpa repeterbara koder

 När data1-tabellen väl har öppnats kan vi se listan med ord såväl som frekvensen.

Python Dataset: Tillämpa repeterbara koder

Som du kan se kan vi utföra vissa procedurer från huvuddataset med användning av repeterbara koder som vi tog från Jupyter Notebook. Med dessa repeterbara koder kan vi transformera en Python-datauppsättning och generera en tabell för ordfrekvens, bigramfrekvens och trigramfrekvens utan att skriva in koderna igen.

I IMDB Dataset (3) , låt oss öppna data2-tabellen för att se bigramfrekvensen.

Python Dataset: Tillämpa repeterbara koder

I bigramfrekvenstabellen kan du se " br " som ingår i listan. Detta är förmodligen kopplat till en HTML-kod. Vi kan helt enkelt gå tillbaka och lägga till något annat men vi kommer inte att göra det i den här handledningen.

Nu när data har laddats med hjälp av de repeterbara koderna kan vi börja göra visualiseringar om det i LuckyTemplates. Till exempel, a för frekvensen av varje ord. 

Python Dataset: Tillämpa repeterbara koder




Slutsats

Sammanfattningsvis kan repeterbara koder hjälpa dig att utföra vissa procedurer på en datauppsättning med mindre ansträngning. Du har lärt dig hur du använder repeterbara koder för att transformera en Python-datauppsättning i LuckyTemplates. Du kunde också använda .iloc -funktionen för att ange de rader och kolumner som ska väljas för att ändra en datauppsättning.

Dessutom har du skapat kopior av datauppsättningar och skapat en visualisering med hjälp av ett stapeldiagram. Denna visualisering är baserad på Python-datauppsättningarna som vi har skapat och ändrat med hjälp av repeterbara koder.

Med vänliga hälsningar,

Gaellim


Vad är Power Query & M Language: En detaljerad översikt

Vad är Power Query & M Language: En detaljerad översikt

Denna handledning ger en översikt över Power Query Editor och M-språket på LuckyTemplates-skrivbordet.

Skapa en paginerad rapport: Lägga till texter och bilder

Skapa en paginerad rapport: Lägga till texter och bilder

Lär dig hur du skapar en sidnumrerad rapport, lägger till texter och bilder och sedan exporterar din rapport till olika dokumentformat.

SharePoint Automate-funktionen | En introduktion

SharePoint Automate-funktionen | En introduktion

Lär dig hur du använder SharePoint-automatiseringsfunktionen för att skapa arbetsflöden och hjälpa dig att mikrohantera SharePoint-användare, bibliotek och listor.

Lös en dataanalysutmaning med LuckyTemplates Accelerator

Lös en dataanalysutmaning med LuckyTemplates Accelerator

Finslipa dina färdigheter i rapportutveckling genom att gå med i en dataanalysutmaning. Acceleratorn kan hjälpa dig att bli en LuckyTemplates superanvändare!

Löpande summor i LuckyTemplates med DAX

Löpande summor i LuckyTemplates med DAX

Lär dig hur du beräknar löpande summor i LuckyTemplates med DAX. Löpande summor låter dig inte fastna i ett individuellt resultat.

LuckyTemplates Dax-variabler är konstanta: Vad betyder detta?

LuckyTemplates Dax-variabler är konstanta: Vad betyder detta?

Förstå konceptet med variabler i DAX inom LuckyTemplates och konsekvenserna av variabler för hur dina mått beräknas.

LuckyTemplates Slope Chart: En översikt

LuckyTemplates Slope Chart: En översikt

Lär dig mer om den anpassade visual som kallas LuckyTemplates Slope-diagram, som används för att visa ökning/minskning för en enstaka eller flera mätvärden.

LuckyTemplates färgteman för enhetliga visualiseringar

LuckyTemplates färgteman för enhetliga visualiseringar

Upptäck färgteman i LuckyTemplates. Dessa är viktiga för att dina rapporter och visualiseringar ska se ut och fungera sömlöst.

Beräkna medelvärde i LuckyTemplates: Isolera veckodags- eller helgresultat med DAX

Beräkna medelvärde i LuckyTemplates: Isolera veckodags- eller helgresultat med DAX

Att beräkna ett genomsnitt i LuckyTemplates kan göras på många sätt för att ge dig exakt information för dina affärsrapporter.

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

Låt oss fördjupa oss i Standard LuckyTemplates-teman och granska några av funktionerna som är inbyggda i själva LuckyTemplates Desktop-applikationen.