Vad är Power Query & M Language: En detaljerad översikt
Denna handledning ger en översikt över Power Query Editor och M-språket på LuckyTemplates-skrivbordet.
I den här bloggen kommer du att lära dig hur du använder repeterbara koder eller funktioner för att producera samma typ av utdata. Detta kommer att hjälpa dig att bli mer effektiv och anstränga dig mindre för att hämta vissa data från olika datamängder. I den här handledningen kommer vi att använda en befintlig kod som jag tidigare har skapat som ett exempel.
Du kommer också att lära dig hur du gör kopior av datamängder för att undvika att skada den ursprungliga versionen av datamängden, importera bibliotek och funktioner med repeterbara koder och .
För den här bloggen rekommenderar jag att du skaffar CSV- filen hela tiden och tar över den till LuckyTemplates. Jag kommer också att visa hur vi kan ta med den här CSV-filen och placera den direkt i LuckyTemplates, ifall du skulle behöva göra det.
Innehållsförteckning
Hämtar en CSV-fil i LuckyTemplates
För att ta med en CSV-fil till LuckyTemplates är det första du behöver göra att klicka på menyn " Hämta data " i menyfliksområdet Hem .
Efter att ha klickat visas en rullgardinsmeny och du måste välja alternativet " Text/CSV " från menyn.
När du väljer alternativet " Text/CSV " öppnas ett fönster där vi kan välja filen som vi vill ta med i LuckyTemplates. För det här exemplet, låt oss använda IMDB Dataset- filen.
När du öppnar filen IMDB Dataset.csv ser du ett annat fönster som visar data i filen. Eftersom den här filen innehåller en stor mängd data, förhandsgranskar den bara en del av datan.
Det första vi ska göra i den här filen är att transformera den. För att göra det klickar du bara på alternativet " Transformera data " längst ner till höger i fönstret.
Att göra en kopia av Python-datasetet
Innan vi gör några ändringar i denna datauppsättning är det viktigt att göra en kopia av den ursprungliga datauppsättningen. För att göra detta, högerklicka bara på datasetet.
Välj sedan " Kopiera " från menyn .
Slutligen, högerklicka på frågepanelen och välj sedan " Klistra in " från alternativen.
Efter att ha tillämpat dessa steg bör du ha en kopia av den ursprungliga IMDB-datauppsättningen i frågepanelen .
Förvandla en datamängd genom att köra ett Python-skript
Genom att omvandla en CSV-fil kommer du att kunna dela upp stora mängder Python-datauppsättningar till mindre. Vi kan göra det genom att använda något Python-skript i den här filen.
Men först måste vi se till att rubrikerna är rätt uppställda. Klicka på Hem -menyn och leta sedan efter alternativet " Använd första raden som rubriker " och klicka på det.
Efter att ha klickat på alternativet " Använd första raden som rubriker " ändrades nu rubrikerna till data från de föregående första raderna som är " recension " och " sentiment ".
Gå sedan till Transform- menyn och klicka på alternativet " Kör Python Script " i gruppen " Skript " med alternativ.
Efter det kommer ett " Kör Python Script "-fönster att dyka upp. I det här fönstret kan du köra vilket Python-skript du vill för att omvandla den aktuella filen du använder. För det här exemplet kommer jag att göra datasetet mindre genom att köra följande kod.
Jag använde .iloc -funktionen på datasetet för att välja specifika rader och kolumner från IMDB-datasetet. Sedan, i parametrarna, valde jag alla de första 500 raderna och alla kolumner i IMDB Dataset. Jag lagrade den i en variabel som heter " dataset ".
Efter att ha kört skriptet bör vi se "dataset" som är variabeln vi skapade i föregående steg. Den innehåller data som vi har ändrat med Python-skriptet.
Kontrollerar datamängden
För att öppna datauppsättningstabellen klickar du bara på " Tabell " under värdekolumnen .
Vi kan se att denna datauppsättning nu är nere på 500 rader .
Nu när vi har delat upp vår datauppsättning i 500 rader, är nästa sak vi ska göra importera de bibliotek vi behöver. Vi kommer att göra det med samma procedur som vi gjorde när vi ändrade innehållet i IMDB Dataset. Detta för att säkerställa att vår kod kan vara hanterbar i vissa scenarier med färre ändringar.
Importera bibliotek och funktioner med hjälp av repeterbara koder
För att importera biblioteken, låt oss gå tillbaka till vår anteckningsbok och kopiera de bibliotek som vi behöver. Tänk på att innan den här handledningen har jag redan skapat de här biblioteken som vi ska kopiera. Jag återanvänder bara dessa för att du tydligt ska få idén om användningen av funktioner som repeterbara koder.
När biblioteken har kopierats, klistra in dem i " Kör skript "-fönstret och glöm inte att inkludera raden " från samlingsimporträknare " i slutet av skriptet.
Sedan kopierar vi datarensningsfunktionen från vår anteckningsbok och lägger till den i skriptet i LuckyTemplates.
Vi lägger till det under biblioteken.
Vi kommer också att kopiera koden för att anropa funktionen som vi just lade till.
Klistra sedan in det i Python-skriptet i LuckyTemplates.
Generera datatabeller
Nu när vi har lagt till koden för att anropa funktionen måste vi ändra " df2 " till " dataset " och " titel " till " recension ". Vi gjorde detta på grund av de ändringar vi har gjort i datamängden.
Vi ändrade "df2" till " dataset " eftersom vi lagrade data med 500 rader i "dataset". Sedan för "titel" uppdaterade vi den till "recension" som ett resultat av att vi ändrade rubrikerna i kolumnerna.
Med dessa koder tillagda borde vi kunna få eller generera 3 tabeller som är data1 för ordfrekvens, data2 för bigramfrekvens och data3 för trigramfrekvens.
Du kan också göra en annan kopia av denna ändrade IMDB Dataset (2) för att öppna en annan tabell senare.
Nu i IMDB Dataset (2) , låt oss öppna tabellen data1 .
När data1-tabellen väl har öppnats kan vi se listan med ord såväl som frekvensen.
Som du kan se kan vi utföra vissa procedurer från huvuddataset med användning av repeterbara koder som vi tog från Jupyter Notebook. Med dessa repeterbara koder kan vi transformera en Python-datauppsättning och generera en tabell för ordfrekvens, bigramfrekvens och trigramfrekvens utan att skriva in koderna igen.
I IMDB Dataset (3) , låt oss öppna data2-tabellen för att se bigramfrekvensen.
I bigramfrekvenstabellen kan du se " br " som ingår i listan. Detta är förmodligen kopplat till en HTML-kod. Vi kan helt enkelt gå tillbaka och lägga till något annat men vi kommer inte att göra det i den här handledningen.
Nu när data har laddats med hjälp av de repeterbara koderna kan vi börja göra visualiseringar om det i LuckyTemplates. Till exempel, a för frekvensen av varje ord.
Slutsats
Sammanfattningsvis kan repeterbara koder hjälpa dig att utföra vissa procedurer på en datauppsättning med mindre ansträngning. Du har lärt dig hur du använder repeterbara koder för att transformera en Python-datauppsättning i LuckyTemplates. Du kunde också använda .iloc -funktionen för att ange de rader och kolumner som ska väljas för att ändra en datauppsättning.
Dessutom har du skapat kopior av datauppsättningar och skapat en visualisering med hjälp av ett stapeldiagram. Denna visualisering är baserad på Python-datauppsättningarna som vi har skapat och ändrat med hjälp av repeterbara koder.
Med vänliga hälsningar,
Gaellim
Denna handledning ger en översikt över Power Query Editor och M-språket på LuckyTemplates-skrivbordet.
Lär dig hur du skapar en sidnumrerad rapport, lägger till texter och bilder och sedan exporterar din rapport till olika dokumentformat.
Lär dig hur du använder SharePoint-automatiseringsfunktionen för att skapa arbetsflöden och hjälpa dig att mikrohantera SharePoint-användare, bibliotek och listor.
Finslipa dina färdigheter i rapportutveckling genom att gå med i en dataanalysutmaning. Acceleratorn kan hjälpa dig att bli en LuckyTemplates superanvändare!
Lär dig hur du beräknar löpande summor i LuckyTemplates med DAX. Löpande summor låter dig inte fastna i ett individuellt resultat.
Förstå konceptet med variabler i DAX inom LuckyTemplates och konsekvenserna av variabler för hur dina mått beräknas.
Lär dig mer om den anpassade visual som kallas LuckyTemplates Slope-diagram, som används för att visa ökning/minskning för en enstaka eller flera mätvärden.
Upptäck färgteman i LuckyTemplates. Dessa är viktiga för att dina rapporter och visualiseringar ska se ut och fungera sömlöst.
Att beräkna ett genomsnitt i LuckyTemplates kan göras på många sätt för att ge dig exakt information för dina affärsrapporter.
Låt oss fördjupa oss i Standard LuckyTemplates-teman och granska några av funktionerna som är inbyggda i själva LuckyTemplates Desktop-applikationen.