Hur man gör parallella koordinater i Python

Parallella koordinatdiagram är ett användbart visualiseringsverktyg som används för att visa samband mellan flera variabler som delar samma numeriska data. I LuckyTemplates skapas dessa plotter med mycket enkel Python-kod som du kan använda och enkelt skapa och stilisera. 

I dagens blogg kommer vi att lära oss hur man skapar multivariat eller parallella koordinatdiagram med hjälp av . Vi kommer att gå igenom processen steg-för-steg, från att förbereda data till att anpassa plottet för bättre läsbarhet. Du kan se hela videon av denna handledning längst ner på den här bloggen

Innehållsförteckning

Parallella koordinater i Python: Exempel 1

Det här är vår första tomt. Den visar våra tre variabler – Variabel A, B och C, och de två raderna som representerar objekt 1 och 2. 

Hur man gör parallella koordinater i Python

Det betyder att vi har två uppsättningar data, en för objekt 1 och en annan för objekt 2. Och för varje datamängd har vi våra tre variabler. 

Låt oss titta på data för att bättre förstå hur handlingen var strukturerad. 

Börja med att markera grafen. Klicka på Data. 

Hur man gör parallella koordinater i Python

En tabell med mycket enkla data bör visas. Den skapades med alternativet Infoga tabell. Vi kan se att i kolumnerna finns variablerna A, B och C för varje objekt som är separerade i varje rad.

Hur man gör parallella koordinater i Python

Vi har enkla data, men vi kan förvandla det till något som är väldigt talande. Till exempel, i vår plot, kan vi fastställa att förhållandet mellan data är ganska "lågt". 

Hur man gör parallella koordinater i Python

För att illustrera kan vi jämföra denna plot med våra data. Variabel B i objekt 1 är 100 och 115 i objekt 2, som visas i grafen. 

Vi kan också identifiera hur objekten och variablerna är relaterade. Till exempel kan vi lätt se att variabel A är lägre än B, och att C är den lägsta av de tre.

Hur man gör parallella koordinater i Python

Plot Python-koden

Låt oss nu fortsätta med koden som används för den faktiska tomten. 

Börja med att välja Python visual från rutan

Hur man gör parallella koordinater i Python

Markera vår första graf för att öppna . 

Hur man gör parallella koordinater i Python

Först importerar vi matplotlib.pyplot och sparar den som en variabel plt. 

Hur man gör parallella koordinater i Python

Sedan tar vi in ​​pandas.plotting- funktionerna. Pandas fungerar som ett datamanipuleringsbibliotek i LuckyTemplates. Den används främst för att manipulera data, men den har också plottningsfunktioner.

Låt oss importera parallell_koordinater från pandas.plotting . Parallella_koordinater kommer att vara den primära funktionen för att skapa grafen. 

Hur man gör parallella koordinater i Python

Gör handlingen i Python

På rad 13 dokumenterar vi vad vi ska göra genom att skriva # gör en plot.

Hur man gör parallella koordinater i Python

Vi använder parallell_koordinater och skickar in datasetet. 

Hur man gör parallella koordinater i Python

På rad 3 kan vi se att datamängden skapas med funktionen pandas.DataFrame ( ) . Sedan lägger vi till objekt, variabel A, variabel B och variabel C, som sedan återspeglas i vår värdelista

På rad 4 dedupliceras datasetet med hjälp av dataset.drop_duplicates ( ).

Hur man gör parallella koordinater i Python

Vi kan gå till fönstret Visualiseringar för att se de värden som vi har lagt till.

Hur man gör parallella koordinater i Python

Att ta bort något av dessa värden kommer att påverka våra bilder. Om vi ​​till exempel tar bort variabel C kommer koordinaterna att ändras i enlighet med detta, vilket visar oss hur värdena fungerar

Hur man gör parallella koordinater i Python

Låt oss ta tillbaka vår variabel C genom att markera rutan bredvid den under Data i fältrutan .

Skicka sedan in funktionen parallell_koordinater som tar några olika argument. I vårt fall tar det datasetet och objektet, som kommer att tillhandahålla typen och dimensionen från vår dataset.

Hur man gör parallella koordinater i Python

Om vi ​​tar bort Item från vår funktion och kör den, kommer det visuella inte att fungera.

Vi kommer att få ett Python-skriptfel som säger att funktionen parallell_koordinater ( ) saknar ett obligatoriskt positionsargument, vilket är klasskolumnen

Hur man gör parallella koordinater i Python

Så låt oss lägga till objektet tillbaka. Eftersom det är positionellt behöver vi inte skriva klasskoordinater. Vi kan köra koden när den är klar. 

Hur man gör parallella koordinater i Python

Visar handlingen i Python

Nästa steg är att visa handlingen, så på rad 16 dokumenterar vi vad vi ska göra genom att skriva # visa handlingen.

Hur man gör parallella koordinater i Python

Kom ihåg att vi importerade matplotlib.pyplot tidigare och sparade den som plt. Vi gjorde det eftersom vi behöver funktionen plt.show( ) för att visa vår plot. 

Hur man gör parallella koordinater i Python

Parallella koordinater i Python: Exempel 2

Vår andra plot är en irisdatauppsättning som visar petal_length, petal_width, sepal_length och sepal_width. Den har lite mer stil jämfört med den första grafen. 

Hur man gör parallella koordinater i Python

Denna datauppsättning skapades med Python-kod. 

För att se våra data, klicka på Transform data och gå till iris_dataset. 

Hur man gör parallella koordinater i Python

Datauppsättningen innehåller kolumner för dimensionerna – foderbladslängd , foderbladsbredd , kronbladslängd och kronbladsbredd . Den har också en kolumn för  arttypen .

Hur man gör parallella koordinater i Python

Dataset Python-koden

Vår data togs in enkelt med Python-kod. Gå till Källa för att visa Python-skriptet. 

Hur man gör parallella koordinater i Python

Vår Python-kod har bara två rader. I den första raden importerade vi seaborn och sparade den som variabel sns . Vi döpte vår datauppsättning som iris_dataset och använde variabeln sns för att ladda datauppsättningen med funktionen  sns.load_dataset('iris') .

Hur man gör parallella koordinater i Python

Klicka på OK för att få informationen vi har sett ovan. Navigera genom data, och när du är klar kan vi stänga datamängden genom att gå till Stäng och tillämpa > Stäng

Hur man gör parallella koordinater i Python

Styling plotter i Python

För att öppna Python-skriptredigeraren för vår mer stiliserade graf, klicka på vår andra plot.

Vi börjar med att importera matplotlib.pyplot som plt. 

Hur man gör parallella koordinater i Python

Sedan använder vi funktionen plt.style.use ('dark_background') för att utforma det visuella. 

Hur man gör parallella koordinater i Python

Vi kan enkelt anpassa bakgrunden baserat på vår föredragna stil med matplotlibs stilmallsreferens . I vårt fall använde vi en mörk bakgrund.

Hur man gör parallella koordinater i Python

Låt oss också prova att använda ggplot , som är en vanlig stil som används.

Hur man gör parallella koordinater i Python

Om vi ​​kör det kommer det att ge oss en bild som ser ut så här. 

Hur man gör parallella koordinater i Python

Ladda sedan pandasfunktionen för grafen genom att importera parallell_koordinater från pandas.plotting. 

Hur man gör parallella koordinater i Python

För att göra plottet tar vi in ​​datasetet och ställer in vår art som klassen

Hur man gör parallella koordinater i Python

Jämfört med vår första plot lägger vi till ytterligare en parameter som är färgkartan för att få olika färger. Skicka in det med matplotlib-variabeln plt.get_cmap. 

Hur man gör parallella koordinater i Python

Det finns många matplotlib-färgvariabler att välja mellan i matplotlibs Colormap-referens .

Hur man gör parallella koordinater i Python

Till exempel använder vi för närvarande set 2 från kvalitativa färgkartor men vi kan också ändra det till andra färger, såsom hsv från cykliska färgkartor. 

Hur man gör parallella koordinater i Python

Klicka på kör för att få en plot som ser ut så här. 

Hur man gör parallella koordinater i Python

Hsv ser inte så bra ut på vår data, men vi kan leka tills vi hittar den mest lämpliga färgkartan för vår tomt. 




Slutsats

I den här handledningen har vi täckt grunderna för att skapa parallella koordinatdiagram i Python. Vi har gått igenom processen med att förbereda data, skapa handlingen och anpassa handlingen för bättre läsbarhet. 

Parallella koordinatdiagram är ett kraftfullt verktyg för att visualisera högdimensionell data och kan användas inom en mängd olika områden, inklusive ekonomi, teknik och maskininlärning. Nu när vi vet hur man skapar parallella koordinatdiagram i , kan vi börja använda dem för att bättre förstå och visualisera vår egen data.

Med vänliga hälsningar,

Gaelim Holland


Pipe In R: Anslutningsfunktioner med Dplyr

Pipe In R: Anslutningsfunktioner med Dplyr

I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.

Extrahera LuckyTemplates-teman och bilder från PBIX

Extrahera LuckyTemplates-teman och bilder från PBIX

Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!

Excel Formler Fuskblad: Mellanvägledning

Excel Formler Fuskblad: Mellanvägledning

Excel Formler Fuskblad: Mellanvägledning

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

Python i LuckyTemplates: Hur man installerar och ställer in

Python i LuckyTemplates: Hur man installerar och ställer in

Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.

Beräkna dynamiska vinstmarginaler – enkel analys av LuckyTemplates med DAX

Beräkna dynamiska vinstmarginaler – enkel analys av LuckyTemplates med DAX

Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.

Sortering av datumtabellkolumner i LuckyTemplates

Sortering av datumtabellkolumner i LuckyTemplates

Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.

Hitta dina bästa produkter för varje region i LuckyTemplates med DAX

Hitta dina bästa produkter för varje region i LuckyTemplates med DAX

I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.

Skräpdimension: Vad är det och varför det är allt annat än skräp

Skräpdimension: Vad är det och varför det är allt annat än skräp

Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.