Hvordan lage parallelle koordinatplott i Python

Parallelle koordinatplott er et nyttig visualiseringsverktøy som brukes til å vise forhold mellom flere variabler som deler samme numeriske data. I LuckyTemplates er disse plottene laget med veldig enkel Python-kode som du kan bruke og enkelt lage og stilisere. 

I dagens blogg skal vi lære hvordan du lager multivariate eller parallelle koordinatplott ved hjelp av . Vi vil gå gjennom prosessen steg-for-steg, fra å forberede dataene til å tilpasse plottet for bedre lesbarhet. Du kan se hele videoen av denne opplæringen nederst på denne bloggen

Innholdsfortegnelse

Parallelle koordinatplott i Python: Eksempel 1

Dette er vårt første plot. Den viser våre tre variabler – Variabel A, B og C, og de to linjene som representerer element 1 og 2. 

Hvordan lage parallelle koordinatplott i Python

Det betyr at vi har to sett med data, ett for element 1 og et annet for element 2. Og for hvert datasett har vi våre tre variabler. 

La oss se på dataene for bedre å forstå hvordan plottet ble strukturert. 

Start med å markere grafen. Klikk på Data. 

Hvordan lage parallelle koordinatplott i Python

En tabell med svært enkle data skal vises. Den ble opprettet ved å bruke alternativet for å sette inn tabell. Vi kan se at i kolonnene er variablene A, B og C for hvert element som er atskilt i hver rad.

Hvordan lage parallelle koordinatplott i Python

Vi har enkle data, men vi kan gjøre det om til noe som er veldig talende. For eksempel, i plottet vårt, kan vi fastslå at forholdet mellom dataene er ganske "lavt". 

Hvordan lage parallelle koordinatplott i Python

For å illustrere kan vi sammenligne dette plottet med våre data. Variabel B i element 1 er 100 og 115 i element 2, som vist i grafen. 

Vi kan også identifisere hvordan elementene og variablene er relatert. For eksempel kan vi lett se at variabel A er lavere enn B, og at C er lavest blant de tre.

Hvordan lage parallelle koordinatplott i Python

Plot Python-koden

La oss nå fortsette med koden som ble brukt for selve plottet. 

Start med å velge Python visual fra ruten

Hvordan lage parallelle koordinatplott i Python

Marker vår første graf for å åpne . 

Hvordan lage parallelle koordinatplott i Python

Først importerer vi matplotlib.pyplot og lagrer det som en variabel plt. 

Hvordan lage parallelle koordinatplott i Python

Deretter tar vi inn pandas.plotting -funksjonene. Pandas fungerer som et datamanipulasjonsbibliotek i LuckyTemplates. Den brukes først og fremst til å manipulere data, men den har også plottefunksjoner.

La oss importere parallell_koordinater fra pandas.plotting . Parallelle_koordinater vil være den primære funksjonen for å lage grafen. 

Hvordan lage parallelle koordinatplott i Python

Lage plottet i Python

I linje 13 dokumenterer vi hva vi skal gjøre ved å skrive # lag et plot.

Hvordan lage parallelle koordinatplott i Python

Vi bruker parallell_koordinater og passerer i datasettet. 

Hvordan lage parallelle koordinatplott i Python

På linje 3 kan vi se at datasettet er opprettet ved hjelp av funksjonen pandas.DataFrame ( ) . Deretter legger vi til element, variabel A, variabel B og variabel C, som deretter gjenspeiles i verdilisten vår . 

I linje 4 dedupliseres datasettet ved hjelp av datasett.drop_duplicates ( ).

Hvordan lage parallelle koordinatplott i Python

Vi kan gå til visualiseringsruten for å se verdiene vi har lagt til.

Hvordan lage parallelle koordinatplott i Python

Hvis du fjerner en av disse verdiene, vil det påvirke bildene våre. For eksempel, hvis vi fjerner variabel C, vil koordinatene endres tilsvarende, og viser oss hvordan verdiene fungerer

Hvordan lage parallelle koordinatplott i Python

La oss hente tilbake vår variabel C ved å merke av i boksen ved siden av den under Data i feltruten .

Deretter sender du funksjonen parallell_koordinater som tar noen forskjellige argumenter. I vårt tilfelle tar det datasettet og elementet, som vil gi typen og dimensjonen fra datasettet vårt.

Hvordan lage parallelle koordinatplott i Python

Hvis vi fjerner Item fra funksjonen vår og kjører den, vil det visuelle ikke fungere.

Vi vil få en Python-skriptfeil som sier at funksjonen parallell_koordinater ( ) mangler 1 nødvendig posisjonsargument, som er klassekolonnen

Hvordan lage parallelle koordinatplott i Python

Så la oss legge til elementet tilbake. Fordi det er posisjonelt, trenger vi ikke å skrive klassekoordinater. Vi kan kjøre koden når den er ferdig. 

Hvordan lage parallelle koordinatplott i Python

Viser plottet i Python

Neste steg er å vise plottet, så i linje 16 dokumenterer vi hva vi skal gjøre ved å skrive # vis plottet.

Hvordan lage parallelle koordinatplott i Python

Husk at vi importerte matplotlib.pyplot tidligere og lagret det som plt. Vi gjorde det fordi vi trenger funksjonen plt.show( ) for å vise plottet vårt. 

Hvordan lage parallelle koordinatplott i Python

Parallelle koordinatplott i Python: Eksempel 2

Vårt andre plot er et iris-datasett som viser petal_length, petal_width, sepal_length og sepal_width. Den har litt mer stil i forhold til den første grafen. 

Hvordan lage parallelle koordinatplott i Python

Dette datasettet ble opprettet med Python-kode. 

For å se våre data, klikk Transform data og gå til iris_dataset. 

Hvordan lage parallelle koordinatplott i Python

Datasettet inneholder kolonner for dimensjonene – begerbladlengde , begerbladbredde , kronbladlengde og kronbladbredde . Den har også en kolonne for artstypen

Hvordan lage parallelle koordinatplott i Python

Datasettet Python-koden

Dataene våre ble enkelt hentet inn ved hjelp av Python-kode. Gå til Kilde for å vise Python-skriptet. 

Hvordan lage parallelle koordinatplott i Python

Python-koden vår har bare to linjer. I den første linjen importerte vi sjøborn og lagret den som variabel sns . Vi kalte datasettet vårt som iris_dataset og brukte sns-variabelen for å laste datasettet ved å bruke sns.load_dataset('iris') -funksjonen. 

Hvordan lage parallelle koordinatplott i Python

Klikk OK for å få dataene vi har sett ovenfor. Naviger gjennom dataene, og når du er ferdig, kan vi lukke datasettet ved å gå til Lukk og bruk > Lukk

Hvordan lage parallelle koordinatplott i Python

Styling plott i Python

For å åpne Python-skripteditoren for vår mer stiliserte graf, klikk på vårt andre plot.

Vi starter med å importere matplotlib.pyplot som plt. 

Hvordan lage parallelle koordinatplott i Python

Deretter bruker vi funksjonen plt.style.use ('dark_background') for å style det visuelle. 

Hvordan lage parallelle koordinatplott i Python

Vi kan enkelt tilpasse bakgrunnen basert på vår foretrukne stil ved å bruke matplotlibs stilarkreferanse . I vårt tilfelle brukte vi en mørk bakgrunn.

Hvordan lage parallelle koordinatplott i Python

La oss også prøve å bruke ggplot , som er en vanlig stil som brukes.

Hvordan lage parallelle koordinatplott i Python

Hvis vi kjører det, vil det gi oss et bilde som ser slik ut. 

Hvordan lage parallelle koordinatplott i Python

Deretter laster du inn pandafunksjonen for grafen ved å importere parallelle_koordinater fra pandas.plotting. 

Hvordan lage parallelle koordinatplott i Python

For å lage plottet tar vi inn datasettet og setter vår art som klassen

Hvordan lage parallelle koordinatplott i Python

Sammenlignet med vårt første plot, legger vi til en ekstra parameter som er fargekartet for å få forskjellige farger. Send det inn ved å bruke matplotlib-variabelen plt.get_cmap. 

Hvordan lage parallelle koordinatplott i Python

Det er mange matplotlib-fargevariabler å velge mellom i matplotlibs Colormap-referanse .

Hvordan lage parallelle koordinatplott i Python

For eksempel bruker vi for øyeblikket sett 2 fra kvalitative fargekart, men vi kan også endre det til andre farger, for eksempel hsv fra sykliske fargekart. 

Hvordan lage parallelle koordinatplott i Python

Klikk kjør for å få et plott som ser slik ut. 

Hvordan lage parallelle koordinatplott i Python

Hsv ser ikke veldig bra ut på dataene våre, men vi kan leke oss til vi finner det best egnede fargekartet for tomten vår. 




Konklusjon

I denne opplæringen har vi dekket det grunnleggende om å lage parallelle koordinatplott i Python. Vi har gått gjennom prosessen med å forberede dataene, lage plottet og tilpasse plottet for bedre lesbarhet. 

Parallelle koordinatplott er et kraftig verktøy for å visualisere høydimensjonale data og kan brukes i en rekke felt, inkludert økonomi, ingeniørfag og maskinlæring. Nå som vi vet hvordan vi lager parallelle koordinatplott i , kan vi begynne å bruke dem for å bedre forstå og visualisere våre egne data.

Beste ønsker,

Gaelim Holland


Pipe In R: Koblingsfunksjoner med Dplyr

Pipe In R: Koblingsfunksjoner med Dplyr

I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

Python i LuckyTemplates: Hvordan installere og sette opp

Python i LuckyTemplates: Hvordan installere og sette opp

Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.

Sortering av datotabellkolonner i LuckyTemplates

Sortering av datotabellkolonner i LuckyTemplates

Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.