Sådan laver du parallelle koordinatplot i Python

Parallelle koordinatplot er et nyttigt visualiseringsværktøj, der bruges til at vise relationer mellem flere variabler, der deler de samme numeriske data. I LuckyTemplates er disse plots skabt med meget simpel Python-kode, som du kan bruge og nemt oprette og stilisere. 

I dagens blog vil vi lære, hvordan du opretter multi-variate eller parallelle koordinatplot ved hjælp af . Vi vil gennemgå processen trin for trin, fra at forberede dataene til at tilpasse plottet for bedre læsbarhed. Du kan se den fulde video af denne tutorial nederst på denne blog

Indholdsfortegnelse

Parallelle koordinatplot i Python: Eksempel 1

Dette er vores første plot. Den viser vores tre variable – Variabel A, B og C, og de to linjer, der repræsenterer punkt 1 og 2. 

Sådan laver du parallelle koordinatplot i Python

Det betyder, at vi har to sæt data, et til punkt 1 og et andet til punkt 2. Og for hvert datasæt har vi vores tre variabler. 

Lad os se på dataene for bedre at forstå, hvordan plottet var struktureret. 

Start med at fremhæve grafen. Klik på Data. 

Sådan laver du parallelle koordinatplot i Python

En tabel med meget simple data skulle dukke op. Det blev oprettet ved hjælp af indsæt tabel-indstillingen. Vi kan se, at der i kolonnerne er variable A, B og C for hvert element, der er adskilt i hver række.

Sådan laver du parallelle koordinatplot i Python

Vi har simple data, men vi kan gøre det til noget, der er meget sigende. For eksempel kan vi i vores plot bestemme, at forholdet mellem dataene er ret "lavt". 

Sådan laver du parallelle koordinatplot i Python

For at illustrere kan vi sammenligne dette plot med vores data. Variabel B i punkt 1 er 100 og 115 i punkt 2, som vist i grafen. 

Vi kan også identificere, hvordan emnerne og variablerne hænger sammen. For eksempel kan vi nemt se, at Variabel A er lavere end B, og at C er den laveste blandt de tre.

Sådan laver du parallelle koordinatplot i Python

Plot Python-koden

Lad os nu fortsætte med koden, der bruges til det faktiske plot. 

Start med at vælge Python visual fra ruden

Sådan laver du parallelle koordinatplot i Python

Fremhæv vores første graf for at åbne . 

Sådan laver du parallelle koordinatplot i Python

Først importerer vi matplotlib.pyplot og gemmer det som en variabel plt. 

Sådan laver du parallelle koordinatplot i Python

Derefter bringer vi pandas.plotting -funktionerne ind. Pandas fungerer som et datamanipulationsbibliotek i LuckyTemplates. Det bruges primært til at manipulere data, men det har også plottefunktioner.

Lad os importere parallel_coordinates fra pandas.plotting . Parallelle_koordinater vil være den primære funktion til at skabe grafen. 

Sådan laver du parallelle koordinatplot i Python

At lave plottet i Python

I linje 13 dokumenterer vi, hvad vi skal gøre, ved at skrive # lav et plot.

Sådan laver du parallelle koordinatplot i Python

Vi bruger parallel_koordinater og passerer i datasættet. 

Sådan laver du parallelle koordinatplot i Python

I linje 3 kan vi se, at datasættet er oprettet ved hjælp af funktionen pandas.DataFrame ( ) . Derefter tilføjer vi Element, Variabel A, Variabel B og Variabel C, som derefter afspejles i vores værdiliste

I linje 4 deduplikeres datasættet ved hjælp af dataset.drop_duplicates ( ).

Sådan laver du parallelle koordinatplot i Python

Vi kan gå til ruden Visualiseringer for at se de værdier , vi tilføjede.

Sådan laver du parallelle koordinatplot i Python

Fjernelse af en af ​​disse værdier vil påvirke vores billeder. For eksempel, hvis vi fjerner variabel C, vil koordinaterne ændre sig tilsvarende, hvilket viser os, hvordan værdierne fungerer

Sådan laver du parallelle koordinatplot i Python

Lad os bringe vores variabel C tilbage ved at markere feltet ved siden af ​​den under Data i felter- ruden.

Indsæt derefter funktionen parallel_coordinates , som tager et par forskellige argumenter. I vores tilfælde tager det datasættet og elementet, som vil give typen og dimensionen fra vores datasæt.

Sådan laver du parallelle koordinatplot i Python

Hvis vi fjerner Item fra vores funktion og kører den, fungerer det visuelle ikke.

Vi får en Python-scriptfejl, der siger, at funktionen parallel_coordinates ( ) mangler 1 påkrævet positionsargument, som er class_column

Sådan laver du parallelle koordinatplot i Python

Så lad os tilføje varen tilbage. Fordi det er positionelt, behøver vi ikke at skrive klassekoordinater. Vi kan køre koden, når den er færdig. 

Sådan laver du parallelle koordinatplot i Python

Viser plottet i Python

Næste trin er at vise plottet, så i linje 16 dokumenterer vi, hvad vi skal gøre, ved at skrive # vis plottet.

Sådan laver du parallelle koordinatplot i Python

Husk at vi importerede matplotlib.pyplot tidligere og gemte det som plt. Det gjorde vi, fordi vi har brug for funktionen plt.show( ) for at vise vores plot. 

Sådan laver du parallelle koordinatplot i Python

Parallelle koordinatplot i Python: Eksempel 2

Vores andet plot er et iris-datasæt, der viser petal_length, petal_width, sepal_length og sepal_width. Den har en lille smule mere stil i forhold til den første graf. 

Sådan laver du parallelle koordinatplot i Python

Dette datasæt blev oprettet med Python-kode. 

For at se vores data skal du klikke på Transformer data og gå til iris_dataset. 

Sådan laver du parallelle koordinatplot i Python

Datasættet indeholder kolonner for dimensionerne – bægerbladslængde , bægerbladsbredde , kronbladslængde og kronbladsbredde . Den har også en kolonne for artstypen

Sådan laver du parallelle koordinatplot i Python

Datasæt Python-koden

Vores data blev nemt bragt ind ved hjælp af Python-kode. Gå til Kilde for at vise Python-scriptet. 

Sådan laver du parallelle koordinatplot i Python

Vores Python-kode har kun to linjer. I den første linje importerede vi seaborn og gemte den som variabel sns . Vi navngav vores datasæt som iris_dataset og brugte sns-variablen til at indlæse datasættet ved hjælp af funktionen sns.load_dataset('iris')

Sådan laver du parallelle koordinatplot i Python

Klik på OK for at få de data, vi har set ovenfor. Naviger gennem dataene, og når du er færdig, kan vi lukke datasættet ved at gå til Luk & Anvend > Luk

Sådan laver du parallelle koordinatplot i Python

Styling af plots i Python

Klik på vores andet plot for at åbne Python-scripteditoren for vores mere stiliserede graf.

Vi starter med at importere matplotlib.pyplot som plt. 

Sådan laver du parallelle koordinatplot i Python

Derefter bruger vi funktionen plt.style.use ('dark_background') til at style det visuelle. 

Sådan laver du parallelle koordinatplot i Python

Vi kan nemt tilpasse baggrunden baseret på vores foretrukne stil ved hjælp af matplotlibs Style sheet reference . I vores tilfælde brugte vi en mørk baggrund.

Sådan laver du parallelle koordinatplot i Python

Lad os også prøve at bruge ggplot , som er en almindelig anvendt stil.

Sådan laver du parallelle koordinatplot i Python

Hvis vi kører det, vil det give os et billede, der ser sådan ud. 

Sådan laver du parallelle koordinatplot i Python

Indlæs derefter pandas-funktionen for grafen ved at importere parallel_coordinates fra pandas.plotting. 

Sådan laver du parallelle koordinatplot i Python

For at lave plottet henter vi datasættet og indstiller vores art som klassen

Sådan laver du parallelle koordinatplot i Python

Sammenlignet med vores første plot tilføjer vi en ekstra parameter, som er farvekortet for at få forskellige farver. Giv det videre ved at bruge matplotlib-variablen plt.get_cmap. 

Sådan laver du parallelle koordinatplot i Python

Der er mange matplotlib-farvevariabler at vælge imellem i matplotlibs Colormap-reference .

Sådan laver du parallelle koordinatplot i Python

For eksempel bruger vi i øjeblikket sæt 2 fra kvalitative farvekort, men vi kan også ændre det til andre farver, såsom hsv fra cykliske farvekort. 

Sådan laver du parallelle koordinatplot i Python

Klik på Kør for at få et plot, der ser sådan ud. 

Sådan laver du parallelle koordinatplot i Python

Hsv ser ikke særlig godt ud på vores data, men vi kan lege, indtil vi finder det bedst egnede farvekort til vores plot. 




Konklusion

I denne tutorial har vi dækket det grundlæggende i at skabe parallelle koordinatplot i Python. Vi har gennemgået processen med at forberede dataene, oprette plottet og tilpasse plottet for bedre læsbarhed. 

Parallelle koordinatplot er et kraftfuldt værktøj til visualisering af højdimensionelle data og kan bruges inden for en række forskellige områder, herunder økonomi, teknik og maskinlæring. Nu hvor vi ved, hvordan man opretter parallelle koordinatplot i , kan vi begynde at bruge dem til bedre at forstå og visualisere vores egne data.

Alt det bedste,

Gaelim Holland


Pipe In R: Tilslutningsfunktioner med Dplyr

Pipe In R: Tilslutningsfunktioner med Dplyr

I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af ​​et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

Python i LuckyTemplates: Sådan installeres og konfigureres

Python i LuckyTemplates: Sådan installeres og konfigureres

Lær, hvordan du installerer programmeringssproget Python i LuckyTemplates, og hvordan du bruger dets værktøjer til at skrive koder og vise billeder.

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Beregning af dynamiske fortjenestemargener – nem analyse af LuckyTemplates med DAX

Lær, hvordan du beregner dynamiske fortjenstmargener ved siden af ​​LuckyTemplates, og hvordan du kan få mere indsigt ved at grave dybere ned i resultaterne.

Sortering af datotabelkolonner i LuckyTemplates

Sortering af datotabelkolonner i LuckyTemplates

Lær, hvordan du sorterer felterne fra kolonner med udvidet datotabel korrekt. Dette er en god strategi at gøre for vanskelige felter.

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

Find dine topprodukter for hver region i LuckyTemplates ved hjælp af DAX

I denne artikel gennemgår jeg, hvordan du kan finde dine topprodukter pr. region ved hjælp af DAX-beregninger i LuckyTemplates, herunder funktionerne TOPN og CALCUATE.

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Junk Dimension: Hvad er det, og hvorfor det er alt andet end junk

Lær, hvordan du bruger en uønsket dimension til flag med lav kardinalitet, som du ønsker at inkorporere i din datamodel på en effektiv måde.