Ako vytvoriť paralelné súradnicové grafy v Pythone

Paralelné súradnicové grafy sú užitočným vizualizačným nástrojom, ktorý sa používa na zobrazenie vzťahov medzi viacerými premennými zdieľajúcimi rovnaké číselné údaje. V LuckyTemplates sú tieto grafy vytvorené pomocou veľmi jednoduchého kódu Python, ktorý môžete použiť a jednoducho vytvoriť a štylizovať. 

V dnešnom blogu sa naučíme vytvárať viacrozmerné alebo paralelné súradnicové grafy pomocou . Prejdeme si procesom krok za krokom, od prípravy dát až po prispôsobenie grafu pre lepšiu čitateľnosť. Celé video tohto návodu si môžete pozrieť v spodnej časti tohto blogu

Obsah

Paralelné súradnicové grafy v Pythone: Ukážka 1

Toto je naša prvá zápletka. Zobrazuje naše tri premenné – premennú A, B a C a dva riadky predstavujúce položky 1 a 2. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

To znamená, že máme dve sady údajov, jednu pre položku 1 a druhú pre položku 2. A pre každú množinu údajov máme naše tri premenné. 

Pozrime sa na údaje, aby sme lepšie pochopili, ako bol graf štruktúrovaný. 

Začnite zvýraznením grafu. Kliknite na položku Údaje. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Mala by sa objaviť tabuľka s veľmi jednoduchými údajmi. Bol vytvorený pomocou možnosti vloženia tabuľky. Vidíme, že v stĺpcoch sú premenné A, B a C pre každú položku, ktoré sú oddelené v každom riadku.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Máme jednoduché údaje, ale môžeme ich premeniť na niečo, čo je veľmi výpovedné. Napríklad v našom grafe môžeme určiť, že vzťah medzi údajmi je dosť „nízky“. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Pre ilustráciu môžeme tento graf porovnať s našimi údajmi. Premenná B v položke 1 je 100 a 115 v položke 2, ako je znázornené v grafe. 

Môžeme tiež identifikovať, ako súvisia položky a premenné. Napríklad môžeme ľahko vidieť, že premenná A je nižšia ako B a že C je najnižšia spomedzi troch.

Ako vytvoriť paralelné súradnicové grafy v Pythone

The Plot Python Code

Teraz pokračujme s kódom použitým pre skutočný graf. 

Začnite výberom vizuálu Pythonu z tably

Ako vytvoriť paralelné súradnicové grafy v Pythone

Zvýraznením nášho prvého grafu otvoríte súbor . 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Najprv importujeme matplotlib.pyplot a uložíme ho ako premennú plt. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Potom prinášame funkcie pandas.plotting . Pandas slúži ako knižnica na manipuláciu s údajmi v LuckyTemplates. Primárne sa používa na manipuláciu s údajmi, ale má aj funkcie na vykresľovanie.

Naimportujme paralelné_súradnice z pandas.plotting . Parallel_coordinates budú primárnou funkciou na vytvorenie grafu. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Tvorba zápletky v Pythone

V riadku 13 dokumentujeme, čo ideme robiť, napísaním # make a plot.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Používame paralelné_súradnice a odovzdávame množinu údajov. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

V riadku 3 vidíme, že súbor údajov je vytvorený pomocou funkcie pandas.DataFrame ( ) . Potom pridáme položku, premennú A, premennú B a premennú C, ktoré sa potom prejavia v našom zozname hodnôt

V riadku 4 je množina údajov deduplikovaná pomocou dataset.drop_duplicates ( ).

Ako vytvoriť paralelné súradnicové grafy v Pythone

Môžeme prejsť na tablu Vizualizácie a zobraziť hodnoty , ktoré sme pridali.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Odstránenie ktorejkoľvek z týchto hodnôt ovplyvní náš vizuál. Ak napríklad odstránime premennú C, súradnice sa zodpovedajúcim spôsobom zmenia, čo nám ukáže, ako hodnoty fungujú

Ako vytvoriť paralelné súradnicové grafy v Pythone

Obnovme našu premennú C začiarknutím políčka vedľa nej v časti Údaje na table Polia .

Ďalej zadajte funkciu parallel_coordinates , ktorá má niekoľko rôznych argumentov. V našom prípade to vyžaduje množinu údajov a položku, ktorá poskytne typ a rozmer z našej množiny údajov.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Ak odstránime položku z našej funkcie a spustíme ju, vizuál nebude fungovať.

Dostaneme chybu skriptu Python, ktorá hovorí, že vo funkcii parallel_coordinates ( ) chýba 1 požadovaný pozičný argument, ktorým je stĺpec_triedy. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Pridajme teda položku späť. Pretože je pozičný, nemusíme písať súradnice triedy. Po dokončení môžeme kód spustiť. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Zobrazenie zápletky v Pythone

Ďalším krokom je zobrazenie pozemku, takže v riadku 16 zdokumentujeme, čo budeme robiť, napísaním # show the plot.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Pripomeňme, že sme predtým importovali matplotlib.pyplot a uložili ho ako plt. Urobili sme to, pretože potrebujeme funkciu plt.show() na zobrazenie nášho grafu. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Paralelné súradnicové grafy v Pythone: Ukážka 2

Náš druhý graf je súbor údajov o dúhovke zobrazujúci dĺžku okvetných lístkov, šírku okvetných lístkov, dĺžku sepalu a šírku sepalu. V porovnaní s prvým grafom má trochu viac štýlu. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Tento súbor údajov bol vytvorený pomocou kódu Python. 

Ak chcete zobraziť naše údaje, kliknite na položku Transformovať údaje a prejdite na súbor iris_dataset. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Množina údajov obsahuje stĺpce pre rozmery – dĺžka sepalu , šírka sepalu , dĺžka okvetného lístka a šírka okvetného lístka . Má tiež stĺpec pre typ druhu

Ako vytvoriť paralelné súradnicové grafy v Pythone

Kód množiny údajov Python

Naše údaje boli prinesené jednoducho pomocou kódu Python. Prejdite na Zdroj a zobrazte skript Python. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Náš kód Python má iba dva riadky. V prvom riadku sme importovali seaborn a uložili ho ako premennú sns . Náš súbor údajov sme pomenovali ako iris_dataset a použili sme premennú sns na načítanie súboru údajov pomocou funkcie sns.load_dataset('iris')

Ako vytvoriť paralelné súradnicové grafy v Pythone

Kliknutím na tlačidlo OK získate údaje, ktoré sme videli vyššie. Prechádzajte údajmi a po dokončení môžeme množinu údajov zatvoriť tak, že prejdete na Zavrieť a použiť > Zavrieť

Ako vytvoriť paralelné súradnicové grafy v Pythone

Styling pozemkov v Pythone

Ak chcete otvoriť editor skriptov Python pre náš štylizovanejší graf, kliknite na náš druhý graf.

Začneme importovaním matplotlib.pyplot ako plt. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Potom použijeme funkciu plt.style.use ('tmavé_pozadie') na úpravu vizuálu. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Pozadie môžeme jednoducho prispôsobiť na základe nášho preferovaného štýlu pomocou odkazu na šablónu so štýlmi matplotlib . V našom prípade sme použili tmavé pozadie.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Skúsme tiež použiť ggplot , čo je bežne používaný štýl.

Ako vytvoriť paralelné súradnicové grafy v Pythone

Ak ho spustíme, poskytne nám vizuál, ktorý vyzerá takto. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Potom načítajte funkciu pandas pre graf importovaním súradníc parallel_coordinates z pandas.plotting. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Aby sme vytvorili graf, prinesieme súbor údajov a nastavíme náš druh ako triedu

Ako vytvoriť paralelné súradnicové grafy v Pythone

V porovnaní s naším prvým grafom sme pridali ďalší parameter, ktorým je mapa farieb , aby sme získali rôzne farby. Odovzdajte to pomocou premennej matplotlib, plt.get_cmap. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Existuje veľa farebných premenných matplotlib, z ktorých si môžete vybrať v referencii mapy farieb matplotlib .

Ako vytvoriť paralelné súradnicové grafy v Pythone

Napríklad momentálne používame Set 2 z kvalitatívnych farebných máp, ale môžeme to zmeniť aj na iné farby, ako je hsv z cyklických máp farieb. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Kliknutím na Spustiť získate graf, ktorý vyzerá takto. 

Ako vytvoriť paralelné súradnicové grafy v Pythone

Hsv nevyzerá na našich dátach veľmi dobre, ale môžeme sa pohrať, kým nenájdeme najvhodnejšiu farebnú mapu pre náš pozemok. 




Záver

V tomto návode sme prebrali základy vytvárania paralelných súradnicových grafov v Pythone. Prešli sme procesom prípravy údajov, vytvárania grafu a prispôsobenia grafu pre lepšiu čitateľnosť. 

Paralelné súradnicové grafy sú výkonným nástrojom na vizualizáciu vysokorozmerných údajov a možno ich použiť v rôznych oblastiach vrátane financií, inžinierstva a strojového učenia. Teraz, keď vieme, ako vytvoriť paralelné súradnicové grafy v , môžeme ich začať používať na lepšie pochopenie a vizualizáciu vlastných údajov.

Všetko najlepšie,

Gaelim Holandsko


Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Zistite, ako stiahnuť a nainštalovať DAX Studio a Tabular Editor 3 a ako ich nakonfigurovať na použitie v LuckyTemplates a v Exceli.

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

Tento blog obsahuje vizualizáciu Shape Map pre priestorovú analýzu v LuckyTemplates. Ukážem vám, ako môžete efektívne využiť túto vizualizáciu s jej funkciami a prvkami.

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

V tomto návode predstavujem jedinečný nápad týkajúci sa finančného výkazníctva, ktorý spočíva v prideľovaní výsledkov na vopred určené šablóny tabuliek v rámci LuckyTemplates.

DAX měří v LuckyTemplates pomocí Measure Branching

DAX měří v LuckyTemplates pomocí Measure Branching

Vytvářejte míry DAX v LuckyTemplates pomocí existujících mír nebo vzorců. Tomu říkám technika větvení opatření.

Najvýkonnejšie volanie funkcie v LuckyTemplates

Najvýkonnejšie volanie funkcie v LuckyTemplates

V tomto blogu preskúmajte množinu údajov LuckyTemplates, najvýkonnejšie volanie funkcií, ktoré vám prináša tisíce funkcií M a DAX na dosah ruky.

Techniky modelovania údajov na organizáciu opatrení DAX

Techniky modelovania údajov na organizáciu opatrení DAX

V dnešnom návode sa podelím o niekoľko techník modelovania údajov o tom, ako lepšie usporiadať vaše merania DAX pre efektívnejší pracovný tok.

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates je skvelý nástroj pre finančné výkazníctvo. Tu je návod, ako vytvoriť prispôsobené tabuľky pre váš finančný dashboard LuckyTemplates.

Osvedčené postupy toku jazyka Power Query

Osvedčené postupy toku jazyka Power Query

V tomto návode sa bude diskutovať o toku jazyka Power Query a o tom, ako môže pomôcť vytvoriť hladkú a efektívnu zostavu údajov.

LuckyTemplates vlastní ikony | Vizualizační technika PBI

LuckyTemplates vlastní ikony | Vizualizační technika PBI

Budu diskutovat o jedné z mých oblíbených technik kolem vlastních ikon LuckyTemplates, která používá vlastní ikony dynamickým způsobem ve vizuálech LuckyTemplates.

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

Vytváření tabulek LuckyTemplates pomocí funkce UNION & ROW

V tomto blogu vám ukážu, jak můžete vytvořit tabulky LuckyTemplates pomocí vzorce, který kombinuje funkci UNION a funkci ROW.