Skapa bivariata visualiseringar i R med hjälp av Ggplot2

Att skapa visualiseringar i R med ggplot2 kan vara ett kraftfullt sätt att utforska och förstå dina data. En vanlig typ av visualisering är den bivariata plotten, som låter dig undersöka sambandet mellan två variabler.

I den här handledningen kommer du att lära dig hur du producerar bivariata visualiseringar i R med hjälp av ggplot2. Den här bloggen kommer specifikt att fokusera på det som skulle vara svårt att utföra i LuckyTemplates men lätt att göra i R.

Innehållsförteckning

Översikt

Tre huvudämnen kommer att diskuteras i denna handledning. Du kommer att lära dig hur man visualiserar fördelningarna av en variabel per grupp, och hur man visualiserar korrelationer och parvisa samband.

Ett parvis förhållande hänvisar till förhållandet mellan varje par av variabler i en given datamängd.

För den här handledningen måste du ladda ner paketet ggplot2 . När du är klar öppnar du ett tomt skript och tar in två bibliotek: tidyverse och GGally .

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

GGally är ett tillägg till ggplot2. Den är byggd för att minska komplexiteten i att kombinera geometriska objekt med transformerade data.

De olika bivariata visualiseringarna i R

En bivariat visualisering visar sambandet mellan två variabler.

Låt oss som ett exempel skapa en visualisering som visar förhållandet mellan staden och motorvägen. Du måste använda funktionen ggplot ( ) och sedan tilldela lämplig data.

Funktionen geom_point ( ) används sedan för att generera .

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

Visualiseringar i R som visar korrelation

Funktionen ggcorr () används för att visualisera korrelationen mellan variabler. Detta kommer att generera en värmekarta med de lägsta till högsta korrelationsvärdena som visas. Du kan förbättra visualiseringen ytterligare genom att lägga till ett argument som visar etiketterna.

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

Visualiseringar i R som visar ett parvis förhållande

För den parvisa plotten måste du använda funktionen ggpairs ( ) .

Eftersom dataramen i det här exemplet innehåller en stor datamängd måste den först filtreras för att bara visa numeriska värden, annars kommer resultatet att visa ett fel.

För att filtrera data, använd röroperatorn och funktionen select_if ( ) .

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

På fliken Plots kan du se den parvisa visualisering som genereras av koden. Du kan också se grafen och korrelationsvärdet mellan varje variabel.

En annan sak du kan göra med parvisa plotter är att lägga till extra element för att förstärka visualiseringen. Du kan lägga till en annan variabel och ändra färgen på data.

I det här fallet läggs drivkolumnen till i koden och den estetiska mappningsfunktionen används för att ändra dess färg.

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

När du kör koden ser du att diagrammet visar spridningsdiagram och korrelationsvärdena per enhet. Diagonalen visar också för varje enhet.

Skapa bivariata visualiseringar i R med hjälp av Ggplot2

Slutsats

Om du vill skapa robusta och statistiskt stödda visualiseringar som histogram, spridningsdiagram och boxplots, rekommenderas det att använda ggplot2 med GGally.

Programmeringsspråket R tillsammans med olika visualiseringspaket som ggplot2 tillåter användare att bygga visualiseringar som visar sambandet och korrelationen mellan variabler.

GGally utökar ggplot2 genom att utöka flera funktioner som minskar komplexiteten. Om du försöker skapa bivariata och multivariata visualiseringar i LuckyTemplates kommer de att visa sig vara en utmaning. Men inom programmeringsspråket R behöver du bara skriva en enda rad kod för att komma fram till den statistiska plot du behöver.

Med vänliga hälsningar,

George Mount


Pipe In R: Anslutningsfunktioner med Dplyr

Pipe In R: Anslutningsfunktioner med Dplyr

I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.

Extrahera LuckyTemplates-teman och bilder från PBIX

Extrahera LuckyTemplates-teman och bilder från PBIX

Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!

Excel Formler Fuskblad: Mellanvägledning

Excel Formler Fuskblad: Mellanvägledning

Excel Formler Fuskblad: Mellanvägledning

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

LuckyTemplates Kalendertabell: Vad är det och hur man använder det

Python i LuckyTemplates: Hur man installerar och ställer in

Python i LuckyTemplates: Hur man installerar och ställer in

Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.

Beräkna dynamiska vinstmarginaler – enkel analys av LuckyTemplates med DAX

Beräkna dynamiska vinstmarginaler – enkel analys av LuckyTemplates med DAX

Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.

Sortering av datumtabellkolumner i LuckyTemplates

Sortering av datumtabellkolumner i LuckyTemplates

Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.

Hitta dina bästa produkter för varje region i LuckyTemplates med DAX

Hitta dina bästa produkter för varje region i LuckyTemplates med DAX

I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.

Skräpdimension: Vad är det och varför det är allt annat än skräp

Skräpdimension: Vad är det och varför det är allt annat än skräp

Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.