Pipe In R: Anslutningsfunktioner med Dplyr
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
Att skapa visualiseringar i R med ggplot2 kan vara ett kraftfullt sätt att utforska och förstå dina data. En vanlig typ av visualisering är den bivariata plotten, som låter dig undersöka sambandet mellan två variabler.
I den här handledningen kommer du att lära dig hur du producerar bivariata visualiseringar i R med hjälp av ggplot2. Den här bloggen kommer specifikt att fokusera på det som skulle vara svårt att utföra i LuckyTemplates men lätt att göra i R.
Innehållsförteckning
Översikt
Tre huvudämnen kommer att diskuteras i denna handledning. Du kommer att lära dig hur man visualiserar fördelningarna av en variabel per grupp, och hur man visualiserar korrelationer och parvisa samband.
Ett parvis förhållande hänvisar till förhållandet mellan varje par av variabler i en given datamängd.
För den här handledningen måste du ladda ner paketet ggplot2 . När du är klar öppnar du ett tomt skript och tar in två bibliotek: tidyverse och GGally .
GGally är ett tillägg till ggplot2. Den är byggd för att minska komplexiteten i att kombinera geometriska objekt med transformerade data.
De olika bivariata visualiseringarna i R
En bivariat visualisering visar sambandet mellan två variabler.
Låt oss som ett exempel skapa en visualisering som visar förhållandet mellan staden och motorvägen. Du måste använda funktionen ggplot ( ) och sedan tilldela lämplig data.
Funktionen geom_point ( ) används sedan för att generera .
Visualiseringar i R som visar korrelation
Funktionen ggcorr () används för att visualisera korrelationen mellan variabler. Detta kommer att generera en värmekarta med de lägsta till högsta korrelationsvärdena som visas. Du kan förbättra visualiseringen ytterligare genom att lägga till ett argument som visar etiketterna.
Visualiseringar i R som visar ett parvis förhållande
För den parvisa plotten måste du använda funktionen ggpairs ( ) .
Eftersom dataramen i det här exemplet innehåller en stor datamängd måste den först filtreras för att bara visa numeriska värden, annars kommer resultatet att visa ett fel.
För att filtrera data, använd röroperatorn och funktionen select_if ( ) .
På fliken Plots kan du se den parvisa visualisering som genereras av koden. Du kan också se grafen och korrelationsvärdet mellan varje variabel.
En annan sak du kan göra med parvisa plotter är att lägga till extra element för att förstärka visualiseringen. Du kan lägga till en annan variabel och ändra färgen på data.
I det här fallet läggs drivkolumnen till i koden och den estetiska mappningsfunktionen används för att ändra dess färg.
När du kör koden ser du att diagrammet visar spridningsdiagram och korrelationsvärdena per enhet. Diagonalen visar också för varje enhet.
Slutsats
Om du vill skapa robusta och statistiskt stödda visualiseringar som histogram, spridningsdiagram och boxplots, rekommenderas det att använda ggplot2 med GGally.
Programmeringsspråket R tillsammans med olika visualiseringspaket som ggplot2 tillåter användare att bygga visualiseringar som visar sambandet och korrelationen mellan variabler.
GGally utökar ggplot2 genom att utöka flera funktioner som minskar komplexiteten. Om du försöker skapa bivariata och multivariata visualiseringar i LuckyTemplates kommer de att visa sig vara en utmaning. Men inom programmeringsspråket R behöver du bara skriva en enda rad kod för att komma fram till den statistiska plot du behöver.
Med vänliga hälsningar,
George Mount
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.
Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!
Excel Formler Fuskblad: Mellanvägledning
LuckyTemplates Kalendertabell: Vad är det och hur man använder det
Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.
Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.
Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.
I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.
Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.