Pipe In R: Anslutningsfunktioner med Dplyr
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
I den här handledningen får du lära dig hur du skapar en scatterplot-visualisering med ett R-skript. Detta är baserat på en rapport som lämnats in för . Du kan se hela videon av denna handledning längst ner på den här bloggen.
Innehållsförteckning
Vad är Scatter Plot
Ett spridningsdiagram är en typ av datavisualisering som används för att visa förhållandet mellan två kontinuerliga variabler. Det är en graf där varje datapunkt representeras av en punkt och punktens position på de horisontella och vertikala axlarna motsvarar värdena för de två variablerna.
Spridningsdiagram är användbara verktyg för att identifiera mönster och trender i data. Om du lägger till den här visuella bilden i dina LuckyTemplates-rapporter får du mer insikt i den data du presenterar. Och i slutet av den här handledningen kommer du att kunna skapa ett R-spridningsdiagram som ser ut så här:
Denna diskussion är uppdelad i fyra steg. Du kommer först att lära dig hur du skapar en grundläggande spridningsplot. Sedan lägger du en jämn linje för att visa trenden för data i diagrammet. De tredje och fjärde stegen är främst inriktade på teman och formateringsändringar som du kan tillämpa på spridningsdiagrammet.
Datauppsättningen som används i det här exemplet är en tabell som innehåller klientens namn, varaktighet, intäkter och timpris.
Skapa Basic Scatter Plot i R Script Visual
Öppna din .
För att börja måste du ha tre , tidyverse , ggthemes och ggpubr .
Om du inte har dem installerade, använd funktionen install.packages( ) . När du är klar måste du använda funktionen library( ) för att ladda dem i R-miljön.
Kopiera bibliotekets R-koder och gå till LuckyTemplates. Öppna R Script editor och klistra in koden. Du kan fortsätta att bygga R-koden där.
Använd sedan funktionen ggplot( ) för att skapa ett punktdiagram. Du måste först ange datauppsättningen som kommer att användas i diagrammet, alltså kommandot databasen %>% . I det här fallet används a istället för en filterfunktion.
För att ange datauppsättningen måste du använda argumentet aes( ) och sedan ange din x- och y-axel. I det här fallet är det varaktighet timme och inkomst, respektive. Använd sedan funktionen geom_point( ) för att visa punkterna i diagrammet.
Du kan ytterligare göra formateringsändringar i spridningsdiagrammet genom att använda en mängd olika funktioner, som "färg" eller "form". Om du vill använda ett dynamiskt utseende på ditt diagram kan du ställa in färgen och punktstorleken till ett specifikt värde som visas i exemplet.
När du kör koden får du denna scatterplot i LuckyTemplates. Lägg märke till att du får större och mörkare cirklar när deras motsvarande timprisvärde är högre.
Lägg till en jämn linje i diagrammet
I det här nästa steget kommer du att lära dig hur du lägger till en jämn linje i diagrammet. En jämn linje är en linje som är anpassad till data för att hjälpa dig utforska de potentiella sambanden mellan två variabler.
För att lägga till en jämn linje, använd funktionen geom_smooth( ) .
När du kör R-skriptet kommer spridningsdiagrammet att se ut så här. Den jämna linjen visar nu trenden för data med ett 95 % konfidensintervall.
Du kan ändra skalan för x- och y-axeln med funktionerna scale_x_continuous( ) och scale_y_continuous( ) .
I detta fall omvandlas y-axeln till en log-skala medan x-axeln förblir densamma.
När du kör R-koden kommer nu resultaten att visas logaritmiskt. Den släta linjen ändras också.
Dessutom, eftersom diagrammet automatiskt placerar etiketter på axlarna, kan du ta bort dem genom att använda labs( ) -funktionen.
Formatera utseendet på R-spridningsdiagrammet
När du har skapat grundformen för din spridningsplot är nästa steg att anpassa dess tema och utseende.
Använd funktionen theme( ) för att formatera spridningsdiagrammet i R-skriptredigeraren. Och inom den här funktionen kan du lägga till andra argument för att anpassa.
Panel.grid.major ( ) och panel.grid.minor( ) låter dig redigera linjetypen och färgen på diagrammets rutnätslinjer. Om du vill ta bort en rutnätslinje, använd element_blank( ) -funktionen.
Panelen.bakgrund och plot.bakgrund tas bort för att göra spridningsdiagrammet transparent . Detta ger dig flexibiliteten att placera ditt diagram var som helst i din rapport. Om du vill ta bort förklaringen i ditt diagram, ställ in legend.position-funktionen på 'ingen'.
Du kan också formatera linjen och texten för x- och y-axeln. Du kan göra linjen tjockare eller tunnare, eller texten större eller mindre.
Om du vill lära dig om andra formateringsfunktioner som du kan använda i ditt diagram kan du gå till hjälpavsnittet i RStudio . Ange "tema" i sökfältet och en lista med formateringsfunktioner visas.
Det finns en mängd olika formateringsfunktioner du kan använda i R. Kom ihåg att använda det du behöver och överdriv inte.
Justera färgen och omfånget för datapunkterna
I det sista avsnittet av denna handledning får du lära dig hur du formaterar färgskalan och storleksintervallet för punkterna i din spridningsdiagram.
Funktionen scale_colour_viridis_b( ) tillhandahåller färgkartor som är perceptuellt enhetliga i både färg och svartvitt. De är också designade för att uppfattas av tittare med vanliga former av färgblindhet.
Om du söker det i hjälpsektionen i RStudio, kommer du att se de olika argumenten du kan använda för att formatera dina diagram. Du kan växla mellan alternativen för att ta reda på vilket resultat som bäst passar din rapport.
Till exempel skalar funktionen scale_size_continuous( ) storleken på punkter eller former i ett diagram enligt en kontinuerlig variabel. Det låter dig ange de minsta och maximala punktstorlekarna som ska användas i plotten.
I det här fallet är 4 minimum medan 17 är maximum.
Så här ser nu den slutliga R-spridningsplotten ut.
Slutsats
I den här handledningen lärde du dig hur du skapar en R-spridningsplot i LuckyTemplates. Ett spridningsdiagram är en typ av datavisualisering som används för att visa förhållandet mellan två kontinuerliga variabler. I LuckyTemplates kan du skapa en scatterplot med hjälp av paketet ggplot och R Script-visualen.
Spridningsdiagram är användbara verktyg för att visualisera och identifiera mönster och trender i data. De är också användbara för att identifiera extremvärden eller anomalier.
Sammantaget är att skapa en spridningsplot i LuckyTemplates med hjälp av R en enkel process och låter dig dra fördel av de kraftfulla datavisualiseringsmöjligheterna i ggplot-paketet.
Med vänliga hälsningar,
Hossein Seyedagha
I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.
RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.
Lär dig hur du tar isär en PBIX-fil för att extrahera LuckyTemplates-teman och bilder från bakgrunden och använda den för att skapa din rapport!
Excel Formler Fuskblad: Mellanvägledning
LuckyTemplates Kalendertabell: Vad är det och hur man använder det
Lär dig hur du installerar programmeringsspråket Python i LuckyTemplates och hur du använder dess verktyg för att skriva koder och visa bilder.
Lär dig hur du beräknar dynamiska vinstmarginaler vid sidan av LuckyTemplates och hur du kan få fler insikter genom att gräva djupare i resultaten.
Lär dig hur du sorterar fälten från en utökad datumtabells kolumner korrekt. Detta är en bra strategi att göra för svåra fält.
I den här artikeln går jag igenom hur du kan hitta dina toppprodukter per region med hjälp av DAX-beräkningar i LuckyTemplates, inklusive TOPN- och CALCULATE-funktionerna.
Lär dig hur du använder en skräpdimension för flaggor med låg kardinalitet som du vill infoga i din datamodell på ett effektivt sätt.