Pipe In R: Koblingsfunksjoner med Dplyr
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
I denne opplæringen lærer du hvordan du lager en scatterplot-visualisering ved hjelp av et R-skript. Dette er basert på en rapport levert for . Du kan se hele videoen av denne opplæringen nederst på denne bloggen.
Innholdsfortegnelse
Hva er Scatter Plot
Et spredningsplott er en type datavisualisering som brukes til å vise forholdet mellom to kontinuerlige variabler. Det er en graf der hvert datapunkt er representert av en prikk, og posisjonen til prikken på den horisontale og vertikale aksen tilsvarer verdiene til de to variablene.
Spredningsplott er nyttige verktøy for å identifisere mønstre og trender i dataene. Hvis du legger til denne visualiseringen i LuckyTemplates-rapportene dine, får du mer innsikt i dataene du presenterer. Og mot slutten av denne opplæringen vil du kunne lage et R-spredningsplott som ser slik ut:
Denne diskusjonen er delt inn i fire trinn. Du vil først lære hvordan du lager et grunnleggende spredningsplott. Deretter vil du bruke en jevn linje for å vise trenden til dataene i plottet. Det tredje og fjerde trinnet er hovedsakelig fokusert på temaer og formateringsendringer du kan bruke på spredningsplottet.
Datasettet som brukes i dette eksemplet er en tabell som inneholder klientnavn, varighet, inntekter og timepris.
Lag det grunnleggende spredningsplottet i R Script Visual
Åpne din .
For å starte må du ha tre , tidyverse , ggthemes og ggpubr .
Hvis du ikke har dem installert, bruk funksjonen install.packages( ) . Når du er ferdig, må du bruke library( ) -funksjonen for å laste dem inn i R-miljøet.
Kopier bibliotekets R-koder og gå til LuckyTemplates. Åpne R Script editor og lim inn koden. Du kan fortsette å bygge R-koden der.
Deretter bruker du funksjonen ggplot( ) for å lage et punktdiagram. Du må først spesifisere datasettet som skal brukes i diagrammet, derfor kommandoen database %>% . I dette tilfellet brukes a i stedet for en filterfunksjon.
For å spesifisere datasettet må du bruke argumentet aes( ) og deretter spesifisere x- og y-aksen. I dette tilfellet er det henholdsvis varighet time og inntjening. Deretter bruker du funksjonen geom_point( ) for å vise punktene på diagrammet.
Du kan ytterligere gjøre formateringsendringer i spredningsplottet ditt ved å bruke en rekke funksjoner, for eksempel "farge" eller "form". Hvis du vil bruke et dynamisk utseende på diagrammet ditt, kan du sette fargen og punktstørrelsen til en bestemt verdi som vist i eksemplet.
Når du kjører koden, får du dette spredningsplottet i LuckyTemplates. Legg merke til at du får større og mørkere sirkler når den tilsvarende timeprisen er høyere.
Legg til en jevn linje i diagrammet
I dette neste trinnet lærer du hvordan du legger til en jevn linje i diagrammet. En jevn linje er en linje som er tilpasset dataene for å hjelpe deg med å utforske de potensielle sammenhengene mellom to variabler.
For å legge til en jevn linje, bruk funksjonen geom_smooth( ) .
Når du kjører R-skriptet, vil spredningsplottet se slik ut. Den glatte linjen viser nå trenden til dataene med et 95 % konfidensintervall.
Du kan endre skalaen til x- og y-aksen ved å bruke funksjonene scale_x_continuous( ) og scale_y_continuous( ) .
I dette tilfellet transformeres y-aksen til en log-skala mens x-aksen forblir den samme.
Når du kjører R-koden, vil resultatene nå vises logaritmisk. Den glatte linjen endres også.
Siden diagrammet automatisk plasserer etiketter på aksene, kan du dessuten fjerne dem ved å bruke funksjonen labs( ) .
Formater utseendet til R-spredningsplottet
Etter at du har laget den grunnleggende formen for spredningsplottet ditt, er neste trinn å tilpasse temaet og utseendet.
Bruk theme( ) -funksjonen til å formatere spredningsplottet i R Script-editoren. Og innenfor denne funksjonen kan du legge til andre argumenter for å tilpasse.
Panel.grid.major ( ) og panel.grid.minor( ) lar deg redigere linjetypen og fargen på diagrammets rutenett. Hvis du vil fjerne en rutenett, bruk element_blank( ) funksjonen.
Panel.bakgrunn og plot.bakgrunn fjernes for å gjøre spredningskartet gjennomsiktig. Dette gir deg fleksibiliteten til å plassere diagrammet hvor som helst i rapporten. Hvis du vil fjerne forklaringen i diagrammet, setter du legend.position-funksjonen til 'ingen'.
Du kan også formatere linjen og teksten til x- og y-aksen. Du kan gjøre linjen tykkere eller tynnere, eller teksten større eller mindre.
Hvis du vil lære om andre formateringsfunksjoner som du kan bruke i diagrammet ditt, kan du gå til Hjelp-delen i RStudio . Skriv inn "tema" i søkefeltet og en liste over formateringsfunksjoner vises.
Det finnes en rekke formateringsfunksjoner du kan bruke i R. Husk å bruke det du trenger og ikke overdriv.
Juster fargen og rekkevidden til datapunktene
I den siste delen av denne opplæringen lærer du hvordan du formaterer fargeskalaen og størrelsesområdet til punktene i spredningsplottet ditt.
scale_colour_viridis_b ( ) -funksjonen gir fargekart som er perseptuelt ensartede i både farger og svart-hvitt. De er også designet for å bli oppfattet av seere med vanlige former for fargeblindhet.
Hvis du søker på den i Hjelp-delen i RStudio, vil du se de forskjellige argumentene du kan bruke til å formatere diagrammene dine. Du kan veksle mellom alternativene for å finne ut hvilket resultat som passer best til rapporten din.
For eksempel skalerer funksjonen scale_size_continuous( ) størrelsen på punkter eller former i et plott i henhold til en kontinuerlig variabel. Den lar deg spesifisere minimum og maksimum punktstørrelser som skal brukes i plottet.
I dette tilfellet er 4 minimum mens 17 er maksimum.
Slik ser det endelige R-spredningsplottet ut nå.
Konklusjon
I denne opplæringen lærte du hvordan du lager et R-spredningsplott i LuckyTemplates. Et spredningsplott er en type datavisualisering som brukes til å vise forholdet mellom to kontinuerlige variabler. I LuckyTemplates kan du lage et spredningsplott ved å bruke ggplot-pakken og R Script-visualen.
Spredningsplott er nyttige verktøy for å visualisere og identifisere mønstre og trender i dataene. De er også nyttige for å identifisere uteliggere eller anomalier.
Totalt sett er det å lage et spredningsplott i LuckyTemplates ved å bruke R en enkel prosess og lar deg dra nytte av de kraftige datavisualiseringsmulighetene til ggplot-pakken.
Beste ønsker,
Hossein Seyedagha
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.
Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!
Excel Formulas Cheat Sheet: Mellomveiledning
LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det
Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.
Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.
Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.
I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.
Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.