Pipe In R: Koblingsfunksjoner med Dplyr
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
Å lage visualiseringer i R ved hjelp av ggplot2 kan være en kraftig måte å utforske og forstå dataene dine på. En vanlig type visualisering er det bivariate plottet, som lar deg undersøke forholdet mellom to variabler.
I denne opplæringen lærer du hvordan du produserer bivariate visualiseringer i R ved hjelp av ggplot2. Denne bloggen vil spesifikt fokusere på det som ville være vanskelig å utføre i LuckyTemplates, men enkelt å gjøre i R.
Innholdsfortegnelse
Oversikt
Tre hovedemner vil bli diskutert i denne opplæringen. Du vil lære hvordan du visualiserer fordelingen av en variabel etter gruppe, og hvordan du visualiserer korrelasjoner og parvise sammenhenger.
Et parvis forhold refererer til forholdet mellom hvert par av variabler i et gitt datasett.
For denne opplæringen må du laste ned ggplot2 -pakken. Når du er ferdig, åpner du et tomt skript og tar med to biblioteker: tidyverse og GGally .
GGally er en utvidelse til ggplot2. Den er bygget for å redusere kompleksiteten ved å kombinere geometriske objekter med transformerte data.
De forskjellige bivariate visualiseringene i R
En bivariat visualisering viser forholdet mellom to variabler.
La oss som et eksempel lage en visualisering som viser forholdet mellom byen og motorveien. Du må bruke funksjonen ggplot ( ) og deretter tilordne de riktige dataene.
Funksjonen geom_point ( ) brukes deretter til å generere .
Visualiseringer i R som viser korrelasjon
Funksjonen ggcorr () brukes til å visualisere korrelasjonen mellom variabler. Dette vil generere et varmekart med de laveste til høyeste korrelasjonsverdiene vist. Du kan forbedre visualiseringen ytterligere ved å legge til et argument som viser etikettene.
Visualiseringer i R som viser et parvis forhold
For det parvise plottet må du bruke funksjonen ggpairs ( ) .
Siden datarammen i dette eksemplet inneholder et stort datasett, må det først filtreres for kun å vise numeriske verdier, ellers vil resultatene vise en feil.
For å filtrere data, bruk røroperatøren og funksjonen select_if ( ) .
I plott- fanen kan du se den parvise visualiseringen generert av koden. Du kan også se grafen og korrelasjonsverdien mellom hver variabel.
En annen ting du kan gjøre med parvise plott er å legge til ekstra elementer for å forsterke visualiseringen. Du kan legge til en annen variabel og endre fargen på dataene.
I dette tilfellet legges stasjonskolonnen til koden, og den estetiske kartleggingsfunksjonen brukes til å endre fargen.
Når du kjører koden, vil du se at plottet viser spredningsplott og korrelasjonsverdiene etter stasjon. Diagonalen viser også i henhold til hver stasjon.
Konklusjon
Hvis du vil lage robuste og statistisk støttede visualiseringer som histogrammer, spredningsplott og boksplott, anbefales det å bruke ggplot2 med GGally.
Programmeringsspråket R sammen med ulike visualiseringspakker som ggplot2 lar brukere bygge visualiseringer som viser forholdet og korrelasjonen mellom variabler.
GGally utvider ggplot2 ved å utvide flere funksjoner som reduserer kompleksiteten. Hvis du prøver å lage bivariate og multivariate visualiseringer i LuckyTemplates, vil de vise seg å være en utfordring. Innenfor programmeringsspråket R trenger du imidlertid bare å skrive en enkelt linje med kode for å komme frem til det statistiske plottet du trenger.
Beste ønsker,
George Mount
I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.
RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.
Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!
Excel Formulas Cheat Sheet: Mellomveiledning
LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det
Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.
Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.
Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.
I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.
Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.