Lag bivariate visualiseringer i R ved å bruke Ggplot2

Å lage visualiseringer i R ved hjelp av ggplot2 kan være en kraftig måte å utforske og forstå dataene dine på. En vanlig type visualisering er det bivariate plottet, som lar deg undersøke forholdet mellom to variabler.

I denne opplæringen lærer du hvordan du produserer bivariate visualiseringer i R ved hjelp av ggplot2. Denne bloggen vil spesifikt fokusere på det som ville være vanskelig å utføre i LuckyTemplates, men enkelt å gjøre i R.

Innholdsfortegnelse

Oversikt

Tre hovedemner vil bli diskutert i denne opplæringen. Du vil lære hvordan du visualiserer fordelingen av en variabel etter gruppe, og hvordan du visualiserer korrelasjoner og parvise sammenhenger.

Et parvis forhold refererer til forholdet mellom hvert par av variabler i et gitt datasett.

For denne opplæringen må du laste ned ggplot2 -pakken. Når du er ferdig, åpner du et tomt skript og tar med to biblioteker: tidyverse og GGally .

Lag bivariate visualiseringer i R ved å bruke Ggplot2

GGally er en utvidelse til ggplot2. Den er bygget for å redusere kompleksiteten ved å kombinere geometriske objekter med transformerte data.

De forskjellige bivariate visualiseringene i R

En bivariat visualisering viser forholdet mellom to variabler.

La oss som et eksempel lage en visualisering som viser forholdet mellom byen og motorveien. Du må bruke funksjonen ggplot ( ) og deretter tilordne de riktige dataene.

Funksjonen geom_point ( ) brukes deretter til å generere .

Lag bivariate visualiseringer i R ved å bruke Ggplot2

Visualiseringer i R som viser korrelasjon

Funksjonen ggcorr () brukes til å visualisere korrelasjonen mellom variabler. Dette vil generere et varmekart med de laveste til høyeste korrelasjonsverdiene vist. Du kan forbedre visualiseringen ytterligere ved å legge til et argument som viser etikettene.

Lag bivariate visualiseringer i R ved å bruke Ggplot2

Visualiseringer i R som viser et parvis forhold

For det parvise plottet må du bruke funksjonen ggpairs ( ) .

Siden datarammen i dette eksemplet inneholder et stort datasett, må det først filtreres for kun å vise numeriske verdier, ellers vil resultatene vise en feil.

For å filtrere data, bruk røroperatøren og funksjonen select_if ( ) .

Lag bivariate visualiseringer i R ved å bruke Ggplot2

I plott- fanen kan du se den parvise visualiseringen generert av koden. Du kan også se grafen og korrelasjonsverdien mellom hver variabel.

En annen ting du kan gjøre med parvise plott er å legge til ekstra elementer for å forsterke visualiseringen. Du kan legge til en annen variabel og endre fargen på dataene.

I dette tilfellet legges stasjonskolonnen til koden, og den estetiske kartleggingsfunksjonen brukes til å endre fargen.

Lag bivariate visualiseringer i R ved å bruke Ggplot2

Når du kjører koden, vil du se at plottet viser spredningsplott og korrelasjonsverdiene etter stasjon. Diagonalen viser også i henhold til hver stasjon.

Lag bivariate visualiseringer i R ved å bruke Ggplot2

Konklusjon

Hvis du vil lage robuste og statistisk støttede visualiseringer som histogrammer, spredningsplott og boksplott, anbefales det å bruke ggplot2 med GGally.

Programmeringsspråket R sammen med ulike visualiseringspakker som ggplot2 lar brukere bygge visualiseringer som viser forholdet og korrelasjonen mellom variabler.

GGally utvider ggplot2 ved å utvide flere funksjoner som reduserer kompleksiteten. Hvis du prøver å lage bivariate og multivariate visualiseringer i LuckyTemplates, vil de vise seg å være en utfordring. Innenfor programmeringsspråket R trenger du imidlertid bare å skrive en enkelt linje med kode for å komme frem til det statistiske plottet du trenger.

Beste ønsker,

George Mount


Pipe In R: Koblingsfunksjoner med Dplyr

Pipe In R: Koblingsfunksjoner med Dplyr

I denne opplæringen lærer du hvordan du kobler funksjoner sammen ved å bruke dplyr-røroperatøren i programmeringsspråket R.

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX Deep Dive: A LuckyTemplates DAX-funksjon

RANKX fra LuckyTemplates lar deg returnere rangeringen til et spesifikt tall i hver tabellrad som utgjør en del av en liste med tall.

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Trekker ut LuckyTemplates-temaer og bilder fra PBIX

Lær hvordan du demonterer en PBIX-fil for å trekke ut LuckyTemplates-temaer og bilder fra bakgrunnen og bruke den til å lage rapporten din!

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

Excel Formulas Cheat Sheet: Mellomveiledning

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

LuckyTemplates-kalendertabell: Hva er det og hvordan du bruker det

Python i LuckyTemplates: Hvordan installere og sette opp

Python i LuckyTemplates: Hvordan installere og sette opp

Lær hvordan du installerer programmeringsspråket Python i LuckyTemplates og hvordan du bruker verktøyene til å skrive koder og vise visuelle elementer.

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Beregning av dynamiske fortjenestemarginer – enkel analyse av LuckyTemplates med DAX

Lær hvordan du beregner dynamiske fortjenestemarginer ved siden av LuckyTemplates og hvordan du kan få mer innsikt ved å grave dypere inn i resultatene.

Sortering av datotabellkolonner i LuckyTemplates

Sortering av datotabellkolonner i LuckyTemplates

Lær hvordan du sorterer feltene fra kolonner med utvidet datotabell på riktig måte. Dette er en god strategi å gjøre for vanskelige felt.

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

Finn dine beste produkter for hver region i LuckyTemplates ved å bruke DAX

I denne artikkelen går jeg gjennom hvordan du kan finne de beste produktene dine per region ved å bruke DAX-beregninger i LuckyTemplates, inkludert TOPN- og CALCUATE-funksjonene.

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Søppeldimensjon: Hva er det og hvorfor det er alt annet enn søppel

Lær hvordan du bruker en søppeldimensjon for flagg med lav kardinalitet som du ønsker å inkludere i datamodellen din på en effektiv måte.