Faktornivåer i R: Bruke kategoriske og ordinære variabler

Denne opplæringen vil gå gjennom faktorer og faktornivåer i R. Du lærer hvordan du lager en faktor og hvordan du justerer faktornivåer.

Faktorer brukes til å lagre og arbeide med variabler i R.

I denne opplæringen skal du håndtere kategoriske og ordinalvariabler. Kategoriske variabler er variabler som involverer en eller flere kategorier som ikke er ordnet på noen spesifikk måte. Et eksempel kan være farger. Ordinalvariabler , derimot, ligner kategoriske variabler med den forskjellen at ordinalvariabler har tydelig rekkefølge av kategoriene. Dette kan være lavt, middels og høyt.

Dette er en introduksjon til mer statistiske termer. Du utforsker nå sakte Rs muligheter for data og statistisk analyse.

Innholdsfortegnelse

Kategoriske faktornivåer i R

Hvis du husker i en annen leksjon om , brukte du dollartegnet ( $ ) for å skrive ut Arts-kolonnen fra iris- datasettet. Gjør dette igjen i . Nederst er det en linje som inneholder nivåer som består av setosa , versicolor og virginica .

Faktornivåer i R: Bruke kategoriske og ordinære variabler

Dette er Rs måte å håndtere kategorier i data på.

Hvis du bruker funksjonen unike ( ) , vil R liste opp de unike verdiene i den angitte kolonnen. For eksempel, hvis du kjører unik (iris$Species) , viser konsollen de tre arter-nivåene til iris.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

Det er ingen iboende rekkefølge for disse nivåene. Du kan ikke si at setosa er større enn de to andre fargekategoriene. R, som standard, ordner dem i alfabetisk rekkefølge.

Ordinalfaktornivåer i R

La oss nå prøve å utforske faktorer med iboende rekkefølge av kategorien.

Lag en vektor og gi den et navn . For dette eksemplet, tilordne vektoren med data ved å bruke Starbucks' koppstørrelsesnavn: tall, venti og grande. Skriv den deretter ut.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

Disse bør ordnes fra minste til største; den skal være høy, venti og grande. Men når du kjører den unike ( ) funksjonen for bestillinger , er de ikke ordnet i den rekkefølgen.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

Slik gjør du dem til ordinalvariabler. Først må du lage en ny vektor. I dette tilfellet kalles vektoren new_orders_factor . Tilordne denne vektoren funksjonen faktor ( ) . Inne i denne funksjonen, skriv inn vektoren du vil sette nivåer med. Angi deretter nivåene i den rekkefølgen du vil at de skal vises.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

Marker hele denne kodelinjen og kjør den. En ny verdi legges deretter til i Miljø.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

For å sjekke om en vektor er riktig tilordnet som en faktor, bruk funksjonen is.factor ( ) . Hvis du sjekker de to vektorene, orders og new_orders_factor , kan du se at førstnevnte returnerer FALSE mens den nye vektoren faktisk er en faktor.

Faktornivåer i R: Bruke kategoriske og ordinære variabler

En faktor er en spesiell måte å lagre en rekke tekster på. Og selv om det er en tegnvektor, kan den lagres på en måte som lar den ha et gitt antall kategorier som har en spesifikk rekkefølge av verdier eller nivåer.

Hvis du sjekker med funksjonen nivåer ( ) , kan du se at nivåene nå er i riktig rekkefølge.

Faktornivåer i R: Bruke kategoriske og ordinære variabler



Konklusjon

Selv om denne leksjonen kan virke esoterisk, vil du se hvordan dette utgjør en forskjell når du arbeider med mer avansert R-koding. Det er viktig å lære om faktorer og nivåer siden de ofte kommer opp i mange R-koding og statistiske analyser.


PowerApps-søkefelt: Slik legger du til og tilpasser

PowerApps-søkefelt: Slik legger du til og tilpasser

Lær hvordan du oppretter et PowerApps-søkefelt fra bunnen av og tilpasser det til å matche det overordnede temaet for appen din.

SELECTEDVALUE DAX-eksempel- Valg av høsteskive

SELECTEDVALUE DAX-eksempel- Valg av høsteskive

Høst eller fang en verdi inne i et mål for å gjenbruke i et annet mål for dynamiske beregninger ved å bruke SELECTEDVALUE DAX i LuckyTemplates.

Versjonshistorikk i SharePoint-lister

Versjonshistorikk i SharePoint-lister

Oppdag hvordan versjonshistorikk i SharePoint kan hjelpe deg med å se utviklingen av bestemte data, og hvor mange endringer den har gjennomgått.

Hex-fargekodevelger for Lucky Templates-rapporter

Hex-fargekodevelger for Lucky Templates-rapporter

Her er et verktøy for å lage rapporter og grafikk, en sekskantkodevelger for farger som du kan bruke for enkelt å få fargene til LuckyTemplates-rapportene dine.

Dynamisk datoskjærer i Lucky-maler ved hjelp av en periodetabell

Dynamisk datoskjærer i Lucky-maler ved hjelp av en periodetabell

Du kan enkelt vise en datoperiode som en slicer i rapporten ved hjelp av en periodetabell. Bruk en M-kode for å lage den dynamiske datoskjæreren i LuckyTemplates.

Proporsjons- og frekvenstabeller i Excel

Proporsjons- og frekvenstabeller i Excel

Skulle dykke ned i frekvenstabeller i Excel samt proporsjonstabeller. Se nærmere på hva de er og når du skal bruke dem.

Slik installerer du DAX Studio & Tabular Editor i LuckyTemplates

Slik installerer du DAX Studio & Tabular Editor i LuckyTemplates

Lær hvordan du laster ned og installerer DAX Studio og Tabular Editor 3 og hvordan du konfigurerer dem for bruk i LuckyTemplates og i Excel.

LuckyTemplates Shape Map Visualization for romlig analyse

LuckyTemplates Shape Map Visualization for romlig analyse

Denne bloggen inneholder Shape Map-visualiseringen for romlig analyse i LuckyTemplates. Jeg viser deg hvordan du kan bruke denne visualiseringen effektivt med dens funksjoner og elementer.

LuckyTemplates finansiell rapportering: Allokering av resultater til maler på hver enkelt rad

LuckyTemplates finansiell rapportering: Allokering av resultater til maler på hver enkelt rad

I denne opplæringen viser jeg frem en unik idé rundt finansiell rapportering, som tildeler resultater for å forhåndsbestemme tabellmaler inne i LuckyTemplates.

DAX-mål i LuckyTemplates ved hjelp av måleforgrening

DAX-mål i LuckyTemplates ved hjelp av måleforgrening

Opprett DAX-mål i LuckyTemplates ved å bruke eksisterende mål eller formler. Dette er det jeg kaller tiltaket forgreningsteknikk.