Faktornivåer i R: Använda kategoriska och ordinalvariabler

Den här handledningen kommer att gå igenom faktorer och faktornivåer i R. Du lär dig hur du skapar en faktor och hur du justerar faktornivåer.

Faktorer används för att lagra och arbeta med variabler i R.

I den här handledningen kommer du att ta itu med kategoriska och ordinalvariabler. Kategoriska variabler är variabler som involverar en eller flera kategorier som inte är ordnade på något specifikt sätt. Ett exempel skulle vara färger. Ordinalvariabler liknar å andra sidan kategoriska variabler med skillnaden att ordinalvariabler har en tydlig ordning av kategorierna. Detta kan vara som låg, medium och hög.

Detta är en introduktion till mer statistiska termer. Du utforskar nu sakta R:s möjligheter för data och statistisk analys.

Innehållsförteckning

Kategoriska faktornivåer i R

Om du kommer ihåg i en annan lektion om använde du dollartecknet ( $ ) för att skriva ut artkolumnen från irisdatauppsättningen . Gör detta igen i . Längst ner finns en rad som innehåller nivåer som består av setosa , versicolor och virginica .

Faktornivåer i R: Använda kategoriska och ordinalvariabler

Detta är R:s sätt att hantera kategorier i data.

Om du använder den unika ( ) funktionen kommer R att lista de unika värdena i den angivna kolumnen. Till exempel, om du kör unik (iris$Species) visar konsolen de tre artnivåerna för iris.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

Det finns ingen inneboende ordning för dessa nivåer. Man kan inte säga att setosa är större än de andra två färgkategorierna. R, som standard, ordnar dem i alfabetisk ordning.

Ordinalfaktornivåer i R

Låt oss nu försöka utforska faktorer med inneboende ordning av kategorin.

Skapa en vektor och namnge den beställningar . För det här exemplet, tilldela vektorn data med hjälp av Starbucks koppstorleksnamn: tall, venti och grande. Skriv sedan ut den.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

Dessa bör ordnas från minsta till största; det ska vara högt, venti och grande. Men när du kör den unika ( ) funktionen för beställningar ordnas de inte i den ordningen.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

Så här omvandlar du dem till ordinalvariabler. Först måste du skapa en ny vektor. I det här fallet kallas vektorn new_orders_factor . Tilldela denna vektor funktionen faktor ( ) . Inuti den här funktionen, mata in vektorn du vill ställa in nivåer med. Ange sedan nivåerna i den ordning du vill att de ska visas.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

Markera hela denna kodrad och kör den sedan. Ett nytt värde läggs sedan till i Miljö.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

För att kontrollera om en vektor har tilldelats korrekt som en faktor, använd funktionen is.factor ( ) . Om du kontrollerar de två vektorerna, orders och new_orders_factor , kan du se att den förra returnerar FALSE medan den nya vektorn verkligen är en faktor.

Faktornivåer i R: Använda kategoriska och ordinalvariabler

En faktor är ett speciellt sätt att lagra en serie texter. Och även om det är en teckenvektor kan den lagras på ett sätt som gör att den kan ha ett givet antal kategorier som har en specifik ordning av värden eller nivåer.

Om du kontrollerar med funktionen nivåer ( ) , kan du se att nivåerna nu är i rätt ordning.

Faktornivåer i R: Använda kategoriska och ordinalvariabler



Slutsats

Även om den här lektionen kan verka esoterisk, kommer du att se hur detta gör skillnad när du hanterar mer avancerad R-kodning. Det är viktigt att lära sig om faktorer och nivåer eftersom de ofta kommer upp i många R-kodningar och statistiska analyser.


Upptäck unika insikter med LuckyTemplates TOPN-funktion

Upptäck unika insikter med LuckyTemplates TOPN-funktion

Den här bloggen innehåller LuckyTemplates TOPN DAX-funktion, som gör att du kan få unika insikter från dina data, vilket hjälper dig att fatta bättre marknadsföringsbeslut.

Datamodellering i LuckyTemplates med hjälp av stödtabeller

Datamodellering i LuckyTemplates med hjälp av stödtabeller

Lär dig några fantastiska analytiska tekniker som vi kan göra för datamodellering i LuckyTemplates med hjälp av DAX-stödtabeller.

Avancerad DAX för LuckyTemplates: Implementering av rankningslogik över unika insikter

Avancerad DAX för LuckyTemplates: Implementering av rankningslogik över unika insikter

Här dyker vi in ​​i LuckyTemplates Advanced DAX och implementerar rankningslogik för att få en mycket unik insikt. Jag visar också upp måttförgrening i det här exemplet.

LuckyTemplates What-If-parameterfunktion

LuckyTemplates What-If-parameterfunktion

Den här bloggen introducerar den nya funktionen i LuckyTemplates, analysparametern What-If. Du kommer att se hur det gör allt snabbt och enkelt för din scenarioanalys.

Använd LuckyTemplates Mät förgreningar för att kontrollera om dina marginaler ökar när intäkterna växer

Använd LuckyTemplates Mät förgreningar för att kontrollera om dina marginaler ökar när intäkterna växer

Lär dig hur du avgör om din intäktstillväxt är bra genom att kontrollera om dina marginaler ökade med hjälp av LuckyTemplates mäter förgrening.

LuckyTemplates parametrar via frågeredigerare

LuckyTemplates parametrar via frågeredigerare

Lär dig och förstå hur du kan skapa och använda LuckyTemplates-parametrar som är en kraftfull funktion i frågeredigeraren.

Runda stapeldiagram – En visualisering för din instrumentpanel

Runda stapeldiagram – En visualisering för din instrumentpanel

Denna handledning kommer att diskutera hur man skapar ett runt stapeldiagram med Charticulator. Du kommer att lära dig hur du designar dem för din LuckyTemplates-rapport.

PowerApps funktioner och formler | En introduktion

PowerApps funktioner och formler | En introduktion

Lär dig hur du använder PowerApps funktioner och formler för att förbättra funktionaliteten och ändra ett beteende i vår Power Apps canvas-app.

Pipe In R: Anslutningsfunktioner med Dplyr

Pipe In R: Anslutningsfunktioner med Dplyr

I den här handledningen kommer du att lära dig hur du kopplar ihop funktioner med hjälp av dplyr-röroperatorn i programmeringsspråket R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX från LuckyTemplates låter dig returnera rankningen av ett specifikt nummer i varje tabellrad som utgör en del av en lista med nummer.