Ez az oktatóanyag az R faktorokon és faktorszinteken megy keresztül. Megtanulja, hogyan hozhat létre faktorokat és hogyan állíthatja be a faktorszinteket.
A faktorok az R-ben lévő változók tárolására és kezelésére szolgálnak.
Ebben az oktatóanyagban a kategorikus és sorszámú változókkal fogsz foglalkozni. A kategorikus változók olyan változók, amelyek egy vagy több kategóriát foglalnak magukban, amelyek nincsenek meghatározott sorrendben. Példa erre a színek. Az ordinális változók ezzel szemben hasonlóak a kategorikus változókhoz, azzal a különbséggel, hogy az ordinális változók egyértelműen rendezik a kategóriákat. Ez lehet alacsony, közepes és magas.
Ez egy bevezető a statisztikai kifejezésekhez. Lassan felfedezi az R adat- és statisztikai elemzési képességeit.
Tartalomjegyzék
Kategorikus faktorszintek az R-ben
Ha emlékszik egy másik leckében a -ról, akkor a dollárjelet ( $ ) használta a Fajok oszlop kinyomtatására az írisz adatkészletből. Csináld ezt újra itt: . A legalsó részen van egy sor, amely a setosa , versicolor és virginica szövegekből álló Leveleket tartalmazza .

Ez az R módszere az adatok kategóriáinak kezelésére.
Ha az egyedi ( ) függvényt használja , az R kilistázza az egyedi értékeket a megadott oszlopban. Például, ha az egyedi (iris$Species) parancsot futtatja , a konzol az írisz három fajszintjét jeleníti meg.

Ezekre a szintekre nincs eleve rendezés. Nem mondhatod, hogy a setosa nagyobb, mint a másik két színkategória. Az R alapértelmezés szerint ábécé sorrendbe rendezi őket.
Ordinális faktorszintek R-ben
Most próbáljuk meg felfedezni a tényezőket a kategória belső sorrendjével.
Hozzon létre egy vektort, és nevezze el a sorrendet . Ebben a példában rendelje hozzá a vektort az adatokhoz a Starbucks csészeméret-neveinek használatával: tall, venti és grande. Ezután nyomtassa ki.

Ezeket a legkisebbtől a legnagyobbig kell elrendezni; legyen magas, venti és nagy. De amikor az egyedi ( ) függvényt futtatja a rendelésekhez , akkor azok nem ebben a sorrendben vannak elrendezve.

Így alakíthatja át őket sorszámú változókká. Először is létre kell hoznia egy új vektort. Ebben az esetben a vektort new_orders_faktornak nevezzük . Rendelje hozzá ezt a vektort a ( ) tényezőfüggvénnyel. Ezen a funkción belül adja meg azt a vektort, amellyel szinteket szeretne beállítani. Ezután jelölje meg a szinteket abban a sorrendben, ahogyan meg szeretné jeleníteni őket.

Jelölje ki ezt a teljes kódsort, majd futtassa. Ezután egy új érték kerül hozzáadásra a Környezetben.

Annak ellenőrzésére, hogy egy vektor megfelelően van-e hozzárendelve tényezőként, használja az is.factor ( ) függvényt. Ha bejelöli a két vektort, az ordereket és az új_rendelések_tényezőjét , láthatja, hogy az előbbi HAMIS értéket ad vissza, míg az új vektor valóban faktor.

A faktor egy speciális módja egy szövegsorozat tárolásának. És bár ez egy karaktervektor, tárolható oly módon, hogy adott számú kategóriája legyen, amelyek meghatározott értékrenddel vagy szinttel rendelkeznek.
Ha a szintek ( ) funkcióval ellenőrzi , láthatja, hogy a szintek most a megfelelő sorrendben vannak.

Következtetés
Bár ez a lecke ezoterikusnak tűnhet, látni fogja, hogy ez milyen különbséget jelent a fejlettebb R-kódolás kezelésében. Fontos, hogy megismerjük a tényezőket és a szinteket, mivel ezek gyakran felmerülnek számos R kódolásban és statisztikai elemzésben.