A statisztikák világa tele van buktatókkal, de lehetőségekkel is. Akár a statisztikák felhasználója, akár valaki, akinek értelmeznie kell azokat, előfordulhat, hogy beleesik a buktatókba. Körbejárni is lehet őket. Íme tíz tipp és csapda a hipotézisvizsgálat, a regresszió, a korreláció és a grafikon területeiről.
A jelentős nem mindig jelent fontosat
A jelentőség sok szempontból rosszul választott kifejezés. Ha egy statisztikai teszt szignifikáns eredményt ad, és a döntés a H0 elutasítása, az nem garantálja, hogy az adatok mögött álló tanulmány fontos. A statisztika csak segíthet a számokkal kapcsolatos döntéshozatalban és az azokat létrehozó folyamatokra vonatkozó következtetésekben. Nem tehetik fontossá vagy földrengetővé ezeket a folyamatokat. A fontosságot magának kell megítélnie – és ezt egyetlen statisztikai teszt sem tudja megtenni helyette.
A regresszió nem mindig lineáris
Amikor egy regressziós modellt egy szórásdiagramhoz próbálunk illeszteni, akkor a kísértés azonnali egyenes használata. Ez a legjobban érthető regressziós modell, és ha rájön, a meredekségek és az elfogók nem annyira ijesztőek.
De a lineáris regresszió nem az egyetlen regressziós típus. Lehetőség van egy görbe illesztésére egy szórásdiagramon keresztül. Ne tévesszen meg: A görbe vonalú regresszió mögött meghúzódó statisztikai fogalmakat nehezebb megérteni, mint a lineáris regresszió mögött meghúzódó fogalmakat.
Érdemes azonban időt szánni e fogalmak elsajátítására. Néha egy görbe sokkal jobban illeszkedik, mint egy vonal.
A minta szórásdiagramon túli extrapolálása rossz ötlet
Akár lineáris, akár görbe vonalú regresszióval dolgozik, ne feledje, hogy nem helyénvaló általánosítani a szórásdiagram határain túl.
Tegyük fel, hogy szilárd prediktív kapcsolatot hozott létre a matematikai alkalmassági teszt és a matematikai kurzusokon való teljesítmény között, és a szórásdiagram a matematikai alkalmasságnak csak egy szűk tartományát fedi le. Nem tudhatod, hogy a kapcsolat fennmarad-e ezen a tartományon túl. Az ezen a tartományon kívül eső előrejelzések nem érvényesek.
A legjobb megoldás az, ha több ember tesztelésével bővíti a szóródási diagramot. Előfordulhat, hogy az eredeti kapcsolat csak egy részét meséli el a történetnek.
Vizsgálja meg a regressziós egyenes körüli változékonyságot
A maradékok (a megfigyelt és az előre jelzett értékek közötti különbségek) gondos elemzése sokat elárulhat arról, hogy a vonal mennyire illeszkedik az adatokhoz. Az alapfeltevés az, hogy a regressziós egyenes körüli változékonyság felfelé és lefelé ugyanaz. Ha nem, akkor a modell nem biztos, hogy olyan előrejelző, mint gondolná. Ha a variabilitás szisztematikus (az egyik végén nagyobb a változékonyság, mint a másik végén), a görbe vonalú regresszió megfelelőbb lehet, mint a lineáris. A becslés standard hibája nem mindig a mutató.
A minta túl nagy lehet
Akár hiszi, akár nem, ez néha előfordul a korrelációs együtthatókkal. Egy nagyon nagy minta kis korrelációs együtthatót statisztikailag szignifikánssá tehet.
De mit is jelent valójában ez a korrelációs együttható? A determinációs együttható —r2 — mindössze 0,038, ami azt jelenti, hogy az SSRegresszió kevesebb, mint az SSTtotal 4 százaléka. Ez egy nagyon kicsi egyesület.
A lényeg: Ha korrelációs együtthatót néz, ügyeljen a minta méretére. Ha elég nagy, akkor egy triviális asszociáció statisztikailag szignifikánsnak bizonyulhat. (Hmmm... jelentősége – újra itt van!)
Fogyasztók: Ismerje a tengelyét
Amikor megnéz egy grafikont, győződjön meg arról, hogy tudja, mi van az egyes tengelyeken. Győződjön meg arról, hogy megértette a mértékegységeket. Érted a független változót? Érted a függő változót? Le tudod írni mindegyiket a saját szavaiddal? Ha e kérdések bármelyikére a válasz „Nem”, akkor nem érti a grafikont, amelyet éppen néz.
Amikor egy TV-hirdetés grafikonját nézi, legyen nagyon óvatos, ha az túl gyorsan tűnik el, mielőtt látná, mi van a tengelyeken. Előfordulhat, hogy a hirdető egy hamis benyomást próbál kelteni a grafikonon belüli hamis kapcsolatról. A grafikonon ábrázolt kapcsolat ugyanolyan érvényes lehet, mint a TV-reklámok másik alappillére – tudományos bizonyíték animációs rajzfilmen keresztül: A rajzfilm fogait tisztító apró animált kefék nem feltétlenül garantálják a fehérebb fogakat, ha megvásárolja a terméket.
Egy kategorikus változót úgy ábrázolni, mintha mennyiségi változó lenne, egyszerűen helytelen
Így hát készen állsz arra, hogy a Rock-Paper-Scissors World Series versenyen versenyezzen. A nemzetközi tornára való felkészülés során összesítetted az elmúlt tíz év összes meccsét, felsorolva, hogy az egyes szerepekben hányszor nyertél.
Az összes eredmény összegzéséhez használja az Excel grafikus képességeit egy grafikon létrehozásához.
Nagyon sokan készítenek ilyen grafikonokat – akiknek jobban kellene tudniuk. A grafikon vonala az egyik ponttól a másikig való folytonosságot jelenti. Ezekkel az adatokkal persze ez lehetetlen. Mi van a rock és a papír között? Miért egyenlő egységgel vannak egymástól? Miért van a három kategória ebben a sorrendben?
Egyszerűen fogalmazva, a vonalgráf nem a megfelelő gráf, ha legalább egy változója kategóriakészlet. Ehelyett hozzon létre egy oszlopdiagramot. A kördiagram itt is működik, mert az adatok százalékosak, és csak néhány szeleted van.
Ha szükséges, vegye figyelembe a variációt a grafikonon
Amikor a grafikon pontjai átlagot jelentenek, győződjön meg arról, hogy a grafikon tartalmazza az egyes átlagok standard hibáját. Ez képet ad a nézőnek az adatok változékonyságáról – ami az adatok fontos szempontja.
Az eszközök önmagukban nem mindig mondják el a teljes történetet. Ragadjon meg minden lehetőséget az eltérések és szórások vizsgálatára. Találhat néhány rejtett rögöt. A szisztematikus variáció – például a nagy átlagokhoz kapcsolódó magas varianciaértékek – egy olyan kapcsolatra utalhatnak, amelyet korábban nem látott.
Legyen óvatos, amikor a statisztikai tankönyv fogalmait Excelhez kapcsolja
Ha komolyan szeretne statisztikai munkát végezni, valószínűleg lesz alkalma belenézni egy-két statisztikai szövegbe. Ne feledje, hogy a statisztika egyes területein a szimbólumok nem szabványosak.
A tankönyvi fogalmak összekapcsolása az Excel statisztikai függvényeivel kihívást jelenthet a szövegek és az Excel miatt. A párbeszédpanelekben és a súgófájlokban megjelenő üzenetek az Ön által olvasottaktól eltérő szimbólumokat is tartalmazhatnak, vagy ugyanazokat a szimbólumokat használhatják, de eltérő módon. Ez az eltérés oda vezethet, hogy hibásan ír be egy paramétert egy párbeszédpanelen, ami nehezen nyomon követhető hibát eredményezhet.