Statistikamaailm on täis lõkse, kuid samas ka võimalusi. Ükskõik, kas olete statistika kasutaja või keegi, kes peab seda tõlgendama, on võimalik langeda lõksudesse. Samuti on võimalik nende ümber jalutada. Siin on kümme näpunäidet ja lõksu hüpoteeside testimise, regressiooni, korrelatsiooni ja graafiku valdkondadest.
Oluline ei tähenda alati olulist
Tähendus on paljuski halvasti valitud termin. Kui statistiline test annab olulise tulemuse ja otsus on H0 tagasi lükata, ei garanteeri see, et andmete taga olev uuring on oluline. Statistika aitab teha otsuseid arvude kohta ja teha järeldusi protsesside kohta, mis neid tekitasid. Nad ei saa muuta neid protsesse oluliseks või maad vapustavaks. Tähtsust peate ise hindama – ja ükski statistiline test ei saa seda teie eest teha.
Regressioon ei ole alati lineaarne
Püüdes sobitada regressioonimudelit hajuvusdiagrammiga, on kiusatus kohe kasutada joont. See on kõige paremini mõistetav regressioonimudel ja kui sellest aru saad, pole kallakud ja lõiked nii hirmutavad.
Kuid lineaarne regressioon ei ole ainus regressiooni liik. Kõverat on võimalik sobitada läbi hajuvusdiagrammi. Ärge laske end petta: kõverjoonelise regressiooni taga olevaid statistilisi mõisteid on raskem mõista kui lineaarse regressiooni taga olevaid mõisteid.
Siiski tasub võtta aega nende kontseptsioonide omandamiseks. Mõnikord sobib kõver palju paremini kui joon.
Ekstrapoleerimine väljaspool proovi hajuvusdiagrammi on halb mõte
Olenemata sellest, kas töötate lineaarse või kõverjoonelise regressiooniga, pidage meeles, et hajuvusdiagrammi piiridest väljapoole üldistamine on sobimatu.
Oletame, et olete loonud kindla ennustava seose matemaatikasobivuse testi ja matemaatikakursuste tulemuslikkuse vahel ning teie hajuvusdiagramm hõlmab ainult kitsast matemaatikavõimekuse vahemikku. Te ei saa kuidagi teada, kas suhe püsib väljaspool seda vahemikku. Sellest vahemikust väljapoole jäävad ennustused ei kehti.
Parim võimalus on hajuvusdiagrammi laiendada, testides rohkem inimesi. Võite avastada, et algne suhe räägib ainult osa loost.
Uurige varieeruvust regressioonijoone ümber
Jääkide (vaadeldud ja prognoositud väärtuste erinevused) hoolikas analüüs võib teile palju öelda selle kohta, kui hästi joon andmetega sobib. Põhieelduseks on, et regressioonijoone varieeruvus on nii üles- kui ka allapoole sama. Kui see nii ei ole, ei pruugi mudel olla nii ennustav, kui arvate. Kui varieeruvus on süstemaatiline (ühes otsas suurem kui teises), võib kõverjooneline regressioon olla sobivam kui lineaarne. Hinnangu standardviga ei ole alati indikaator.
Valim võib olla liiga suur
Uskuge või mitte, korrelatsioonikoefitsientide puhul juhtub see mõnikord. Väga suur valim võib muuta väikese korrelatsioonikordaja statistiliselt oluliseks.
Aga mida see korrelatsioonikordaja tegelikult tähendab? Määramiskoefitsient —r2 — on vaid 0,038, mis tähendab, et SSRegressioon on alla 4 protsendi SSTtotalist. See on väga väike ühendus.
Alumine rida: korrelatsioonikordaja vaatamisel pidage meeles valimi suurust. Kui see on piisavalt suur, võib see muuta triviaalse seose statistiliselt oluliseks. (Hmmm ... tähtsus – see on jälle käes!)
Tarbijad: teadke oma kirveid
Kui vaatate graafikut, veenduge, et teate, mis on igal teljel. Veenduge, et mõistaksite mõõtühikuid. Kas saate aru sõltumatust muutujast? Kas saate sõltuvast muutujast aru? Kas saate kirjeldada igaüks oma sõnadega? Kui vastus mõnele neist küsimustest on "Ei", ei saa te vaadeldavast graafikust aru.
Telereklaamis graafikut vaadates olge väga ettevaatlik, kui see kaob liiga kiiresti, enne kui näete, mis telgedel on. Reklaamija võib püüda luua püsivat vale muljet graafikus olevast võltssuhtest. Graafikuline seos võib olla sama kehtiv kui see teine telereklaami põhiosa – teaduslik tõestus animeeritud koomiksite kaudu: väikesed animeeritud puhastusharjad, mis puhastavad multifilmi hambaid, ei pruugi toote ostmisel tagada teile valgemaid hambaid.
Kategoorilise muutuja graafikul kujutamine nii, nagu see oleks kvantitatiivne muutuja, on lihtsalt vale
Nii et olete peaaegu valmis kivi-paber-käärid maailmasarjas võistlema. Selleks rahvusvaheliseks turniiriks valmistudes olete kokku võtnud kõik oma viimase kümne aasta matšid, loetledes iga rolli mängides võitnud kordade protsendi.
Kõigi tulemuste kokkuvõtteks kasutage graafiku loomiseks Exceli graafikavõimalusi.
Nii paljud inimesed loovad selliseid graafikuid – inimesed, kes peaksid paremini teadma. Graafiku joon viitab järjepidevusele ühest punktist teise. Nende andmetega on see muidugi võimatu. Mis on kivi ja paberi vahel? Miks on need võrdsete ühikute kaugusel? Miks on kolm kategooriat selles järjekorras?
Lihtsamalt öeldes ei ole joondiagramm õige graafik, kui vähemalt üks muutujatest on kategooriate komplekt. Selle asemel looge veerggraafik. Siin töötab ka sektordiagramm, kuna andmed on protsendimäärad ja teil on vaid paar lõiku.
Kui see on asjakohane, lisage graafikule varieeruvus
Kui teie graafiku punktid tähistavad keskmisi, veenduge, et graafik sisaldab iga keskmise standardviga. See annab vaatajale ettekujutuse andmete varieeruvusest – mis on andmete oluline aspekt.
Vahendid iseenesest ei räägi teile alati kogu lugu. Kasutage iga võimalust, et uurida dispersioone ja standardhälbeid. Võite leida mõned peidetud tükid. Süstemaatiline varieerumine – näiteks suured dispersiooni väärtused, mis on seotud suurte keskmistega – võivad olla vihjeks suhte kohta, mida te varem ei näinud.
Olge statistikaõpikute kontseptsioonide seostamisel Exceliga ettevaatlik
Kui kavatsete tõsiselt statistikatööd teha, on teil tõenäoliselt võimalus uurida mõnda statistikateksti. Pidage meeles, et mõne statistikavaldkonna sümbolid ei ole standardsed.
Õpikute kontseptsioonide ühendamine Exceli statistiliste funktsioonidega võib olla väljakutse tekstide ja Exceli tõttu. Dialoogiboksides ja spikrifailides olevad sõnumid võivad sisaldada muid sümboleid kui need, millest lugesite, või kasutada samu sümboleid, kuid erineval viisil. See lahknevus võib põhjustada dialoogiboksis vale parameetri sisestamise, mille tulemuseks on viga, mida on raske jälgida.