Statistikas pasaule ir pilna ar slazdiem, taču tā ir arī pilna ar iespējām. Neatkarīgi no tā, vai esat statistikas lietotājs vai kāds, kam tā ir jāinterpretē, ir iespējams iekrist slazdos. Ir iespējams arī staigāt apkārt tiem. Šeit ir desmit padomi un slazdi no hipotēžu pārbaudes, regresijas, korelācijas un grafika.
Nozīmīgs ne vienmēr nozīmē svarīgu
Nozīme daudzējādā ziņā ir slikti izvēlēts termins. Ja statistiskā pārbaude dod nozīmīgu rezultātu un lēmums ir noraidīt H0, tas negarantē, ka datu pamatā esošais pētījums ir svarīgs. Statistika var tikai palīdzēt pieņemt lēmumus par skaitļiem un izdarīt secinājumus par procesiem, kas tos radīja. Viņi nevar padarīt šos procesus svarīgus vai satricinošus. Svarīgums ir tas, kas jums jāvērtē pašam — un neviens statistikas tests to nevar izdarīt jūsu vietā.
Regresija ne vienmēr ir lineāra
Mēģinot pielāgot regresijas modeli izkliedes diagrammai, rodas kārdinājums nekavējoties izmantot līniju. Šis ir vislabāk saprotamais regresijas modelis, un, pārzinot to, slīpumi un pārtverumi nav tik biedējoši.
Taču lineārā regresija nav vienīgais regresijas veids. Ir iespējams izkliedēt līkni caur izkliedes diagrammu. Neļaujiet sevi apmānīt: statistikas jēdzienus, kas slēpjas aiz līklīnijas regresijas, ir grūtāk saprast nekā lineārās regresijas jēdzienus.
Tomēr ir vērts veltīt laiku šo jēdzienu apguvei. Dažreiz līkne ir daudz labāk piemērota nekā līnija.
Ekstrapolēšana ārpus parauga izkliedes diagrammas ir slikta ideja
Neatkarīgi no tā, vai strādājat ar lineāro vai līknes regresiju, ņemiet vērā, ka nav pareizi vispārināt, pārsniedzot izkliedes diagrammas robežas.
Pieņemsim, ka esat izveidojis stabilu paredzamo saikni starp matemātikas spēju pārbaudi un matemātikas kursu rezultātiem, un jūsu izkliedes diagramma aptver tikai šauru matemātikas spēju diapazonu. Jūs nevarat zināt, vai attiecības saglabājas ārpus šī diapazona. Prognozes ārpus šī diapazona nav derīgas.
Labākais variants ir paplašināt izkliedes diagrammu, pārbaudot vairāk cilvēku. Jūs varētu atklāt, ka sākotnējās attiecības stāsta tikai daļu no stāsta.
Pārbaudiet mainīgumu ap regresijas taisni
Rūpīga atlikumu analīze (atšķirības starp novērotajām un prognozētajām vērtībām) var daudz pastāstīt par to, cik labi līnija atbilst datiem. Pamata pieņēmums ir tāds, ka mainīgums ap regresijas līniju ir vienāds augšup un lejup. Ja tā nav, modelis var nebūt tik prognozējošs, kā jūs domājat. Ja mainīgums ir sistemātisks (vienā galā lielāka mainība nekā otrā galā), līknes regresija varētu būt piemērotāka nekā lineāra. Aplēses standarta kļūda ne vienmēr būs rādītājs.
Paraugs var būt pārāk liels
Ticiet vai nē, tas dažreiz notiek ar korelācijas koeficientiem. Ļoti liela izlase var padarīt statistiski nozīmīgu nelielu korelācijas koeficientu.
Bet ko īsti nozīmē šis korelācijas koeficients? Determinācijas koeficients — r2 — ir tikai 0,038, kas nozīmē, ka SSRegresija ir mazāka par 4 procentiem no SSTkopējā. Tā ir ļoti maza asociācija.
Apakšējā līnija: Aplūkojot korelācijas koeficientu, ņemiet vērā izlases lielumu. Ja tas ir pietiekami liels, tas var likt triviālai asociācijai izrādīties statistiski nozīmīga. (Hmmm... nozīme — tā atkal ir!)
Patērētāji: ziniet savus cirvjus
Kad skatāties uz grafiku, pārliecinieties, ka zināt, kas atrodas uz katras ass. Pārliecinieties, ka saprotat mērvienības. Vai jūs saprotat neatkarīgo mainīgo? Vai jūs saprotat atkarīgo mainīgo? Vai varat aprakstīt katru ar saviem vārdiem? Ja atbilde uz kādu no šiem jautājumiem ir “Nē”, jūs nesaprotat diagrammu, kuru skatāties.
Skatoties diagrammu TV reklāmā, esiet ļoti piesardzīgs, ja tas pazūd pārāk ātri, pirms varat redzēt, kas atrodas uz asīm. Iespējams, reklāmdevējs diagrammā mēģina radīt nepatiesu iespaidu par viltus attiecībām. Grafikā attēlotās attiecības var būt tikpat derīgas kā citas televīzijas reklāmas — zinātnisks pierādījums, izmantojot animācijas karikatūru: mazas animācijas skrubis, kas tīra multfilmas zobus, var negarantēt baltākus zobus, ja pērkat produktu.
Kategoriskā mainīgā attēlošana tā, it kā tas būtu kvantitatīvs mainīgais, ir nepareizi
Tātad jūs esat gandrīz gatavs sacensties Rock-Paper-Scissors World Series. Gatavojoties šim starptautiskajam turnīram, jūs apkopojāt visus pēdējos desmit gados notikušos mačus, uzskaitot to reižu procentuālo daļu, kad esat uzvarējis, spēlējot katru lomu.
Lai apkopotu visus rezultātus, izmantojiet programmas Excel grafikas iespējas, lai izveidotu grafiku.
Tik daudz cilvēku veido šāda veida diagrammas — cilvēki, kuriem vajadzētu zināt labāk. Diagrammas līnija norāda uz nepārtrauktību no viena punkta uz otru. Ar šiem datiem, protams, tas nav iespējams. Kas ir starp akmeni un papīru? Kāpēc tās ir vienādas vienības? Kāpēc trīs kategorijas ir tādā secībā?
Vienkārši sakot, līniju diagramma nav pareizais grafiks, ja vismaz viens no jūsu mainīgajiem ir kategoriju kopa. Tā vietā izveidojiet kolonnu diagrammu. Šeit darbojas arī sektoru diagramma, jo dati ir procenti, un jums ir tikai dažas daļas.
Ja nepieciešams, iekļaujiet diagrammā mainīgumu
Kad punkti diagrammā atspoguļo vidējos rādītājus, pārliecinieties, vai grafikā ir iekļauta katra vidējā standarta kļūda. Tas skatītājam sniedz priekšstatu par datu mainīgumu, kas ir svarīgs datu aspekts.
Līdzekļi paši par sevi ne vienmēr stāsta visu. Izmantojiet katru iespēju, lai pārbaudītu novirzes un standarta novirzes. Jūs varat atrast dažus slēptus tīrradņus. Sistemātiskas variācijas — piemēram, augstas dispersijas vērtības, kas saistītas ar lieliem vidējiem rādītājiem — varētu būt pavediens par attiecībām, kuras jūs iepriekš neredzējāt.
Esiet piesardzīgs, saistot statistikas mācību grāmatu koncepcijas ar Excel
Ja jūs nopietni domājat veikt statistikas darbu, jums, iespējams, būs iespēja izpētīt statistikas tekstu vai divus. Ņemiet vērā, ka simboli dažās statistikas jomās nav standarta.
Mācību grāmatu koncepciju savienošana ar Excel statistikas funkcijām var būt izaicinājums tekstu un programmas Excel dēļ. Ziņojumos dialoglodziņos un palīdzības failos var būt ietverti citi simboli, nevis tie, par kuriem jūs lasāt, vai arī tajos var tikt izmantoti tie paši simboli, bet citā veidā. Šīs neatbilstības dēļ dialoglodziņā var ievadīt nepareizu parametru, kā rezultātā var rasties kļūda, kuru ir grūti izsekot.