Excel on suurepärane tööriist, kui teil on vaja statistikat kasutada. Kui te pole kunagi koolis statistikaga kokku puutunud või sellest on möödunud kümme või kaks aastat, siis laske neil näpunäidetel kasutada mõnda Exceli pakutavat statistikatööriista.
Kirjeldav statistika on lihtne
Esimene asi, mida peaksite teadma, on see, et mõned statistilised analüüsid ja mõned statistilised meetmed on üsna lihtsad. Kirjeldav statistika, mis hõlmab selliseid asju nagu liigendtabeli risttabelid ja ka mõned statistilised funktsioonid, on mõttekas isegi neile, kes pole nii kvantitatiivsed.
Keskmised pole mõnikord nii lihtsad
Kui keegi kasutab terminit keskmine, viitab ta tavaliselt kõige tavalisemale keskmisele mõõtmisele, mis on keskmine. Arusaamine, et mõiste keskmine on ebatäpne, muudab suure osa Exceli statistilistest funktsioonidest arusaadavamaks.
Selle arutelu konkreetsemaks muutmiseks eeldage, et vaatate väikest väärtuste kogumit: 1, 2, 3, 4 ja 5. Nagu te ehk teate, on selle väikese väärtuste kogumi keskmine väärtus 3. Saate arvutada keskmine, liites kokku kõik arvud komplektis (1+2+3+4+5) ja seejärel jagades selle summa (15) kogumi väärtuste koguarvuga (5).
Mediaan on väärtus, mis eraldab suurima väärtused väiksema väärtuse. Andmekogumis 1, 2, 3, 4 ja 5 on mediaan 3. Väärtus 3 eraldab suurimad väärtused (4 ja 5) väikseimatest väärtustest (1 ja 2).
Te ei pea mõistma erinevaid keskmisi mõõtmisi, kuid peaksite meeles pidama, et mõiste keskmine on üsna ebatäpne.
Standardhälbed kirjeldavad dispersiooni
Standardhälbe valemit ja loogikat on üsna lihtne mõista.
Standardhälbe kirjeldab, kuidas väärtused andmehulga varieeruda keskmise ümber. Statistiliste mõõtmete, nagu standardhälbe, puhul on hea asi, et sageli saate vaadatavate andmete omadustest tõelise ülevaate. Teine asi on see, et nende kahe andmebitiga saab sageli teha järeldusi andmete kohta näidiseid vaadates.
Vaatlus on vaatlus
Vaatlus on üks mõistetest, mida kohtate, kui loete midagi statistika kohta. Vaatlus on lihtsalt tähelepanek. Üks võimalus vaatluse mõiste defineerimiseks on järgmine: kui määrate mõnele juhuslikule muutujale väärtuse, loote vaatluse.
Valim on väärtuste alamhulk
Proovi on kogumik tähelepanekud populatsioonist. Näiteks kui loote andmestiku, mis salvestab teie naabruskonna ööpäevase kõrge temperatuuri, on teie väike vaatluste kogum näidis.
Võrdluseks, valim ei ole populatsioon. Elanikkonna sisaldab kõiki võimalikke märkusi.
Järeldusstatistika on lahe, kuid keeruline
Kui vaatate üldkogumi väärtuste valimit ja valim on esinduslik ja piisavalt suur, saate teha üldkogumi kohta järeldusi valimi omaduste põhjal.
Järeldusel statistikal, kuigi see on väga võimas, on kaks omadust, mida peate teadma:
-
Täpsusprobleemid
-
Järsk õppimiskõver
Tõenäosuse jaotuse funktsioonid ei tekita alati segadust
P robability jaotuse funktsioon kõlab üsna keeruliselt; kuid tegelikult saate paari kasuliku näite abil intuitiivselt aru, mis on tõenäosusjaotuse funktsioon.
Üks levinud jaotus, millest kuulete näiteks statistikaklassides, on T-jaotus. T jaotus on sisuliselt normaaljaotuse välja arvatud raskemad, paksemaks sabad.
Üks levinud tõenäosusjaotuse funktsioon on ühtlane jaotus. Ühes ühtlase jaotuse, iga sündmus on sama tõenäosus esinemise. Selle distributsiooni ainulaadne omadus on see, et kõik on üsna tasemel.

Teine levinud tõenäosusjaotuse funktsiooni tüüp on normaaljaotus, mida tuntakse ka kui kellakõverat või Gaussi jaotust.
Normaaljaotus esineb paljudes olukordades loomulikult. Näiteks intelligentsuskoefitsiendid (IQ) jaotuvad normaalselt.

Parameetrid pole nii keerulised
Parameetri on sisendiks tõenäosus jaotusfunktsioon. Teisisõnu, tõenäosusjaotuse kõverat kirjeldav valem või funktsioon või võrrand vajab sisendeid. Statistikas nimetatakse neid sisendeid parameetriteks.
Mõned tõenäosusjaotuse funktsioonid vajavad ainult ühte lihtsat parameetrit. Näiteks ühtse jaotusega töötamiseks on vaja ainult väärtuste arvu andmekogumis. Näiteks kuuepoolsel matriitsil on ainult kuus võimalust.
Viltus ja kurtoos kirjeldavad tõenäosusjaotuse kuju
Veel paar kasulikku statistilist terminit, mida peaksite teadma, on kalduvus ja kurtoos. Skewness kvantifitseerib sümmeetria puudumist tõenäosusjaotuses. Täiesti sümmeetrilises jaotuses, nagu ka normaaljaotuses, on kalduvus nulliga. Kui tõenäosusjaotus kaldub paremale või vasakule, võrdub kalduvus mõne muu väärtusega kui null ja see väärtus kvantifitseerib sümmeetria puudumist.
Kurtosis mõõdab jaotuse sabade raskust. Normaaljaotuses võrdub kurtoos nulliga. Saba on asi, mis jõuab vasakule või paremale. Kui aga jaotuse saba on normaaljaotusest raskem, on kurtoos positiivne arv. Kui jaotuse sabad on lahjemad kui normaaljaotuses, on kurtoos negatiivne arv.
Usaldusvahemikud tunduvad alguses keerulised, kuid on kasulikud
Tõenäosused ajavad inimesed sageli segadusse. Usaldustasemete puhul on oluline mõista, et need on seotud veapiiriga.
Veel üks oluline asi, mida usaldustasemete puhul mõista, on see, et mida suurema valimi suuruse muudate, seda väiksem on teie veamarginaal sama usaldustaseme kasutamisel.
Ütleme vaid ühe näitena, et teil on Google Analyticsi andmed kahe erineva veebireklaami kohta, mida esitate oma väikeettevõtte reklaamimiseks, ja soovite teada, milline reklaam on tõhusam. Usaldusvahemiku valemi abil saate välja selgitada, kui kaua teie reklaame peab esitama, enne kui Google kogub piisavalt andmeid, et saaksite teada, milline reklaam on tõesti parem.