Excel je čudovito orodje, ko morate uporabiti statistiko. Če še nikoli niste bili izpostavljeni statistiki v šoli ali je minilo že desetletje ali dve, odkar ste bili, naj vam ti nasveti pomagajo pri uporabi nekaterih statističnih orodij, ki jih ponuja Excel.
Opisna statistika je enostavna
Prva stvar, ki jo morate vedeti, je, da so nekatere statistične analize in nekateri statistični ukrepi precej preprosti. Deskriptivna statistika, ki vključuje stvari, kot so navzkrižne tabele vrtilne tabele, pa tudi nekatere statistične funkcije, je smiselna tudi za nekoga, ki ni tako kvantitativen.
Povprečja včasih niso tako preprosta
Ko nekdo uporabi izraz povprečje, se običajno sklicuje na najpogostejšo povprečno meritev, ki je povprečje. Razumevanje, da je izraz povprečje nenatančen, naredi večino Excelove statistične funkcionalnosti bolj razumljivo.
Da bo ta razprava bolj konkretna, predpostavimo, da gledate na majhen nabor vrednosti: 1, 2, 3, 4 in 5. Kot morda veste, je povprečje v tem majhnem nizu vrednosti 3. Lahko izračunate povprečje tako, da seštejemo vsa števila v nizu (1+2+3+4+5) in nato to vsoto (15) delimo s skupnim številom vrednosti v nizu (5).
Mediana vrednost je vrednost, ki loči največje vrednosti iz najmanjših vrednosti. V nizu podatkov 1, 2, 3, 4 in 5 je mediana 3. Vrednost 3 loči največje vrednosti (4 in 5) od najmanjših vrednosti (1 in 2).
Ni vam treba razumeti različnih povprečnih meritev, vendar ne pozabite, da je izraz povprečje precej nenatančen.
Standardna odstopanja opisujejo disperzijo
Formulo za standardni odklon in logiko je precej enostavno razumeti.
Standardni odklon opisuje, kako vrednosti v naboru podatkov razlikujejo po povprečni. Pri statističnih ukrepih, kot je standardni odmik, pogosto dobite resničen vpogled v značilnosti podatkov, ki jih gledate. Druga stvar je, da lahko s tema dvema bitoma podatkov pogosto sklepate o podatkih z ogledom vzorcev.
Opazovanje je opazovanje
Opazovanje je eden od izrazov, s katerim se boste srečali, če boste prebrali kaj o statistiki. Opazovanje je samo opazovanje. Eden od načinov za opredelitev izraza opazovanje je naslednji: Kadar koli dejansko dodelite vrednost eni od vaših naključnih spremenljivk, ustvarite opazovanje.
Vzorec je podmnožica vrednosti
Vzorec je zbirka opazovanj iz populacije. Na primer, če ustvarite nabor podatkov, ki beleži dnevno visoko temperaturo v vaši soseščini, je vaša majhna zbirka opazovanj vzorec.
Za primerjavo, vzorec ni populacija. Populacija vključuje vse morebitne pripombe na.
Inferencialna statistika je kul, a zapletena
Če pogledate vzorec vrednosti iz populacije in je vzorec dovolj reprezentativen in velik, lahko sklepate o populaciji na podlagi značilnosti vzorca.
Inferencialna statistika, čeprav zelo močna, ima dve lastnosti, ki ju morate poznati:
-
Težave z natančnostjo
-
Strma krivulja učenja
Funkcije porazdelitve verjetnosti niso vedno zmedene
Funkcija porazdelitve P robability zveni precej zapleteno; vendar lahko dejansko intuitivno razumete, kaj je funkcija porazdelitve verjetnosti z nekaj uporabnimi primeri.
Ena pogosta porazdelitev, o kateri slišite na primer v razredih statistike, je porazdelitev T. Porazdelitev T je v bistvu normalna porazdelitev razen težjih, fatter repa.
Ena pogosta funkcija porazdelitve verjetnosti je enakomerna porazdelitev. V enotni porazdelitvi ima vsak dogodek enako verjetnost pojava. Edinstvena stvar te distribucije je, da je vse na zelo ravni.
Druga pogosta vrsta funkcije porazdelitve verjetnosti je normalna porazdelitev, znana tudi kot zvonova krivulja ali Gaussova porazdelitev.
Normalna porazdelitev se naravno pojavlja v mnogih situacijah. Na primer, inteligentni količniki (IQ) so normalno porazdeljeni.
Parametri niso tako zapleteni
Parameter je vhod za funkcijo verjetnostne porazdelitve. Z drugimi besedami, formula ali funkcija ali enačba, ki opisuje krivuljo porazdelitve verjetnosti, potrebuje vnose. V statistiki se ti vhodi imenujejo parametri.
Nekatere funkcije porazdelitve verjetnosti potrebujejo samo en preprost parameter. Za delo z enotno porazdelitvijo na primer potrebujete le število vrednosti v naboru podatkov. Na primer, šeststranska matrica ima le šest možnosti.
Poševnost in kurtosis opisujeta obliko porazdelitve verjetnosti
Nekaj drugih uporabnih statističnih izrazov, ki jih je treba poznati, sta poševnost in eksces. Poševnost kvantificira pomanjkanje simetrije v verjetnostni porazdelitvi. Pri popolnoma simetrični porazdelitvi, kot je normalna porazdelitev, je poševnost enaka nič. Če pa se verjetnostna porazdelitev nagiba v desno ali levo, je poševnost enaka neki vrednosti, ki ni nič, in vrednost kvantificira pomanjkanje simetrije.
Kurtoza kvantificira težo repov v porazdelitvi. V normalni porazdelitvi je kurtoza enaka nič. Rep je stvar, ki sega v levo ali desno. Če pa je rep v porazdelitvi težji od normalne porazdelitve, je eksces pozitivno število. Če so repi v porazdelitvi bolj suhi kot pri normalni porazdelitvi, je eksces negativno število.
Intervali zaupanja se na začetku zdijo zapleteni, vendar so koristni
Verjetnosti ljudi pogosto zmedejo. Pomembno je razumeti stopnje zaupanja, da so povezane z mejo napake.
Druga pomembna stvar, ki jo je treba razumeti o stopnjah zaupanja, je, da večja kot naredite velikost vzorca, manjša bo vaša stopnja napake pri uporabi iste stopnje zaupanja.
Kot en primer recimo, da imate nekaj podatkov Google Analytics o dveh različnih spletnih oglasih, ki ju prikazujete za promocijo svojega malega podjetja, in želite vedeti, kateri oglas je učinkovitejši. S formulo intervala zaupanja lahko ugotovite, kako dolgo se morajo vaši oglasi prikazovati, preden Google zbere dovolj podatkov, da boste vedeli, kateri oglas je res boljši.