Excel je prekrasan alat kada trebate koristiti statistiku. Ako nikada niste bili izloženi statistici u školi ili je prošlo desetljeće ili dva otkako ste bili, neka vam ovi savjeti pomognu koristiti neke od statističkih alata koje nudi Excel.
Deskriptivna statistika je jednostavna
Prva stvar koju biste trebali znati je da su neke statističke analize i neke statističke mjere prilično jednostavne. Deskriptivna statistika, koja uključuje stvari kao što su unakrsne tablice zaokretne tablice, kao i neke od statističkih funkcija, imaju smisla čak i za nekoga tko nije toliko kvantitativan.
Prosjeci ponekad nisu tako jednostavni
Kada netko koristi izraz prosjek, ono na što obično misli je najčešće prosječno mjerenje, a to je srednja vrijednost. Razumijevanje da je pojam prosjek neprecizan čini veći dio statističke funkcionalnosti Excela razumljivijim.
Kako biste ovu raspravu učinili konkretnijom, pretpostavite da gledate u mali skup vrijednosti: 1, 2, 3, 4 i 5. Kao što možda znate, srednja vrijednost u ovom malom skupu vrijednosti je 3. Možete izračunati srednju vrijednost zbrajanjem svih brojeva u skupu (1+2+3+4+5), a zatim dijeljenjem ovog zbroja (15) s ukupnim brojem vrijednosti u skupu (5).
Srednja vrijednost je vrijednost koja razdvaja najveće vrijednosti od najmanjih vrijednosti. U skupu podataka 1, 2, 3, 4 i 5 medijan je 3. Vrijednost 3 odvaja najveće vrijednosti (4 i 5) od najmanjih vrijednosti (1 i 2).
Ne morate razumjeti različita prosječna mjerenja, ali zapamtite da je pojam prosjek prilično neprecizan.
Standardne devijacije opisuju disperziju
Formula za standardnu devijaciju i logiku prilično su lako razumjeti.
Standardna devijacija opisuje kako vrijednosti u skupu podataka varirati oko srednje vrijednosti. Zgodna stvar kod statističkih mjera kao što je standardna devijacija, često dobivate pravi uvid u karakteristike podataka koje gledate. Druga stvar je da s ova dva bita podataka često možete izvući zaključke o podacima gledajući uzorke.
Opažanje je promatranje
Promatranje je jedan od pojmova s kojim ćete se susresti ako pročitate bilo što o statistici. Opažanje je samo promatranje. Jedan od načina da se definira pojam promatranje je sljedeći: Kad god stvarno dodijelite vrijednost jednoj od vaših slučajnih varijabli, vi kreirate promatranje.
Uzorak je podskup vrijednosti
Uzorak je skup proučavanjima populaciji. Na primjer, ako stvorite skup podataka koji bilježi dnevnu visoku temperaturu u vašem susjedstvu, vaša mala zbirka opažanja je uzorak.
Za usporedbu, uzorak nije populacija. Stanovništvo obuhvaća sve moguće primjedbe.
Inferencijalna statistika je cool, ali komplicirana
Ako pogledate uzorak vrijednosti iz populacije, a uzorak je reprezentativan i dovoljno velik, možete donijeti zaključke o populaciji na temelju karakteristika uzorka.
Inferencijalna statistika, iako vrlo moćna, posjeduje dvije kvalitete koje morate znati:
-
Problemi s preciznošću
-
Strma krivulja učenja
Funkcije distribucije vjerojatnosti nisu uvijek zbunjujuće
Funkcija raspodjele P robusnosti zvuči prilično zeznuto; ali zapravo možete intuitivno razumjeti što je funkcija distribucije vjerojatnosti uz nekoliko korisnih primjera.
Jedna uobičajena distribucija o kojoj čujete u razredima statistike, na primjer, je T distribucija. T raspodjela u osnovi normalna raspodjela osim težim, deblji repovima.
Jedna uobičajena funkcija distribucije vjerojatnosti je uniformna distribucija. U uniformnoj raspodjeli, svaki događaj ima istu vjerojatnost nastanka. Jedinstvena stvar ove distribucije je da je sve prilično prokleto na razini.
Druga uobičajena vrsta funkcije raspodjele vjerojatnosti je normalna distribucija, također poznata kao zvonasta krivulja ili Gaussova distribucija.
Normalna raspodjela javlja se prirodno u mnogim situacijama. Na primjer, kvocijent inteligencije (IQ) se normalno raspoređuje.
Parametri nisu tako komplicirani
Parametar je ulaz u funkciju distribucije vjerojatnosti. Drugim riječima, formula ili funkcija ili jednadžba koja opisuje krivulju distribucije vjerojatnosti treba unose. U statistici se ti ulazi nazivaju parametri.
Neke funkcije distribucije vjerojatnosti trebaju samo jedan jednostavan parametar. Na primjer, za rad s ujednačenom distribucijom, sve što vam je stvarno potrebno je broj vrijednosti u skupu podataka. Šestostrana kocka, na primjer, ima samo šest mogućnosti.
Iskrivljenost i kurtosis opisuju oblik distribucije vjerojatnosti
Nekoliko drugih korisnih statističkih pojmova koje treba znati su iskrivljenost i kurtosis. Iskrivljenost kvantificira nedostatak simetrije u distribuciji vjerojatnosti. U savršeno simetričnoj raspodjeli, poput normalne distribucije, asimetrija je jednaka nuli. Međutim, ako se distribucija vjerojatnosti naginje udesno ili ulijevo, iskrivljenost je jednaka nekoj vrijednosti koja nije nula, a vrijednost kvantificira nedostatak simetrije.
Kurtosis kvantificira težinu repova u distribuciji. U normalnoj distribuciji, eksces je jednak nuli. Rep je stvar koja dopire s lijeve ili desne. Međutim, ako je rep u distribuciji teži od normalne distribucije, kurtosis je pozitivan broj. Ako su repovi u distribuciji mršaviji nego u normalnoj distribuciji, kurtosis je negativan broj.
Intervali povjerenja u početku se čine kompliciranima, ali su korisni
Vjerojatnosti često zbunjuju ljude. Važna stvar koju treba razumjeti o razinama pouzdanosti je da su one povezane s marginom pogreške.
Još jedna važna stvar koju treba razumjeti o razinama pouzdanosti jest da što veći uzorak bude, to će manja vaša margina pogreške koristiti istu razinu pouzdanosti.
Kao samo jedan primjer, recimo da imate neke Google Analytics podatke o dva različita web-oglasa koja prikazujete za promicanje svoje male tvrtke i želite znati koji je oglas učinkovitiji. Možete koristiti formulu intervala pouzdanosti kako biste utvrdili koliko dugo se vaši oglasi trebaju prikazivati prije nego što Google prikupi dovoljno podataka da biste znali koji je oglas stvarno bolji.