„Excel“ yra puikus įrankis, kai reikia naudoti statistiką. Jei mokykloje niekada nesusidūrėte su statistika arba jau praėjo dešimtmetis ar du, leiskite šiems patarimams padėti naudotis kai kuriais „Excel“ teikiamais statistikos įrankiais.
Aprašomoji statistika yra paprasta
Pirmas dalykas, kurį turėtumėte žinoti, yra tai, kad kai kurios statistinės analizės ir kai kurios statistinės priemonės yra gana paprastos. Aprašomoji statistika, apimanti tokius dalykus kaip suvestinės lentelės kryžminės lentelės, taip pat kai kurios statistinės funkcijos, yra prasminga net tiems, kurie nėra tokie kiekybiniai.
Vidurkiai kartais nėra tokie paprasti
Kai kas nors vartoja terminą „ vidurkis“, jis dažniausiai nurodo įprastą vidurkio matavimą, kuris yra vidurkis. Supratus, kad terminas „ vidurkis“ yra netikslus, daugelis „Excel“ statistinių funkcijų tampa suprantamesnės.
Kad ši diskusija būtų konkretesnė, tarkime, kad žiūrite į nedidelį reikšmių rinkinį: 1, 2, 3, 4 ir 5. Kaip galbūt žinote, šios mažos reikšmių rinkinio vidurkis yra 3. Galite apskaičiuoti vidurkį sudedant visus aibės skaičius (1+2+3+4+5) ir padalijus šią sumą (15) iš bendro aibės reikšmių skaičiaus (5).
Mediana vertė yra vertė, kuri atskiria didžiausias vertybes iš mažiausių reikšmių. 1, 2, 3, 4 ir 5 duomenų rinkinyje mediana yra 3. 3 reikšmė atskiria didžiausias reikšmes (4 ir 5) nuo mažiausių verčių (1 ir 2).
Jums nereikia suprasti skirtingų vidutinių matavimų, tačiau turėtumėte atsiminti, kad terminas vidurkis yra gana netikslus.
Standartiniai nuokrypiai apibūdina dispersiją
Standartinio nuokrypio formulė ir logika yra gana lengvai suprantamos.
Standartinis nuokrypis apibūdina kaip vertybės duomenų rinkinio skirtis maždaug vidutinis. Puikus dalykas, susijęs su statistiniais rodikliais, pvz., standartiniu nuokrypiu, dažnai įgyjate realių įžvalgų apie žiūrimų duomenų ypatybes. Kitas dalykas yra tai, kad naudodami šiuos du duomenų bitus dažnai galite padaryti išvadas apie duomenis, žiūrėdami į pavyzdžius.
Stebėjimas yra stebėjimas
Stebėjimas yra vienas iš terminų, su kuriais susidursite skaitydami ką nors apie statistiką. Stebėjimas yra tik stebėjimas. Vienas iš būdų apibrėžti terminą stebėjimas yra toks: kai iš tikrųjų priskiriate reikšmę vienam iš atsitiktinių kintamųjų, sukuriate stebėjimą.
Pavyzdys yra reikšmių poaibis
Pavyzdys yra stebėjimų iš gyventojų surinkimas. Pavyzdžiui, jei sukuriate duomenų rinkinį, kuriame įrašoma aukšta paros temperatūra jūsų kaimynystėje, jūsų nedidelis stebėjimų rinkinys yra pavyzdys.
Palyginimui, imtis nėra visuma. Gyventojų apima visas galimas pastabas.
Išvadinė statistika yra šauni, bet sudėtinga
Jei pažvelgsite į reikšmių imtį iš populiacijos, o imtis yra reprezentatyvi ir pakankamai didelė, galite padaryti išvadas apie populiaciją pagal imties charakteristikas.
Išvadinė statistika, nors ir labai galinga, turi dvi savybes, kurias reikia žinoti:
-
Tikslumo problemos
-
Stačia mokymosi kreivė
Tikimybių pasiskirstymo funkcijos ne visada yra painios
P robability paskirstymo funkcija skamba gana sudėtingai; bet jūs iš tikrųjų galite intuityviai suprasti, kas yra tikimybių pasiskirstymo funkcija, pateikę keletą naudingų pavyzdžių.
Pavyzdžiui, vienas dažnas skirstinys, apie kurį girdite statistikos klasėse, yra T skirstinys. T paskirstymo yra iš esmės normalus pasiskirstymas, išskyrus sunkesnėmis, storesni uodegos.
Viena bendra tikimybių pasiskirstymo funkcija yra tolygus pasiskirstymas. Esant vienodam pasiskirstymui, kiekvieno įvykio tikimybė yra tokia pati. Unikalus šio platinimo dalykas yra tas, kad viskas yra gana velniškai lygi.
Kitas dažnas tikimybių pasiskirstymo funkcijos tipas yra normalusis skirstinys, dar žinomas kaip varpo kreivė arba Gauso skirstinys.
Normalus pasiskirstymas natūraliai atsiranda daugelyje situacijų. Pavyzdžiui, intelekto koeficientai (IQ) pasiskirsto normaliai.
Parametrai nėra tokie sudėtingi
Parametras yra naudojamas kaip įvedimo tikimybių pasiskirstymo funkcija. Kitaip tariant, formulei, funkcijai ar lygčiai, apibūdinančiai tikimybių pasiskirstymo kreivę, reikia įvesties. Statistikoje tie įėjimai vadinami parametrais.
Kai kurioms tikimybių skirstinio funkcijoms reikia tik vieno paprasto parametro. Pavyzdžiui, norint dirbti su vienodu paskirstymu, viskas, ko jums tikrai reikia, yra reikšmių skaičius duomenų rinkinyje. Pavyzdžiui, šešiapusis kauliukas turi tik šešias galimybes.
Pasvirumas ir kurtozė apibūdina tikimybių pasiskirstymo formą
Keletas kitų naudingų statistinių terminų, kuriuos reikia žinoti, yra kreivumas ir kurtozė. Skewness kiekybiškai įvertina simetrijos trūkumą tikimybių skirstinyje. Tobulai simetriškame pasiskirstyme, kaip ir normaliajame skirstinyje, iškrypimas lygus nuliui. Tačiau jei tikimybių skirstinys pakrypsta į dešinę arba į kairę, iškrypimas yra lygus kitai reikšmei, o ne nuliui, o ši vertė kiekybiškai parodo simetrijos trūkumą.
Kurtozė kiekybiškai įvertina uodegų sunkumą pasiskirstyme. Normaliajame skirstinyje kurtozė lygi nuliui. Uodega yra dalykas, kuris pasiekia į kairę arba į dešinę. Tačiau jei skirstinio uodega yra sunkesnė už normalųjį pasiskirstymą, kurtozė yra teigiamas skaičius. Jei skirstinio uodegos yra plonesnės nei normaliojo pasiskirstymo, kurtozė yra neigiamas skaičius.
Pasitikėjimo intervalai iš pradžių atrodo sudėtingi, bet yra naudingi
Tikimybės dažnai klaidina žmones. Svarbu suprasti, kad pasitikėjimo lygiai yra susiję su paklaidos riba.
Kitas svarbus dalykas, kurį reikia suprasti apie pasitikėjimo lygius, yra tai, kad kuo didesnį imties dydį padarysite, tuo mažesnė paklaida bus naudojant tą patį patikimumo lygį.
Kaip tik vieną pavyzdį, tarkime, kad turėjote šiek tiek „Google Analytics“ duomenų apie du skirtingus žiniatinklio skelbimus, kuriuos rodote norėdami reklamuoti savo smulkųjį verslą, ir norite sužinoti, kuris skelbimas yra efektyvesnis. Galite naudoti pasikliautinojo intervalo formulę, kad išsiaiškintumėte, kiek laiko turi būti rodomi jūsų skelbimai, kad „Google“ surinktų pakankamai duomenų, kad žinotumėte, kuris skelbimas tikrai geresnis.