Excel ir lielisks rīks, ja nepieciešams izmantot statistiku. Ja jūs nekad neesat saskāries ar statistiku skolā vai ir pagājuši desmit vai divi gadi kopš tā laika, ļaujiet šiem padomiem palīdzēt izmantot dažus Excel nodrošinātos statistikas rīkus.
Aprakstošā statistika ir vienkārša
Pirmā lieta, kas jums jāzina, ir tā, ka dažas statistiskās analīzes un daži statistikas pasākumi ir diezgan vienkārši. Aprakstošā statistika, kas ietver tādas lietas kā rakurstabulas šķērstabulas, kā arī dažas statistikas funkcijas, ir jēga pat tiem, kuri nav tik kvantitatīvi.
Vidējie rādītāji dažreiz nav tik vienkārši
Kad kāds lieto terminu vidējais, viņš parasti atsaucas uz visizplatītāko vidējo mērījumu, kas ir vidējais rādītājs. Izprotot, ka termins vidējais ir neprecīzs, liela daļa Excel statistikas funkcionalitātes kļūst saprotamāka.
Lai padarītu šo diskusiju precīzāku, pieņemsim, ka aplūkojat nelielu vērtību kopu: 1, 2, 3, 4 un 5. Kā jūs varētu zināt, šīs mazās vērtību kopas vidējā vērtība ir 3. Varat aprēķināt vidējo, saskaitot kopā visus kopas skaitļus (1+2+3+4+5) un pēc tam dalot šo summu (15) ar kopējo vērtību skaitu kopā (5).
Vidējā vērtība ir vērtība, kas atdala lielāko vērtības no mazākās vērtības. Datu kopā 1, 2, 3, 4 un 5 mediāna ir 3. Vērtība 3 atdala lielākās vērtības (4 un 5) no mazākajām vērtībām (1 un 2).
Jums nav jāsaprot dažādi vidējie mērījumi, taču jāatceras, ka termins vidējais ir diezgan neprecīzs.
Standarta novirzes raksturo izkliedi
Standarta novirzes formula un loģika ir diezgan viegli saprotami.
Standarta novirze ir aprakstīts, kā vērtības datu kopas atšķiras ap vidējais. Tā kā statistikas mērījumi, piemēram, standarta novirze, ir labi, jūs bieži vien gūstat reālu ieskatu par aplūkojamo datu īpašībām. Vēl viena lieta ir tāda, ka ar šiem diviem datu bitiem jūs bieži varat izdarīt secinājumus par datiem, aplūkojot paraugus.
Novērojums ir novērojums
Novērošana ir viens no terminiem, ar ko jūs saskaraties, lasot kaut ko par statistiku. Novērojums ir tikai novērojums. Viens no veidiem, kā definēt terminu novērojums, ir šāds: ikreiz, kad kādam no nejaušajiem mainīgajiem piešķirat vērtību, jūs izveidojat novērojumu.
Paraugs ir vērtību apakškopa
Paraugs ir kolekcija novērojumiem no iedzīvotājiem. Piemēram, ja izveidojat datu kopu, kas reģistrē ikdienas augsto temperatūru jūsu apkārtnē, jūsu mazā novērojumu kolekcija ir paraugs.
Salīdzinājumam, izlase nav kopa. Populācija ietver visus iespējamos apsvērumus.
Secinājumu statistika ir forša, bet sarežģīta
Ja aplūkojat vērtību izlasi no kopas un izlase ir reprezentatīva un pietiekami liela, varat izdarīt secinājumus par kopu, pamatojoties uz izlases īpašībām.
Izsecinātajai statistikai, lai gan tai ir ļoti spēcīga, piemīt divas īpašības, kas jums jāzina:
-
Precizitātes problēmas
-
Stāva mācīšanās līkne
Varbūtību sadalījuma funkcijas ne vienmēr ir mulsinošas
P robability sadales funkcija izklausās diezgan viltīga; bet jūs faktiski varat intuitīvi saprast, kas ir varbūtības sadalījuma funkcija, izmantojot dažus noderīgus piemērus.
Viens izplatīts sadalījums, par kuru jūs dzirdat, piemēram, statistikas klasēs, ir T sadalījums. T sadalījums būtībā ir normālais sadalījums, izņemot ar smagākiem, Treknākiem astes.
Viena izplatīta varbūtības sadalījuma funkcija ir vienmērīgs sadalījums. Ar vienotu izplatīšanu, katrs notikums ir tāds pats varbūtību. Šīs izplatīšanas unikālā lieta ir tā, ka viss ir diezgan sasodīti līmenī.
Vēl viens izplatīts varbūtības sadalījuma funkcijas veids ir normālais sadalījums, kas pazīstams arī kā zvana līkne vai Gausa sadalījums.
Normāls sadalījums daudzās situācijās notiek dabiski. Piemēram, intelekta koeficienti (IQ) tiek sadalīti normāli.
Parametri nav tik sarežģīti
Parametrs ir ievades varbūtības sadalījuma funkciju. Citiem vārdiem sakot, formulai, funkcijai vai vienādojumam, kas apraksta varbūtības sadalījuma līkni, ir nepieciešama ievade. Statistikā šīs ievades sauc par parametriem.
Dažām varbūtības sadalījuma funkcijām ir nepieciešams tikai viens vienkāršs parametrs. Piemēram, lai strādātu ar vienotu sadalījumu, viss, kas jums patiešām nepieciešams, ir vērtību skaits datu kopā. Piemēram, sešu malu matricai ir tikai sešas iespējas.
Slīpums un kurtoze raksturo varbūtības sadalījuma formu
Vēl daži noderīgi statistikas termini, kas jāzina, ir šķībums un kurtoze. Skewness kvantitatīvi nosaka simetrijas trūkumu varbūtības sadalījumā. Pilnīgi simetriskā sadalījumā, tāpat kā normālajā sadalījumā, šķībums ir vienāds ar nulli. Tomēr, ja varbūtības sadalījums sliecas pa labi vai pa kreisi, šķībums ir vienāds ar kādu vērtību, kas nav nulle, un vērtība nosaka simetrijas trūkumu.
Kurtosis kvantitatīvi nosaka astes smagumu sadalījumā. Normālā sadalījumā kurtoze ir vienāda ar nulli. Aste ir lieta, kas panāk, pa kreisi vai pa labi. Tomēr, ja sadalījuma aste ir smagāka par parasto sadalījumu, kurtoze ir pozitīvs skaitlis. Ja sadalījumā astes ir plānākas nekā parastajā sadalījumā, kurtoze ir negatīvs skaitlis.
Pārliecības intervāli sākumā šķiet sarežģīti, taču ir noderīgi
Varbūtības bieži mulsina cilvēkus. Svarīgi, lai saprastu ticamības līmeņus, ir tas, ka tie ir saistīti ar kļūdas robežu.
Vēl viena svarīga lieta, kas jāsaprot attiecībā uz ticamības līmeņiem, ir tāda, ka, jo lielāku jūs izveidojat izlases lielumu, jo mazāka būs kļūdas robeža, izmantojot to pašu ticamības līmeni.
Piemēram, pieņemsim, ka jums bija daži Google Analytics dati par divām dažādām tīmekļa reklāmām, kuras rādāt, lai reklamētu savu mazo uzņēmumu, un vēlaties uzzināt, kura reklāma ir efektīvāka. Varat izmantot ticamības intervāla formulu, lai noskaidrotu, cik ilgi jūsu reklāmām jādarbojas, pirms Google ir savācis pietiekami daudz datu, lai jūs zinātu, kura reklāma patiešām ir labāka.