Nogle statistiske mål i Excel kan være meget forvirrende, men chi-kvadrat-funktioner er virkelig praktiske. Selvom du kun skal bruge én af chi-kvadratfunktionerne, så læs alle tre funktionsbeskrivelser igennem. Set som et sæt statistiske værktøjer giver funktionerne en del mere mening.
CHISQ.DIST.RT: Chi-kvadratfordeling
CHISQ.FORD.RT-funktionen, som beregner den højrehalede sandsynlighed for en chi-kvadratfordeling, beregner et signifikansniveau ved hjælp af chi-kvadratværdien og frihedsgrader. Chi-kvadratværdien er lig med summen af de kvadrerede standardiserede scores. Funktionen bruger syntaksen
=CHISQ.FORDEL.RT( x , grader_frihed )
hvor x er lig med chi- kvadratværdien og deg_freedom er lig med frihedsgrader.
Som et eksempel på, hvordan alt dette fungerer, antag, at du er mere end en smule mistænksom over for en spillemaskine, der viser et af seks billeder: diamanter, stjerner, cowboystøvler, kirsebær, appelsiner eller krukker med guld. Med seks muligheder kan du forvente, at hver af de seks muligheder i et stort udsnit vil dukke op omkring en sjettedel af tiden.
Lad os sige, at prøvestørrelsen for eksempel er 180. I dette tilfælde kan du forvente, at hver spillemaskine-mulighed dukker op 30 gange, fordi 180/6 er lig med 30. Hvis du byggede et regnearksfragment som dette, kunne du analysere den enarmede bandit.
For at beregne signifikansniveauet og chi-kvadratfordelingsfunktionen kan du indtaste følgende formel i D10:
=CHISQ.FORD.RT(D8,5)
Funktionen returnerer værdien 0,010362338, som er det signifikansniveau, som en chi-kvadratværdi på 15 skyldes stikprøvefejl.
Celle D8 indeholder chi-kvadratværdien, som simpelthen er summen af de kvadrerede forskelle mellem de observerede og forventede værdier. For eksempel beregnes værdien i celle D2 ved hjælp af formlen =+(B2–C2)^2/C2 for at returnere værdien 3,333333333. Forudsigeligt beregner lignende formler i området D3:D7 kvadratforskellene for de andre spilleautomatsymboler. Og åh, forresten, formlen i celle D8 er =SUM(D2:D7).
Den nederste linje: Det ser ikke godt ud, gør det? Der er kun 1 procent chance for, at den spillemaskine, du er bekymret for, rent faktisk kan producere de observerede værdier på grund af tilfældigheder. Meget mistænkelig.
CHISQ.DIST: Chi-kvadratfordeling
Funktionen CHISQ.FORDELING ligner funktionen CHISQ.FORDELING, men beregner den venstrehalede sandsynlighed for en chi-kvadratfordeling. Funktionen bruger syntaksen
=CHISQ.FORDELING(x;grad_frihed;kumulativ)
hvor x er lig med chi- kvadratværdien , deg_frihed er lig med frihedsgrader, og kumulativ er en switch du sætter til 0 eller FALSK hvis du vil beregne en sandsynlighedstæthed og til 1 eller SAND hvis du vil beregne en kumulativ sandsynlighed.
CHISQ.INV.RT: Højrehalede chi-kvadratfordelingssandsynlighed
Funktionen CHISQ.INV.RT returnerer det omvendte af den højrehalede sandsynlighed for en chi-kvadratfordeling. Funktionen bruger syntaksen
=CHISQ.INV.RT(sandsynlighed;grad_frihed)
hvor sandsynlighed er lig med signifikansniveauet og deg_freedom er lig med frihedsgrader.
For at vise dig et eksempel på CHISQ.INV.RT-funktionen, se arbejdsarkfragmentet. Med seks mulige udfald på spilleautomaten har du fem frihedsgrader. Derfor, hvis du ønsker at beregne chi-kvadrat, der svarer til et 0,010362338 niveau af signifikans, kan du indtaste følgende formel i celle D12:
=CHISQ.INV.RT(D10;5)
Denne funktion returnerer værdien 14,99996888, hvilket er temmelig tæt på 15. Bemærk, at D10 bruges som det første sandsynlighedsargument, fordi den celle har det signifikansniveau, der beregnes af CHISQ.DIST-funktionen.
CHISQ.INV: Venstre-halede chi-kvadratfordelingssandsynlighed
CHISQ.INV-funktionen returnerer venstrehalede sandsynlighed for en chi-kvadratfordeling. Funktionen bruger syntaksen
=CHISQ.INV(sandsynlighed;grad_frihed)
hvor sandsynlighed er lig med signifikansniveauet og deg_freedom er lig med frihedsgrader.
For at beregne chi-kvadratværdien, der svarer til et signifikansniveau på 0,010362338 med 5 frihedsgrader, kan du indtaste følgende formel i en celle i regnearket:
=CHISQ.INV(0,010362338,5)
Denne funktion returnerer værdien .562927.
CHISQ.TEST: Chi-square test
Chi-kvadrattestfunktionen giver dig mulighed for at vurdere, om forskelle mellem de observerede og forventede værdier repræsenterer tilfældigheder eller stikprøvefejl. Funktionen bruger syntaksen
=CHISQ.TEST(faktisk_område;forventet_område)
Igen med henvisning til eksemplet med den mistænkelige spillemaskine, kan du udføre en chi-square-test ved at indtaste følgende formel i celle D14 og derefter sammenligne det, du observerer, med det, du forventer:
=CHISQ.TEST(B2:B7;C2:C7)
Funktionen returnerer p-værdien, eller sandsynligheden, vist i celle D14, hvilket indikerer, at der kun er en 1,0362-procent chance for, at forskellene mellem de observerede og forventede resultater stammer fra stikprøvefejl.
Et fællestræk ved en chi-kvadrattest er sammenligning af p-værdien - igen den værdi, som CHISQ.TEST-funktionen returnerer - til et signifikansniveau. For eksempel, i tilfælde af den mistænkelige spillemaskine, kan du sige: "Fordi det ikke er muligt at være 100 procent sikker, vil vi sige, at vi vil have en 95 procent sandsynlighed, hvilket svarer til et niveau på 5 procent af betydning."
Hvis p-værdien er mindre end signifikansniveauet, antager du, at noget er fishy. Statistikere, der ikke ønsker at lyde så jordnære, har en anden sætning til denne noget-er-fiskende konklusion: at afvise nulhypotesen.