Noen statistiske mål i Excel kan være veldig forvirrende, men kjikvadratfunksjoner er virkelig praktiske. Selv om du bare skal bruke én av kjikvadratfunksjonene, les gjennom alle tre funksjonsbeskrivelsene. Sett på som et sett med statistiske verktøy gir funksjonene mye mer mening.
CHISQ.DIST.RT: Chi-kvadratfordeling
CHISQ.DIST.RT-funksjonen, som beregner den høyresidede sannsynligheten for en kjikvadratfordeling, beregner et signifikansnivå ved å bruke kjikvadratverdien og frihetsgradene. Kjikvadratverdien er lik summen av de kvadrerte standardiserte skårene. Funksjonen bruker syntaksen
=CHISQ.FORDEL.RT( x , grader_frihet )
hvor x er lik kjikvadratverdien og deg_frihet er lik frihetsgradene.
Som et eksempel på hvordan alt dette fungerer, anta at du er mer enn litt mistenksom overfor en spilleautomat som viser ett av seks bilder: diamanter, stjerner, cowboystøvler, kirsebær, appelsiner eller potter med gull. Med seks muligheter kan du forvente at i et stort utvalg vil hver av de seks mulighetene dukke opp omtrent en sjettedel av tiden.
Si at prøvestørrelsen er 180, for eksempel. I dette tilfellet kan du forvente at hver spilleautomat dukker opp 30 ganger fordi 180/6 tilsvarer 30. Hvis du bygde et regnearkfragment som dette, kan du analysere den enarmede banditten.
For å beregne signifikansnivået og kjikvadratfordelingsfunksjonen, kan du skrive inn følgende formel i D10:
=CHISQ.FORDEL.RT(D8,5)
Funksjonen returnerer verdien 0,010362338, som er signifikansnivået som en kjikvadratverdi på 15 skyldes samplingsfeil.
Celle D8 inneholder kjikvadratverdien, som ganske enkelt er summen av kvadrerte forskjeller mellom de observerte og forventede verdiene. For eksempel beregnes verdien i celle D2 ved å bruke formelen =+(B2–C2)^2/C2 for å returnere verdien 3,333333333. Forutsigbart vil lignende formler i området D3:D7 beregne kvadrerte forskjeller for de andre spilleautomatsymbolene. Og forresten, formelen i celle D8 er =SUM(D2:D7).
Konklusjonen: Det ser ikke bra ut, gjør det? Det er bare 1 prosent sjanse for at spilleautomaten du er bekymret for faktisk kan produsere de observerte verdiene på grunn av tilfeldigheter. Veldig mistenkelig.
CHISQ.DIST: Chi-kvadratfordeling
CHISQ.DIST-funksjonen ligner CHISQ.DIST.RT-funksjonen, men beregner den venstresidede sannsynligheten for en kjikvadratfordeling. Funksjonen bruker syntaksen
=CHISQ.FORDELING(x;grad_frihet;kumulativ)
hvor x er lik kjikvadratverdien, deg_frihet er lik frihetsgradene, og kumulativ er en bryter du setter til 0 eller FALSE hvis du vil beregne en sannsynlighetstetthet og til 1 eller TRUE hvis du vil beregne en kumulativ sannsynlighet.
CHISQ.INV.RT: Høyresidet kjikvadratfordelingssannsynlighet
CHISQ.INV.RT-funksjonen returnerer den inverse av den høyresidede sannsynligheten for en kjikvadratfordeling. Funksjonen bruker syntaksen
=CHISQ.INV.RT(sannsynlighet;grad_frihet)
hvor sannsynlighet er lik nivået av signifikans og deg_freedom er lik frihetsgradene.
For å vise deg et eksempel på CHISQ.INV.RT-funksjonen, se regnearkfragmentet. Med seks mulige utfall på spilleautomaten har du fem frihetsgrader. Derfor, hvis du vil beregne chi-kvadraten som tilsvarer et 0,010362338 nivå av signifikans, kan du skrive inn følgende formel i celle D12:
=CHISQ.INV.RT(D10;5)
Denne funksjonen returnerer verdien 14,99996888, som er ganske så nær 15. Merk at D10 brukes som det første sannsynlighetsargumentet fordi den cellen har signifikansnivået beregnet av CHISQ.DIST-funksjonen.
CHISQ.INV: Venstre-tailed chi-kvadratfordelingssannsynlighet
CHISQ.INV-funksjonen returnerer venstrehalesannsynlighet for en kjikvadratfordeling. Funksjonen bruker syntaksen
=CHISQ.INV(sannsynlighet;grad_frihet)
hvor sannsynlighet er lik nivået av signifikans og deg_freedom er lik frihetsgradene.
For å beregne kjikvadratverdien som tilsvarer et signifikansnivå på 0,010362338 med 5 frihetsgrader, kan du skrive inn følgende formel i en celle i regnearket:
=CHISQ.INV(0,010362338,5)
Denne funksjonen returnerer verdien .562927.
CHISQ.TEST: Chi-kvadrattest
Kjikvadrattestfunksjonen lar deg vurdere om forskjeller mellom de observerte og forventede verdiene representerer tilfeldigheter eller prøvetakingsfeil. Funksjonen bruker syntaksen
=CHISQ.TEST(faktisk_område;forventet_område)
Igjen, med henvisning til eksemplet med den mistenkelige spilleautomaten, kan du utføre en kjikvadrattest ved å skrive inn følgende formel i celle D14 og deretter sammenligne det du observerer med det du forventer:
=CHISQ.TEST(B2:B7;C2:C7)
Funksjonen returnerer p-verdien, eller sannsynligheten, vist i celle D14, noe som indikerer at det bare er 1,0362 prosent sjanse for at forskjellene mellom de observerte og forventede resultatene stammer fra prøvetakingsfeil.
Et vanlig trekk ved en kjikvadrattest er sammenligning av p-verdien – igjen verdien som CHISQ.TEST-funksjonen returnerer – til et signifikansnivå. For eksempel, når det gjelder den mistenkelige spilleautomaten, kan du si: «Fordi det ikke er mulig å være 100 prosent sikker, vil vi si at vi vil ha en 95 prosent sannsynlighet, som tilsvarer et nivå på 5 prosent av betydning."
Hvis p-verdien er mindre enn signifikansnivået, antar du at noe er fishy. Statistikere, som ikke ønsker å høres så jordnære ut, har en annen setning for denne noe-er-fiskende konklusjonen: å avvise nullhypotesen.