Vissa statistiska mått i Excel kan vara mycket förvirrande, men chi-kvadratfunktioner är verkligen praktiska. Även om du bara ska använda en av chi-kvadratfunktionerna, läs igenom alla tre funktionsbeskrivningarna. Ses som en uppsättning statistiska verktyg, är funktionerna mycket mer vettiga.
CHISQ.DIST.RT: Chi-kvadratfördelning
Funktionen CHISQ.DIST.RT, som beräknar den högersidiga sannolikheten för en chi-kvadratfördelning, beräknar en signifikansnivå med hjälp av chi-kvadratvärdet och frihetsgraderna. Chi-kvadratvärdet är lika med summan av de kvadrerade standardiserade poängen. Funktionen använder syntaxen
=CHISQ.DIST.RT( x , grad_freedom )
där x är lika med chi- kvadratvärdet och deg_frihet är lika med frihetsgraderna.
Som ett exempel på hur allt detta fungerar, anta att du är mer än lite misstänksam mot någon spelautomat som visar en av sex bilder: diamanter, stjärnor, cowboystövlar, körsbär, apelsiner eller krukor med guld. Med sex möjligheter kan du förvänta dig att i ett stort urval skulle var och en av de sex möjligheterna dyka upp ungefär en sjättedel av tiden.
Säg att urvalsstorleken är 180, till exempel. I det här fallet kan du förvänta dig att varje spelautomat dyker upp 30 gånger eftersom 180/6 är lika med 30. Om du byggde ett kalkylbladsfragment som det här, kan du analysera den enarmade banditen.
För att beräkna signifikansnivån och chi-kvadratfördelningsfunktionen kan du ange följande formel i D10:
=CHISQ.DIST.RT(D8,5)
Funktionen returnerar värdet 0,010362338, vilket är signifikansnivån som ett chi-kvadratvärde på 15 beror på samplingsfel.
Cell D8 innehåller chi-kvadratvärdet, som helt enkelt är summan av de kvadratiska skillnaderna mellan de observerade och förväntade värdena. Till exempel beräknas värdet i cell D2 med formeln =+(B2–C2)^2/C2 för att returnera värdet 3,333333333. Förutsägbart, liknande formler i intervallet D3:D7 beräknar kvadratskillnaderna för de andra spelautomatsymbolerna. Och, förresten, formeln i cell D8 är =SUMMA(D2:D7).
Summan av kardemumman: Det ser inte bra ut, eller hur? Det finns bara en procents chans att spelautomaten som du är orolig för faktiskt kan producera de observerade värdena på grund av slumpen. Mycket misstänksam.
CHISQ.DIST: Chi-kvadratfördelning
Funktionen CHISQ.DIST.RT liknar CHISQ.DIST.RT-funktionen men beräknar den vänstersidiga sannolikheten för en chi-kvadratfördelning. Funktionen använder syntaxen
=CHISQ.DIST(x;grad_frihet;kumulativ)
där x är lika med chi- kvadratvärdet , deg_frihet är lika med frihetsgraderna och kumulativ är en omkopplare du ställer in på 0 eller FALSE om du vill beräkna en sannolikhetstäthet och till 1 eller TRUE om du vill beräkna en kumulativ sannolikhet.
CHISQ.INV.RT: Högersvansad chi-kvadratfördelningssannolikhet
Funktionen CHISQ.INV.RT returnerar inversen av den högersidiga sannolikheten för en chi-kvadratfördelning. Funktionen använder syntaxen
=CHISQ.INV.RT(sannolikhet,grad_frihet)
där sannolikhet är lika med signifikansnivån och deg_frihet är lika med frihetsgraderna.
För att visa ett exempel på CHISQ.INV.RT-funktionen, se kalkylbladsfragmentet. Med sex möjliga utfall på spelautomaten har du fem frihetsgrader. Därför, om du vill beräkna chi-kvadraten som motsvarar en signifikansnivå på 0,010362338, kan du ange följande formel i cell D12:
=CHISQ.INV.RT(D10,5)
Den här funktionen returnerar värdet 14,99996888, vilket är ganska nära 15. Observera att D10 används som det första sannolikhetsargumentet eftersom den cellen håller signifikansnivån som beräknas av CHISQ.DIST-funktionen.
CHISQ.INV: Vänsterstjärtad chi-kvadratfördelningssannolikhet
Funktionen CHISQ.INV returnerar vänstersvansad sannolikhet för en chi-kvadratfördelning. Funktionen använder syntaxen
=CHISQ.INV(sannolikhet,grad_frihet)
där sannolikhet är lika med signifikansnivån och deg_frihet är lika med frihetsgraderna.
För att beräkna chi-kvadratvärdet som motsvarar en signifikansnivå på 0,010362338 med 5 frihetsgrader kan du ange följande formel i en cell i kalkylbladet:
=CHISQ.INV(0,010362338,5)
Denna funktion returnerar värdet .562927.
CHISQ.TEST: Chi-kvadrattest
Chi-kvadrattestfunktionen låter dig bedöma om skillnader mellan de observerade och förväntade värdena representerar slumpen eller provtagningsfel. Funktionen använder syntaxen
=CHISQ.TEST(faktiskt_intervall;förväntat_intervall)
Återigen med hänvisning till exemplet med den misstänkta spelautomaten, kan du utföra ett chi-kvadrattest genom att skriva in följande formel i cell D14 och sedan jämföra det du observerar med vad du förväntar dig:
=CHISQ.TEST(B2:B7;C2:C7)
Funktionen returnerar p-värdet, eller sannolikheten, som visas i cell D14, vilket indikerar att det bara finns en 1,0362-procentig chans att skillnaderna mellan de observerade och förväntade resultaten härrör från provtagningsfel.
Ett vanligt inslag i ett chi-kvadrattest är jämförelse av p-värdet – återigen värdet som CHISQ.TEST-funktionen returnerar – till en signifikansnivå. Till exempel, i fallet med den misstänkta spelautomaten, kan du säga: "Eftersom det inte går att vara 100 procent säker, kommer vi att säga att vi vill ha en 95-procentig sannolikhet, vilket motsvarar en 5-procentig nivå på betydelse."
Om p-värdet är mindre än signifikansnivån antar du att något är skumt. Statistiker, som inte vill låta så jordnära, har en annan fras för denna något-är-fiskiga slutsats: att förkasta nollhypotesen.