Některá statistická měření v Excelu mohou být velmi matoucí, ale funkce chí-kvadrát jsou skutečně praktické. I když budete používat pouze jednu z funkcí chí-kvadrát, přečtěte si všechny tři popisy funkcí. Nahlíženo jako na sadu statistických nástrojů dávají funkce o něco větší smysl.
CHISQ.DIST.RT: Chi-kvadrát rozdělení
Funkce CHISQ.DIST.RT, která vypočítává pravostrannou pravděpodobnost rozdělení chí-kvadrát, vypočítává hladinu významnosti pomocí hodnoty chí-kvadrát a stupňů volnosti. Hodnota chí-kvadrát se rovná součtu kvadrátů standardizovaných skóre. Funkce používá syntaxi
=CHISQ.DIST.RT( x , stupeň_volnosti )
kde x se rovná hodnotě chí-kvadrát a deg_freedom se rovná stupňům volnosti.
Jako příklad toho, jak to všechno funguje, předpokládejme, že jste více než trochu podezřívaví k nějakému automatu, který ukazuje jeden ze šesti obrázků: diamanty, hvězdy, kovbojské boty, třešně, pomeranče nebo hrnce zlata. Se šesti možnostmi byste mohli očekávat, že ve velkém vzorku se každá ze šesti možností objeví zhruba v jedné šestině případů.
Řekněme, že velikost vzorku je například 180. V tomto případě můžete očekávat, že se každá možnost hracího automatu objeví 30krát, protože 180/6 se rovná 30. Pokud byste vytvořili fragment pracovního listu, jako je tento, mohli byste analyzovat jednorukého banditu.
Chcete-li vypočítat hladinu významnosti a distribuční funkci chí-kvadrát, můžete do D10 zadat následující vzorec:
=CHISQ.DIST.RT(D8;5)
Funkce vrátí hodnotu 0,010362338, což je úroveň významnosti, kterou chí-kvadrát hodnota 15 způsobí kvůli chybě vzorkování.
Buňka D8 obsahuje hodnotu chí-kvadrát, což je jednoduše součet čtverců rozdílů mezi pozorovanými a očekávanými hodnotami. Například hodnota v buňce D2 se vypočítá pomocí vzorce =+(B2–C2)^2/C2 a vrátí se hodnota 3,333333333. Lze předpokládat, že podobné vzorce v rozsahu D3:D7 vypočítávají druhou mocninu rozdílů pro ostatní symboly hracích automatů. A mimochodem, vzorec v buňce D8 je =SUM(D2:D7).
Závěr: Nevypadá to dobře, že? Existuje pouze 1procentní šance, že automat, o který se obáváte, může skutečně produkovat pozorované hodnoty díky náhodě. Velmi podezřelé.
CHISQ.DIST: Chi-kvadrát rozdělení
Funkce CHISQ.DIST se podobá funkci CHISQ.DIST.RT, ale vypočítává levostrannou pravděpodobnost rozdělení chí-kvadrát. Funkce používá syntaxi
=CHISQ.DIST(x,stupeň_volnosti;kumulativní)
kde x se rovná hodnotě chí-kvadrát, deg_freedom se rovná stupňům volnosti a kumulativní je přepínač, který nastavíte na 0 nebo FALSE, pokud chcete vypočítat hustotu pravděpodobnosti, a na 1 nebo TRUE, pokud chcete vypočítat kumulativní pravděpodobnost.
CHISQ.INV.RT: Pravostranná pravděpodobnost rozdělení chí-kvadrát
Funkce CHISQ.INV.RT vrací inverzní hodnotu pravostranné pravděpodobnosti rozdělení chí-kvadrát. Funkce používá syntaxi
=CHISQ.INV.RT(pravděpodobnost,stupeň_volnosti)
kde pravděpodobnost se rovná hladině významnosti a stupeň_volnosti se rovná stupňům volnosti.
Chcete-li si ukázat příklad funkce CHISQ.INV.RT, podívejte se na fragment listu. Se šesti možnými výsledky na automatu máte pět stupňů volnosti. Pokud tedy chcete vypočítat chí-kvadrát, který odpovídá hladině významnosti 0,010362338, můžete do buňky D12 zadat následující vzorec:
=CHISQ.INV.RT(D10;5)
Tato funkce vrací hodnotu 14,99996888, což je zatraceně blízko 15. Všimněte si, že D10 se používá jako první argument pravděpodobnosti, protože tato buňka obsahuje úroveň významnosti vypočítanou funkcí CHISQ.DIST.
CHISQ.INV: Pravděpodobnost levostranného rozdělení chí-kvadrát
Funkce CHISQ.INV vrací levostrannou pravděpodobnost rozdělení chí-kvadrát. Funkce používá syntaxi
=CHISQ.INV(pravděpodobnost,stupeň_volnosti)
kde pravděpodobnost se rovná hladině významnosti a stupeň_volnosti se rovná stupňům volnosti.
Chcete-li vypočítat hodnotu chí-kvadrát, která se rovná hladině významnosti 0,010362338 s 5 stupni volnosti, můžete do buňky v listu zadat následující vzorec:
=CHISQ.INV(0,010362338,5)
Tato funkce vrátí hodnotu 0,562927.
CHISQ.TEST: Chí-kvadrát test
Funkce chí-kvadrát testu vám umožňuje posoudit, zda rozdíly mezi pozorovanými a očekávanými hodnotami představují náhodu nebo chybu vzorku. Funkce používá syntaxi
=CHISQ.TEST(skutečný_rozsah, očekávaný_rozsah)
Opět s odkazem na příklad podezřelého hracího automatu můžete provést test chí-kvadrát zadáním následujícího vzorce do buňky D14 a poté porovnáním toho, co pozorujete, s tím, co očekáváte:
=CHISQ.TEST(B2:B7,C2:C7)
Funkce vrátí p-hodnotu nebo pravděpodobnost uvedenou v buňce D14, což znamená, že existuje pouze 1,0362procentní šance, že rozdíly mezi pozorovanými a očekávanými výsledky pocházejí z chyby vzorku.
Společným znakem chí-kvadrát testu je porovnání p-hodnoty — opět hodnoty, kterou vrací funkce CHISQ.TEST — na hladinu významnosti. Například v případě podezřelého automatu můžete říci: „Protože není možné mít stoprocentní jistotu, řekneme, že chceme 95procentní pravděpodobnost, což odpovídá 5procentní úrovni význam."
Pokud je p-hodnota menší než hladina významnosti, předpokládáte, že je něco podlé. Statistikové, kteří nechtějí znít tak zemitě, mají pro tento něco-je-rybí závěr jinou frázi: odmítnutí nulové hypotézy.