Някои статистически мерки в Excel могат да бъдат много объркващи, но функциите хи-квадрат наистина са практични. Дори ако ще използвате само една от функциите хи-квадрат, прочетете описанието на трите функции. Разглеждани като набор от статистически инструменти, функциите имат доста по-голям смисъл.
CHISQ.DIST.RT: Хи-квадрат разпределение
Функцията CHISQ.DIST.RT, която изчислява дясната вероятност за хи-квадратно разпределение, изчислява ниво на значимост, използвайки стойността хи-квадрат и степените на свобода. Стойността на хи-квадрат е равна на сумата от стандартизираните резултати на квадрат. Функцията използва синтаксиса
=CHISQ.DIST.RT( x , deg_freedom )
където x е равно на стойността хи-квадрат и deg_freedom е равно на степените на свобода.
Като пример за това как работи всичко това, да предположим, че сте повече от малко подозрителни към някоя слот машина, която показва една от шестте картини: диаманти, звезди, каубойски ботуши, череши, портокали или саксии със злато. При шест възможности може да очаквате, че в голяма извадка всяка от шестте възможности ще се появи приблизително една шеста от времето.
Да кажем, че размерът на извадката е 180, например. В този случай може да очаквате, че всяка възможност за слот машина се появява 30 пъти, защото 180/6 е равно на 30. Ако създадете фрагмент от работен лист като този, можете да анализирате едноръкия бандит.
За да изчислите нивото на значимост и функцията за разпределение хи-квадрат, можете да въведете следната формула в D10:
=CHISQ.DIST.RT(D8,5)
Функцията връща стойността 0,010362338, което е нивото на значимост, че стойността хи-квадрат от 15 се дължи на грешка в извадката.
Клетка D8 съдържа стойността хи-квадрат, която е просто сумата от квадратираните разлики между наблюдаваните и очакваните стойности. Например, стойността в клетка D2 се изчислява по формулата =+(B2–C2)^2/C2, за да се върне стойността 3,333333333. Очаквано, подобни формули в диапазона D3:D7 изчисляват разликите на квадрат за другите символи на слот машини. И, о, между другото, формулата в клетка D8 е =SUM(D2:D7).
Изводът: не изглежда добре, нали? Има само 1% шанс слот машината, за която се притеснявате, действително да произведе наблюдаваните стойности поради случайност. Много подозрително.
CHISQ.DIST: Хи-квадрат разпределение
Функцията CHISQ.DIST наподобява функцията CHISQ.DIST.RT, но изчислява лявата вероятност за хи-квадратно разпределение. Функцията използва синтаксиса
=CHISQ.DIST(x,deg_freedom,кумулативно)
където x е равно на стойността хи-квадрат, deg_freedom е равно на степените на свобода, а кумулативът е превключвател, който задавате на 0 или FALSE, ако искате да изчислите плътност на вероятността и на 1 или TRUE, ако искате да изчислите кумулативна вероятност.
CHISQ.INV.RT: Вероятност за разпределение на дясно хи-квадрат
Функцията CHISQ.INV.RT връща обратната на дясната вероятност за хи-квадрат разпределение. Функцията използва синтаксиса
=CHISQ.INV.RT(вероятност,степен_свобода)
където вероятността е равна на нивото на значимост и deg_freedom е равна на степените на свобода.
За да ви покажем пример за функцията CHISQ.INV.RT, вижте фрагмента на работния лист. С шест възможни резултата на слот машината имате пет степени на свобода. Следователно, ако искате да изчислите хи-квадрат, който е еквивалентен на ниво на значимост 0,010362338, можете да въведете следната формула в клетка D12:
=CHISQ.INV.RT(D10,5)
Тази функция връща стойността 14.99996888, която е доста близка до 15. Имайте предвид, че D10 се използва като първи аргумент за вероятност, защото тази клетка съдържа нивото на значимост, изчислено от функцията CHISQ.DIST.
CHISQ.INV: Вероятност за разпределение на лявата опашка хи-квадрат
Функцията CHISQ.INV връща лявата вероятност за хи-квадрат разпределение. Функцията използва синтаксиса
=CHISQ.INV(вероятност,степен_свобода)
където вероятността е равна на нивото на значимост и deg_freedom е равна на степените на свобода.
За да изчислите стойността хи-квадрат, която е еквивалентна на ниво на значимост 0,010362338 с 5 степени на свобода, можете да въведете следната формула в клетка в работния лист:
=CHISQ.INV(0,010362338,5)
Тази функция връща стойността .562927.
CHISQ.ТЕСТ: Хи-квадрат тест
Функцията за тест хи-квадрат ви позволява да прецените дали разликите между наблюдаваните и очакваните стойности представляват случайност или грешка в извадката. Функцията използва синтаксиса
=CHISQ.TEST(действителен_обхват,очакван_обхват)
Отново позовавайки се на примера на подозрителния слот машина, можете да извършите тест хи-квадрат, като въведете следната формула в клетка D14 и след това сравните това, което наблюдавате с това, което очаквате:
=CHISQ.ТЕСТ(B2:B7,C2:C7)
Функцията връща p-стойността или вероятността, показана в клетка D14, което показва, че съществува само 1,0362 процента шанс разликите между наблюдаваните и очакваните резултати да произтичат от грешка при извадката.
Обща характеристика на хи-квадрат тест е сравнението на p-стойността — отново стойността, която функцията CHISQ.TEST връща — до ниво на значимост. Например, в случай на подозрителна слот машина, може да кажете: „Тъй като не е възможно да сме 100-процентови сигурни, ще кажем, че искаме 95-процентова вероятност, което съответства на 5-процентово ниво на значение.”
Ако p-стойността е по-малка от нивото на значимост, вие приемате, че нещо е рибно. Статистиците, които не искат да звучат толкова земно, имат друга фраза за това нещо-е-рибешко заключение: отхвърляне на нулевата хипотеза.