Деякі статистичні показники в Excel можуть бути дуже заплутаними, але функції хі-квадрат дійсно практичні. Навіть якщо ви збираєтеся використовувати лише одну з функцій хі-квадрат, прочитайте описи всіх трьох функцій. Розглянуті як набір статистичних інструментів, функції мають набагато більше сенсу.
CHISQ.DIST.RT: розподіл хі-квадрат
Функція CHISQ.DIST.RT, яка обчислює правосторонню ймовірність розподілу хі-квадрат, обчислює рівень значущості за допомогою значення хі-квадрат і ступенів свободи. Значення хі-квадрат дорівнює сумі квадратів стандартизованих балів. Функція використовує синтаксис
=CHISQ.DIST.RT( x , deg_freedom )
де x дорівнює значенню хі-квадрат, а deg_freedom дорівнює ступеням свободи.
Як приклад того, як все це працює, припустімо, що ви з невеликою підозрою ставитеся до якогось ігрового автомата, який показує одну з шести картинок: діаманти, зірки, ковбойські чоботи, вишні, апельсини або горщики із золотом. З шістьма можливостями ви можете очікувати, що у великій вибірці кожна з шести можливостей з’явиться приблизно в шосту частину часу.
Скажімо, розмір вибірки становить 180, наприклад. У цьому випадку ви можете очікувати, що кожна можливість ігрового автомата з’явиться 30 разів, тому що 180/6 дорівнює 30. Якщо ви побудували фрагмент аркуша, подібний до цього, ви можете проаналізувати однорукого бандита.
Щоб обчислити рівень значущості та функцію розподілу хі-квадрат, ви можете ввести таку формулу в D10:
=CHISQ.DIST.RT(D8,5)
Функція повертає значення 0,010362338, що є рівнем значущості, що значення хі-квадрат 15 спричинено помилкою вибірки.
У клітинці D8 міститься значення хі-квадрат, яке є просто сумою квадратів різниць між спостережуваними та очікуваними значеннями. Наприклад, значення в клітинці D2 обчислюється за формулою =+(B2–C2)^2/C2, щоб повернути значення 3,333333333. Передбачувано, подібні формули в діапазоні D3:D7 обчислюють квадрат різниці для інших символів ігрових автоматів. І, до речі, формула в комірці D8 =SUM(D2:D7).
Суть: це виглядає погано, чи не так? Є лише 1-відсотковий шанс, що ігровий автомат, про який ви хвилюєтеся, може справді видавати спостережувані значення через випадковість. Дуже підозріло.
CHISQ.DIST: розподіл хі-квадрат
Функція CHISQ.DIST нагадує функцію CHISQ.DIST.RT, але обчислює лівобічний імовірність розподілу хі-квадрат. Функція використовує синтаксис
=CHISQ.DIST(x,deg_freedom,кумулятивний)
де x дорівнює значенню хі-квадрат, deg_freedom дорівнює ступеням свободи, а кумулятивним є перемикач, який ви встановлюєте в 0 або FALSE, якщо ви хочете обчислити щільність ймовірності, і в 1 або TRUE, якщо ви хочете обчислити кумулятивну ймовірність.
CHISQ.INV.RT: ймовірність правобічного розподілу хі-квадрат
Функція CHISQ.INV.RT повертає обернену правосторонню ймовірність розподілу хі-квадрат. Функція використовує синтаксис
=CHISQ.INV.RT(ймовірність, ступінь_свободи)
де ймовірність дорівнює рівню значущості, а deg_freedom дорівнює ступеням свободи.
Щоб показати вам приклад функції CHISQ.INV.RT, зверніться до фрагмента аркуша. Маючи шість можливих результатів на ігровому автоматі, у вас є п’ять ступенів свободи. Тому, якщо ви хочете обчислити хі-квадрат, еквівалентний рівню значущості 0,010362338, ви можете ввести таку формулу в клітинку D12:
=CHISQ.INV.RT(D10,5)
Ця функція повертає значення 14,99996888, яке дуже близько до 15. Зверніть увагу, що D10 використовується як перший аргумент ймовірності, оскільки ця клітинка містить рівень значущості, обчислений функцією CHISQ.DIST.
CHISQ.INV: ймовірність лівобічного розподілу хі-квадрат
Функція CHISQ.INV повертає лівосторонню ймовірність розподілу хі-квадрат. Функція використовує синтаксис
=CHISQ.INV(ймовірність, ступінь_свободи)
де ймовірність дорівнює рівню значущості, а deg_freedom дорівнює ступеням свободи.
Щоб обчислити значення хі-квадрат, яке еквівалентно рівню значущості 0,010362338 з 5 ступенями свободи, ви можете ввести таку формулу в клітинку на робочому аркуші:
=CHISQ.INV(0,010362338,5)
Ця функція повертає значення .562927.
CHISQ.TEST: Тест хі-квадрат
Функція тесту хі-квадрат дозволяє оцінити, чи є відмінності між спостережуваними та очікуваними значеннями випадковістю чи помилкою вибірки. Функція використовує синтаксис
=CHISQ.TEST(фактичний_діапазон, очікуваний_діапазон)
Знову звертаючись до прикладу підозрілого ігрового автомата, ви можете виконати тест хі-квадрат, ввівши таку формулу в клітинку D14, а потім порівнявши те, що ви спостерігаєте, з тим, що ви очікуєте:
=CHISQ.TEST(B2:B7,C2:C7)
Функція повертає p-значення або ймовірність, показану в клітинці D14, що вказує на те, що існує лише 1,0362-відсотковий шанс, що відмінності між спостережуваними та очікуваними результатами випливають із помилки вибірки.
Загальною ознакою тесту хі-квадрат є порівняння значення p — знову ж таки значення, яке повертає функція CHISQ.TEST — з рівнем значущості. Наприклад, у випадку з підозрілим ігровим автоматом ви можете сказати: «Оскільки неможливо бути впевненим на 100 відсотків, ми скажемо, що нам потрібна 95-відсоткова ймовірність, що відповідає 5-відсотковому рівню значення».
Якщо p-значення менше рівня значущості, ви припускаєте, що щось небезпечне. Статистики, не бажаючи звучати так приземлено, мають іншу фразу для цього «щось-це-рибного» висновку: відкидання нульової гіпотези.