Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
У цьому підручнику ви дізнаєтесь, як додати інференційну статистику до звіту LuckyTemplates. Зокрема, ви дізнаєтеся, як виконувати t-тест за допомогою .
Т -критерій дозволяє статистично порівняти середнє значення між двома групами, а потім зробити висновок, чи є між ними значна різниця.
Якщо ви не знайомі зі статистичними даними, рекомендуємо переглянути та вивчити її, перш ніж продовжити цей посібник. Це допоможе вам зрозуміти мету цього підручника та важливість виконання статистичних тестів.
Зміст
Виконайте t-тест у RStudio
Відкрийте заготовку.
У цьому прикладі використовується набір даних про житло та пакет мітли . Цей пакет бере t- і перетворює їх у табличний формат.
Щоб виконати t-тест, скористайтеся функцією t.test () . У круглих дужках напишіть дві групи, які потрібно порівняти, розділивши їх знаком тильда ( ~ ). Цей знак означає «до» в RStudio.
У цьому прикладі t-критерій порівнює середнє значення ціни для бажаної області. Потім він дає вам знати, чи дорівнюють ці середні значення нулю чи не дорівнюють.
Коли ви запустите код, ви побачите результати t-тесту. У цьому випадку результати показують, що існує значна різниця між середнім значенням ціни та бажаною територією.
Однак ви бачите, що довірчий інтервал дає негативні результати. Рекомендується перетворити їх на додатні числа, щоб їх було легше інтерпретувати. Ви можете зробити це, перевернувши .
Вам потрібно використовувати функцію fct_rev ( ) пакету forcats. Це спеціальний пакет, який спеціально працює з факторами або категоріальними змінними. Коли ви запустите код, ви побачите, що знаки тепер змінені.
У цьому прикладі результати показують, що житло з кондиціонером оцінюється приблизно на 15 000–26 000 доларів більше.
Форматувати результати
Виконання t-тесту в RStudio просте. Однак часто результати важко прочитати через спосіб їх представлення.
Ви можете змінити формат результату за допомогою функції tidy ( ) . Коли ви запустите код, ви побачите, що кожне значення тепер розміщено в таблиці з окремими стовпцями. Вони також належним чином позначені.
Тепер це полегшує розуміння результатів p-значення та довірчого інтервалу.
Функція tidy ( ) працює з більшістю статистичних тестів у RStudio. Ви можете використовувати це, коли хочете, щоб ваші результати були в більш презентабельному форматі.
Висновок
Результати, зібрані з описової чи інференційної статистики, є чудовими елементами для додавання до звіту LuckyTemplates. Вони додають глибини та ще більше обґрунтовують подані дані.
Т-тест є одним із найбільш часто використовуваних статистичних тестів, оскільки його легко виконати. Його результати легко інтерпретувати, навіть маючи базові або початківці знання статистики.
Все найкраще,
Джордж Маунт
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.