Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
Створення візуалізацій у R за допомогою ggplot2 може бути потужним способом дослідження та розуміння ваших даних. Одним із поширених типів візуалізації є двовимірний графік, який дозволяє перевірити зв’язок між двома змінними.
У цьому підручнику ви дізнаєтесь, як створювати біваріативні візуалізації в R за допомогою ggplot2. Цей блог буде спеціально зосереджений на тому, що було б важко виконати в LuckyTemplates, але легко зробити в R.
Зміст
Огляд
У цьому підручнику буде розглянуто три основні теми. Ви дізнаєтесь, як візуалізувати розподіл змінної за групами, а також як візуалізувати кореляції та парні зв’язки.
Попарний зв’язок стосується зв’язку між кожною парою змінних у даному наборі даних.
Для цього підручника вам потрібно завантажити пакет ggplot2 . Після цього відкрийте порожній сценарій і перенесіть дві бібліотеки: tidyverse та GGally .
GGally є розширенням ggplot2. Його створено, щоб зменшити складність поєднання геометричних об’єктів із перетвореними даними.
Різні біваріантні візуалізації в R
Двомірна візуалізація показує зв’язок між двома змінними.
Як приклад, давайте створимо візуалізацію, яка показує зв’язок між містом і шосе. Вам потрібно використати функцію ggplot () , а потім призначити відповідні дані.
Потім функція geom_point () використовується для генерації .
Візуалізації в R, що показують кореляцію
Функція ggcorr () використовується для візуалізації кореляції між змінними. Це створить теплову карту з відображеними значеннями кореляції від найнижчого до найвищого. Ви можете покращити візуалізацію, додавши аргумент, який відображатиме мітки.
Візуалізації в R, що показують парний зв’язок
Для попарного графіка вам потрібно використовувати функцію ggpairs () .
Оскільки фрейм даних у цьому прикладі містить великий набір даних, його спочатку потрібно відфільтрувати, щоб відображати лише числові значення, інакше результати відображатимуть помилку.
Щоб відфільтрувати дані, використовуйте оператор каналу та функцію select_if () .
На вкладці «Графіки» ви можете побачити попарну візуалізацію, згенеровану кодом. Ви також можете побачити графік і значення кореляції між кожною змінною.
Інша річ, яку ви можете робити з попарними графіками, це додавати додаткові елементи для посилення візуалізації. Ви можете додати іншу змінну та змінити колір даних.
У цьому випадку до коду додається колонка приводу, а для зміни її кольору використовується функція естетичного відображення.
Коли ви запустите код, ви побачите, що графік показує діаграми розсіювання та значення кореляції за частотою. Діагональ також показує відповідно до кожного диска.
Висновок
Якщо ви хочете створити надійні та статистично підкріплені візуалізації, такі як гістограми, діаграми розсіювання та коробкові діаграми, рекомендується використовувати ggplot2 із GGally.
Мова програмування R разом із різними пакетами візуалізації, такими як ggplot2, дозволяє користувачам створювати візуалізації, які показують зв’язок і кореляцію між змінними.
GGally розширює ggplot2, доповнюючи кілька функцій, які зменшують складність. Якщо ви спробуєте створити двоваріантну та багатоваріантну візуалізацію в LuckyTemplates, це стане проблемою. Однак у мові програмування R вам потрібно написати лише один рядок коду, щоб отримати необхідний статистичний графік.
Все найкраще,
Джордж Маунт
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.