Створення біваріантних візуалізацій у R за допомогою Ggplot2

Створення візуалізацій у R за допомогою ggplot2 може бути потужним способом дослідження та розуміння ваших даних. Одним із поширених типів візуалізації є двовимірний графік, який дозволяє перевірити зв’язок між двома змінними.

У цьому підручнику ви дізнаєтесь, як створювати біваріативні візуалізації в R за допомогою ggplot2. Цей блог буде спеціально зосереджений на тому, що було б важко виконати в LuckyTemplates, але легко зробити в R.

Зміст

Огляд

У цьому підручнику буде розглянуто три основні теми. Ви дізнаєтесь, як візуалізувати розподіл змінної за групами, а також як візуалізувати кореляції та парні зв’язки.

Попарний зв’язок стосується зв’язку між кожною парою змінних у даному наборі даних.

Для цього підручника вам потрібно завантажити пакет ggplot2 . Після цього відкрийте порожній сценарій і перенесіть дві бібліотеки: tidyverse та GGally .

Створення біваріантних візуалізацій у R за допомогою Ggplot2

GGally є розширенням ggplot2. Його створено, щоб зменшити складність поєднання геометричних об’єктів із перетвореними даними.

Різні біваріантні візуалізації в R

Двомірна візуалізація показує зв’язок між двома змінними.

Як приклад, давайте створимо візуалізацію, яка показує зв’язок між містом і шосе. Вам потрібно використати функцію ggplot () , а потім призначити відповідні дані.

Потім функція geom_point () використовується для генерації .

Створення біваріантних візуалізацій у R за допомогою Ggplot2

Візуалізації в R, що показують кореляцію

Функція ggcorr () використовується для візуалізації кореляції між змінними. Це створить теплову карту з відображеними значеннями кореляції від найнижчого до найвищого. Ви можете покращити візуалізацію, додавши аргумент, який відображатиме мітки.

Створення біваріантних візуалізацій у R за допомогою Ggplot2

Візуалізації в R, що показують парний зв’язок

Для попарного графіка вам потрібно використовувати функцію ggpairs () .

Оскільки фрейм даних у цьому прикладі містить великий набір даних, його спочатку потрібно відфільтрувати, щоб відображати лише числові значення, інакше результати відображатимуть помилку.

Щоб відфільтрувати дані, використовуйте оператор каналу та функцію select_if () .

Створення біваріантних візуалізацій у R за допомогою Ggplot2

На вкладці «Графіки» ви можете побачити попарну візуалізацію, згенеровану кодом. Ви також можете побачити графік і значення кореляції між кожною змінною.

Інша річ, яку ви можете робити з попарними графіками, це додавати додаткові елементи для посилення візуалізації. Ви можете додати іншу змінну та змінити колір даних.

У цьому випадку до коду додається колонка приводу, а для зміни її кольору використовується функція естетичного відображення.

Створення біваріантних візуалізацій у R за допомогою Ggplot2

Коли ви запустите код, ви побачите, що графік показує діаграми розсіювання та значення кореляції за частотою. Діагональ також показує відповідно до кожного диска.

Створення біваріантних візуалізацій у R за допомогою Ggplot2

Висновок

Якщо ви хочете створити надійні та статистично підкріплені візуалізації, такі як гістограми, діаграми розсіювання та коробкові діаграми, рекомендується використовувати ggplot2 із GGally.

Мова програмування R разом із різними пакетами візуалізації, такими як ggplot2, дозволяє користувачам створювати візуалізації, які показують зв’язок і кореляцію між змінними.

GGally розширює ggplot2, доповнюючи кілька функцій, які зменшують складність. Якщо ви спробуєте створити двоваріантну та багатоваріантну візуалізацію в LuckyTemplates, це стане проблемою. Однак у мові програмування R вам потрібно написати лише один рядок коду, щоб отримати необхідний статистичний графік.

Все найкраще,

Джордж Маунт


Труба в R: підключення функцій за допомогою Dplyr

Труба в R: підключення функцій за допомогою Dplyr

У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.

Вилучення тем і зображень LuckyTemplates із PBIX

Вилучення тем і зображень LuckyTemplates із PBIX

Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Python у LuckyTemplates: як встановити та налаштувати

Python у LuckyTemplates: як встановити та налаштувати

Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.

Розрахунок динамічної норми прибутку – легкий аналіз LuckyTemplates за допомогою DAX

Розрахунок динамічної норми прибутку – легкий аналіз LuckyTemplates за допомогою DAX

Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.

Сортування стовпців таблиці дат у LuckyTemplates

Сортування стовпців таблиці дат у LuckyTemplates

Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.

Знайдіть свої найкращі продукти для кожного регіону в LuckyTemplates за допомогою DAX

Знайдіть свої найкращі продукти для кожного регіону в LuckyTemplates за допомогою DAX

У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.

Вимір сміття: що це таке і чому це щось інше, але не сміття

Вимір сміття: що це таке і чому це щось інше, але не сміття

Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.