Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
У цьому посібнику ви дізнаєтесь, як створити візуалізацію діаграми розсіювання за допомогою сценарію R. Це базується на звіті, поданому для . Ви можете переглянути повне відео цього підручника внизу цього блогу.
Зміст
Що таке діаграма розсіювання
Точкова діаграма – це тип візуалізації даних, який використовується для відображення зв’язку між двома безперервними змінними. Це графік, на якому кожна точка даних представлена крапкою, а положення точки на горизонтальній і вертикальній осях відповідає значенням двох змінних.
Діаграма розсіювання є корисним інструментом для виявлення закономірностей і тенденцій у даних. Додавання цього візуального зображення до ваших звітів LuckyTemplates додасть більше розуміння даних, які ви представляєте. І до кінця цього підручника ви зможете створити діаграму розсіювання R, яка виглядає так:
Це обговорення розбивається на чотири етапи. Спочатку ви дізнаєтесь, як створити базову діаграму розсіювання. Потім ви застосуєте гладку лінію, щоб показати тенденцію даних на графіку. Третій і четвертий кроки в основному зосереджені на темах і змінах форматування, які можна застосувати до діаграми розсіювання.
Набір даних, використаний у цьому прикладі, є таблицею, що містить ім’я клієнта, тривалість, заробіток і погодинну ставку.
Створіть базову точкову діаграму у візуальному сценарії R
Відкрий свій .
Для початку вам потрібно мати три: tidyverse , ggthemes і ggpubr .
Якщо у вас їх не встановлено, скористайтеся функцією install.packages() . Після цього вам потрібно використати функцію бібліотеки() , щоб завантажити їх у середовище R.
Скопіюйте бібліотечні коди R і перейдіть до LuckyTemplates. Відкрийте редактор сценаріїв R і вставте код. Ви можете продовжувати створювати код R там.
Потім скористайтеся функцією ggplot() , щоб створити точкову діаграму. Вам потрібно спочатку вказати набір даних, який використовуватиметься в діаграмі, отже, команда бази даних %>% . У цьому випадку a використовується замість функції фільтра.
Щоб указати набір даних, потрібно використати аргумент aes() , а потім указати вісь x та y. В даному випадку це години тривалості та заробіток відповідно. Потім скористайтеся функцією geom_point() , щоб показати точки на діаграмі.
Крім того, ви можете змінити форматування вашої точкової діаграми за допомогою різноманітних функцій, наприклад «колір» або «форма». Якщо ви хочете застосувати до діаграми динамічний вигляд, ви можете встановити певне значення кольору та розміру точки, як показано в прикладі.
Коли ви запустите код, ви отримаєте цю діаграму розсіювання в LuckyTemplates. Зверніть увагу, що ви отримуєте більші та темніші кола, коли їх еквівалентне значення погодинної ставки вище.
Додайте плавну лінію до діаграми
На цьому наступному кроці ви дізнаєтеся, як додати плавну лінію до діаграми. Плавна лінія – це лінія, яка підігнана до даних, щоб допомогти вам дослідити потенційні зв’язки між двома змінними.
Щоб додати гладку лінію, використовуйте функцію geom_smooth() .
Коли ви запускаєте сценарій R, точкова діаграма виглядатиме так. Плавна лінія тепер показує тенденцію даних із довірчим інтервалом 95%.
Ви можете змінити масштаб осей x і y за допомогою функцій scale_x_continuous() і scale_y_continuous() .
У цьому випадку вісь y перетворюється на логарифмічний масштаб, тоді як вісь x залишається незмінною.
Коли ви запускаєте код R, результати тепер відображатимуться в логарифмічному вигляді. Змінюється і плавна лінія.
Крім того, оскільки діаграма автоматично розміщує мітки на осях, ви можете видалити їх за допомогою функції labs() .
Відформатуйте вигляд діаграми розсіювання R
Після того як ви створили основну форму вашої діаграми розсіювання, наступним кроком є налаштування її теми та зовнішнього вигляду.
Використовуйте функцію theme() , щоб відформатувати точкову діаграму в редакторі сценаріїв R. І всередині цієї функції ви можете додати інші аргументи для налаштування.
Panel.grid.major ( ) і panel.grid.minor() дозволяють редагувати тип лінії та колір ліній сітки діаграми. Якщо ви хочете видалити лінію сітки, скористайтеся функцією element_blank() .
Panel.background і plot.background видаляються, щоб зробити точкову діаграму прозорою . Це дозволяє гнучко розміщувати діаграму в будь-якому місці звіту. Якщо ви хочете видалити легенду на діаграмі, установіть для функції legend.position значення «немає».
Ви також можете відформатувати рядок і текст осей x і y. Ви можете зробити лінію товщою чи тоншою, а текст – більшим чи меншим.
Якщо ви хочете дізнатися про інші функції форматування, які можна використовувати у вашій діаграмі, ви можете перейти до розділу довідки в RStudio . Введіть «тема» в рядку пошуку, і з’явиться список функцій форматування.
Існують різні функції форматування, які можна використовувати в R. Не забувайте використовувати те, що вам потрібно, і не перестарайтеся.
Налаштуйте колір і діапазон точок даних
В останньому розділі цього підручника ви дізнаєтесь, як відформатувати колірну шкалу та діапазон розмірів точок на діаграмі розсіювання.
Функція scale_colour_viridis_b( ) надає кольорові карти, які перцепційно однакові як у кольоровому, так і в чорно-білому відтінку. Вони також призначені для сприйняття глядачами з типовими формами дальтонізму.
Якщо ви здійсните пошук у розділі довідки в RStudio, ви побачите різні аргументи, які можна використовувати для форматування діаграм. Ви можете перемикатися між параметрами, щоб дізнатися, який результат найкраще відповідає вашому звіту.
Наприклад, функція scale_size_continuous() масштабує розмір точок або форм на графіку відповідно до постійної змінної. Це дозволяє вказати мінімальний і максимальний розміри точки, які слід використовувати на графіку.
У цьому випадку 4 — це мінімум, а 17 — максимум.
Ось так виглядає остаточна діаграма розсіювання R.
Висновок
У цьому підручнику ви дізналися, як створити точкову діаграму R у LuckyTemplates. Точкова діаграма — це тип візуалізації даних, який використовується для відображення зв’язку між двома безперервними змінними. У LuckyTemplates ви можете створити точкову діаграму за допомогою пакета ggplot і візуалу R Script.
Точкові діаграми є корисними інструментами для візуалізації та виявлення закономірностей і тенденцій у даних. Вони також корисні для виявлення викидів або аномалій.
Загалом, створення діаграми розсіювання в LuckyTemplates за допомогою R є простим процесом і дозволяє скористатися перевагами потужних можливостей візуалізації даних пакета ggplot.
Все найкраще,
Хосейн Сейєдага
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.