Труба в R: підключення функцій за допомогою Dplyr
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
Графіки паралельних координат — це корисний інструмент візуалізації, який використовується для відображення зв’язків між декількома змінними, що мають однакові числові дані. У LuckyTemplates ці сюжети створюються за допомогою дуже простого коду Python, який можна використовувати та легко створювати та стилізувати.
У сьогоднішньому блозі ми навчимося створювати багатовимірні або паралельні координатні графіки за допомогою . Ми крок за кроком пройдемо цей процес, від підготовки даних до налаштування графіка для кращої читабельності. Ви можете переглянути повне відео цього підручника внизу цього блогу .
Зміст
Паралельні графіки координат у Python: зразок 1
Це наша перша ділянка. Він показує наші три змінні — змінну A, B і C, а також два рядки, що представляють елементи 1 і 2.
Це означає, що ми маємо два набори даних, один для елемента 1, а інший для елемента 2. І для кожного набору даних у нас є три змінні.
Давайте подивимося на дані, щоб краще зрозуміти, як був структурований сюжет.
Почніть із виділення графіка. Натисніть Дані.
Повинна з'явитися таблиця з дуже простими даними. Він був створений за допомогою параметра вставки таблиці. Ми бачимо, що в стовпцях є змінні A, B і C для кожного елемента, які розділені в кожному рядку.
У нас є прості дані, але ми можемо перетворити їх на щось дуже промовисте. Наприклад, на нашому графіку ми можемо визначити, що зв’язок між даними досить «низький».
Для ілюстрації ми можемо порівняти цей графік із нашими даними. Змінна B в пункті 1 дорівнює 100 і 115 в пункті 2, як показано на графіку.
Ми також можемо визначити, як пов’язані елементи та змінні. Наприклад, ми можемо легко побачити, що змінна A нижча за B, а C є найнижчою серед трьох.
Код Python Plot
Давайте тепер перейдемо до коду, який використовується для фактичного сюжету.
Почніть з вибору візуалу Python на панелі .
Виділіть наш перший графік, щоб відкрити .
Спочатку ми імпортуємо matplotlib.pyplot і зберігаємо його як змінну plt.
Потім ми запроваджуємо функції pandas.plotting . Pandas служить бібліотекою обробки даних у LuckyTemplates. Він в основному використовується для обробки даних, але він також має функції побудови.
Давайте імпортуємо parallel_coordinates з pandas.plotting . Parallel_coordinates буде основною функцією для створення графіка.
Створення сюжету на Python
У рядку 13 ми документуємо те, що збираємося робити, написавши # make a plot.
Ми використовуємо parallel_coordinates і передаємо набір даних.
У рядку 3 ми бачимо, що набір даних створено за допомогою функції pandas.DataFrame () . Потім ми додаємо елемент, змінну A, змінну B і змінну C, які потім відображаються в нашому списку значень .
У рядку 4 набір даних дедуплікується за допомогою dataset.drop_duplicates ().
Ми можемо перейти до панелі візуалізацій , щоб побачити додані значення .
Видалення будь-якого з цих значень вплине на наші візуальні ефекти. Наприклад, якщо ми видалимо змінну C, координати зміняться відповідно, показуючи нам, як працюють значення .
Давайте повернемо нашу змінну C , встановивши біля неї прапорець у розділі «Дані» на панелі «Поля» .
Далі передайте функцію parallel_coordinates , яка приймає кілька різних аргументів. У нашому випадку він приймає набір даних і елемент, який надасть тип і розмірність із нашого набору даних.
Якщо ми видалимо Item із нашої функції та запустимо її, візуал не працюватиме.
Ми отримаємо помилку сценарію Python про те, що у функції parallel_coordinates () відсутній 1 обов’язковий позиційний аргумент, яким є class_column .
Отже, давайте додамо Item назад. Оскільки він є позиційним, нам не потрібно писати координати класу. Ми можемо запустити код після завершення.
Показ сюжету на Python
Наступним кроком є показ сюжету, тому в рядку 16 ми документуємо те, що збираємося робити, написавши # показати сюжет.
Згадайте, що раніше ми імпортували matplotlib.pyplot і зберегли його як plt. Ми зробили це, тому що нам потрібна функція plt.show() , щоб показати наш графік.
Паралельні графіки координат у Python: зразок 2
Наш другий графік — це набір даних райдужної оболонки , що показує petal_length, petal_width, sepal_length і sepal_width. Він має трохи більше стилю порівняно з першим графіком.
Цей набір даних створено за допомогою коду Python.
Щоб переглянути наші дані, натисніть Transform data і перейдіть до iris_dataset.
Набір даних містить стовпці для розмірів — довжина чашолистка , ширина чашолистка , довжина та ширина пелюстки . У ньому також є колонка для типу виду .
Код набору даних Python
Наші дані було легко введено за допомогою коду Python. Перейдіть до джерела , щоб показати сценарій Python.
Наш код Python має лише два рядки. У першому рядку ми імпортували seaborn і зберегли його як змінну sns . Ми назвали наш набір даних iris_dataset і використали змінну sns для завантаження набору даних за допомогою функції sns.load_dataset('iris') .
Натисніть OK , щоб отримати дані, які ми бачили вище. Переміщайтеся між даними, і коли це буде зроблено, ми можемо закрити набір даних, перейшовши до Close & Apply > Close .
Діаграми стилів у Python
Щоб відкрити редактор сценаріїв Python для нашого більш стилізованого графіка, клацніть наш другий графік.
Ми починаємо з імпорту matplotlib.pyplot як plt.
Потім ми використовуємо функцію plt.style.use ('dark_background') , щоб стилізувати візуал.
Ми можемо легко налаштувати фон відповідно до бажаного стилю за допомогою посилання на таблицю стилів matplotlib . У нашому випадку ми використали темний фон.
Давайте також спробуємо використати ggplot , який є поширеним стилем.
Якщо ми запустимо його, це дасть нам візуальний вигляд, який виглядає так.
Потім завантажте функцію pandas для графіка, імпортувавши parallel_coordinates із pandas.plotting.
Щоб створити графік, ми вводимо набір даних і встановлюємо наш вид як клас .
Порівняно з нашим першим графіком, ми додаємо додатковий параметр, який є кольоровою картою , щоб отримати різні кольори. Передайте це за допомогою змінної matplotlib, plt.get_cmap.
Існує багато змінних кольору matplotlib, які можна вибрати в довідці Colormap matplotlib .
Наприклад, зараз ми використовуємо набір 2 із якісних кольорових карт, але ми також можемо змінити це на інші кольори, наприклад hsv із циклічних кольорових карт.
Натисніть «Запустити», щоб отримати графік, який виглядає ось так.
Hsv виглядає не дуже добре на наших даних, але ми можемо пограти, доки не знайдемо найбільш підходящу карту кольорів для нашої ділянки.
Висновок
У цьому підручнику ми розглянули основи створення паралельних координатних графіків у Python. Ми пройшли процес підготовки даних, створення діаграми та налаштування діаграми для кращої читабельності.
Графіки паралельних координат є потужним інструментом для візуалізації багатовимірних даних і можуть використовуватися в різних сферах, включаючи фінанси, інженерію та машинне навчання. Тепер, коли ми знаємо, як створювати графіки паралельних координат у , ми можемо почати використовувати їх для кращого розуміння та візуалізації наших власних даних.
Все найкраще,
Гелім Голланд
У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.
RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.
Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!
Шпаргалка формул Excel: Посібник середнього рівня
Календарна таблиця LuckyTemplates: що це таке та як ним користуватися
Дізнайтеся, як інсталювати мову програмування Python у LuckyTemplates і як використовувати її інструменти для написання кодів і відображення візуальних елементів.
Дізнайтеся, як обчислювати динамічну маржу прибутку за допомогою LuckyTemplates і як ви можете отримати більше інформації, глибше досліджуючи результати.
Дізнайтеся, як правильно сортувати поля зі стовпців розширеної таблиці дат. Це хороша стратегія для складних полів.
У цій статті я поясню, як знайти найпопулярніші продукти для регіону за допомогою обчислень DAX у LuckyTemplates, включаючи функції TOPN і CALCULATE.
Дізнайтеся, як використовувати вимірювання сміття для позначок низької потужності, які ви хочете ефективно включити у свою модель даних.