Змініть формати дати за допомогою редактора Power Query
У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.
Працюючи з набором даних, який складається з кількох змінних, найкраще мати можливість зрозуміти, як вони відрізняються та взаємодіють одна з одною. У цьому посібнику я збираюся продемонструвати, як можна використовувати функцію Seaborn у Python для візуалізації альтернатив розподілу змінної. Ви можете переглянути повне відео цього підручника внизу цього блогу.
Зміст
Використання функції Seaborn у Python
Я продемонструю це на наборі даних MPG, який доступний у Seaborn. Отже, давайте продовжимо імпорт будь-яких пакетів, які нам потрібні, а також будь-яких даних, які нам потрібні. Ми розглянемо тут розподіл змінної MPG і те, як вони змінюються. Двома поширеними способами зробити це є гістограма та коробковий графік .
Тому я збираюся використовувати функцію displot (DIS для розподілу). Потім мені потрібно вказати, який це набір даних і яку змінну ми збираємося помістити на вісь X. І разом з цим у нас є розподіл.
Це дуже добре. Це дуже легко побачити весь розподіл і форму. Хоча ця візуалізація розподілу має кілька недоліків. Одна з них полягає в тому, що кількість бункерів, які ми використовуємо, є довільною. Інша справа, що ми не обов’язково можемо миттєво знати, яке середнє значення змінної.
Приємна річ у Seaborn полягає в тому, що як тільки я встановлю, яку змінну я хочу, де та який набір даних я використовую, це справді просто підключи та запусти, створюючи нову візуалізацію. Тепер ми перейдемо до коробки. Boxplot не використовує контейнери.
Ідея полягає в тому, що ми можемо дуже чітко бачити значення квартиля, зокрема медіану, і ми бачимо інші значення квартиля. Ми бачимо, що є викид, і це дуже точний графік. Проблема полягає в тому, що він точний з речами, які зазвичай не цікавлять багатьох бізнес-користувачів.
Отже, людям, які не займаються статистикою, цей сюжет трохи складно отримати значну цінність. І знову ж таки, це збирає дані, тому ми втрачаємо багато деталей. Важко точно знати, як це виглядає. Ми бачимо, що є викид. Ми бачимо, що більшість значень тут. Гістограма дає нам більш інтуїтивний спосіб подивитися на це.
Це обидва гарні сюжети. Вони обидва мають свої цілі. Давайте розглянемо деякі альтернативи використання Seaborn для візуалізації. Ми збираємося дотримуватися MPG для розподілу цієї змінної.
Подібно до прямокутної діаграми, тут можна побачити, що медіана чітко позначена. Ми також бачимо діапазон квартилів і можемо краще зрозуміти, яким є загальний розподіл. Це теж щось на зразок гістограми. Це називається діаграмою оцінки щільності ядра або графіком KDE. Це плавна версія гістограми. Ми не використовуємо довільне групування. Тут все згладжено в суцільний ряд.
Це свого роду гібрид цих двох підходів і справді усуває деякі недоліки. Однак, залежно від вашої аудиторії, їм може бути важко дивитися на це. Можливо, вони не звикли до цього, але це має деякі переваги перед традиційними підходами.
У такому підході ми більше не збираємо дані. Наноситься кожна окрема точка. Для цього потрібні елементи діаграми розсіювання, чи не так? Якщо ви думаєте про діаграму розсіювання, ми малюємо кожну окрему точку за координатами X і Y.
Нарешті, у нас є stripplot . Те, що ми робимо тут, це беремо цей розподіл і ми випадково розкидаємо. Це випадковий процес. Ми більше не намагаємося створити таку форму розподілу. Проблема полягає в тому, що всі ці групи стикаються одна з одною, тому це може бути недобре, залежно від того, що ви намагаєтеся зробити. Можливо, ви захочете розфарбувати їх за групою чи щось подібне, тож для цього є можливість.
Ми можемо змінити джиттер на 0,25 і побачити, що зі збільшенням джиттера ці точки розкидаються трохи більше.
Однак кожного разу, коли я запускаю їх, вони виглядатимуть дещо інакше. Отже, якщо ви хочете позбутися цього і робити його однаковим кожного разу, ви можете імпортувати numpy як np . Це те, що називається встановленням випадкового початкового числа.
Кожного разу, коли я запускаю щось пов’язане з випадковими числами, воно використовуватиме ті самі випадкові числа. Речі не змінюються випадково, коли ви повторюєте його. Це може бути корисним для будь-якого виду моделювання, яке ви робите, що також часто трапляється в науці даних і аналітиці з цією візуалізацією. Тож тепер кожного разу, коли я запускаю цей сюжет, ми матимемо такий самий вигляд.
Я також можу додати сюди початок Y, і тепер ми бачимо, що ми створюємо двоваріантний розподіл. Ми беремо розподіл пробігу та сегментуємо його за походженням.
Висновок
Це альтернативи візуалізації розподілу однієї змінної. Всі вони мають свої плюси і мінуси. Це не означає, що ніколи не використовуйте коробкову діаграму чи гістограму, але це просто означає, що ось деякі інші варіанти, залежно від того, що ви намагаєтеся показати.
Їх усіх так само легко створити, як і будь-які інші, коли ми використовуємо функцію Seaborn у Python. Якщо ви хочете дізнатися більше про , перегляньте посилання нижче.
Все найкраще!
У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.
Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.
Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.
Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.
У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.
У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.
Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.
Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.
У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.
У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.