Що таке Power Query та мова M: детальний огляд
Цей підручник містить огляд редактора Power Query і мови M на робочому столі LuckyTemplates.
Одне з найпоширеніших запитань, з якими ви зіткнетеся як аналітик даних, це те, який найкращий спосіб дослідити певний набір даних. Це важливий момент, перш за все, якщо ви хочете об’єднати всі дані у звіті, який вам або вашій команді буде легко інтерпретувати. У цьому підручнику я збираюся продемонструвати, як ви можете ефективно досліджувати набори даних у Pandas за допомогою ProfileReport(). Ви можете переглянути повне відео цього підручника внизу цього блогу.
Коли вам надають набір даних, що ви робите? Як ви досліджуєте набір даних? Перш за все, якщо ви хочете об’єднати все це в зручний для читання звіт для себе, для колег тощо, вам потрібно враховувати багато речей.
По-перше, ви думаєте про те, що це за змінні, тому що це вплине на те, як ви їх аналізуєте та як до них ставитеся. Дані означають те, що дано. Отже, бракує лише тих даних, яких у нас немає. Інша справа — візуалізувати ці відносини. Як вони виглядають? Ми хочемо використовувати цю силу візуалізації на ранній стадії та часто.
Це багато взаємопов’язаних складних питань. Хороша річ у тому, що доступна ця функція звіту про профілювання, яка дасть нам ці відповіді. Отже, давайте подивимося на все це в Python.
Зміст
Досліджуйте набори даних у Pandas за допомогою функції ProfileReport().
Спочатку ми завантажимо набір даних.
Потім з pandas_profiling ми збираємося імпортувати цю штуку під назвою звіт профілю. Тепер, якщо ви отримуєте тут помилку, можливо, вам потрібно його встановити. Я використовую Anaconda. Я пропоную вам також використати це. Давайте запустимо це, а потім роздрукуємо.
Так ось воно. У нас є огляд . Це дає нам розподіл типів змінних. У нас є статистика набору даних. Ми бачимо кількість стовпців рядків і так далі і так далі. Приємно в цьому звіті те, що він схожий на єдиний магазин, а також виглядає дуже гарно. Він має дуже привабливу презентацію.
Ми прокручуємо тут і маємо. Ми отримуємо візуалізацію, і ми можемо перемикати більше деталей про змінну. У нас є прапори, які вказують на речі, які можуть бути трохи незвичними. Ми також маємо ці сповіщення та багато інших функцій, які нададуть нам більше інформації. І це для кожної окремої змінної.
Продовжуючи прокручувати вниз, ми знайдемо Interactions, де створено точкові діаграми для візуалізації даних.
А потім у нас є кореляції , які підсумовують зв’язок.
Далі є, які дуже важливі. Як ви бачите, у нас є деякі відсутні значення, і ми хочемо знати, чому. Ці візуалізації покликані допомогти нам у цьому. Ми можемо клацати кожне зображення й аналізувати дані.
Нарешті, у нас є Зразок. Ми могли б отримати це багатьма способами, але все, що це робить, це лише друк перших кількох рядків, що корисно знати.
Висновок
Ось як ви досліджуєте набори даних у Pandas за допомогою функції ProfileReport(). Є багато способів розділити дані. Подумайте про всі комбінації перестановок даних. Це не зможе зробити все за вас, але це справді хороший початок.
Коли ми досліджуємо дані, це дійсно ітеративний процес. Немає одноразової чарівної таблетки, як би нам цього не хотілося. Проте ProfilerReport() справді чудовий інструмент. Ми отримуємо багато інформації та лише один рядок коду. Це безкоштовний інструмент, тому я сподіваюся, що ви зможете використовувати його у своїй роботі. Дайте нам знати, як ви це робите.
Все найкраще!
Цей підручник містить огляд редактора Power Query і мови M на робочому столі LuckyTemplates.
Дізнайтеся, як створити звіт із розбивкою на сторінки, додати тексти та зображення, а потім експортувати звіт у різні формати документів.
Дізнайтеся, як використовувати функцію автоматизації SharePoint для створення робочих процесів і допомоги в мікрокеруванні користувачами, бібліотеками та списками SharePoint.
Відточіть свої навички розробки звітів, приєднавшись до змагання з аналізу даних. Прискорювач може допомогти вам стати суперкористувачем LuckyTemplates!
Дізнайтеся, як обчислювати поточні підсумки в LuckyTemplates за допомогою DAX. Поточні підсумки дозволяють вам не потрапити в окремий результат.
Зрозумійте концепцію змінних у DAX у LuckyTemplates і значення змінних для обчислення показників.
Дізнайтеся більше про настроюваний візуал під назвою LuckyTemplates Slope chart, який використовується для показу зростання/зменшення для одного чи кількох показників.
Відкрийте для себе кольорові теми в LuckyTemplates. Це необхідно для того, щоб ваші звіти та візуалізації виглядали та працювали без проблем.
Розрахувати середнє значення в LuckyTemplates можна кількома способами, щоб отримати точну інформацію для ваших бізнес-звітів.
Давайте заглибимося в стандартну тематику LuckyTemplates і розглянемо деякі функції, вбудовані в саму програму LuckyTemplates Desktop.