Набори даних у Pandas із ProfileReport() | Python у LuckyTemplates

Одне з найпоширеніших запитань, з якими ви зіткнетеся як аналітик даних, це те, який найкращий спосіб дослідити певний набір даних. Це важливий момент, перш за все, якщо ви хочете об’єднати всі дані у звіті, який вам або вашій команді буде легко інтерпретувати. У цьому підручнику я збираюся продемонструвати, як ви можете ефективно досліджувати набори даних у Pandas за допомогою ProfileReport(). Ви можете переглянути повне відео цього підручника внизу цього блогу.

Коли вам надають набір даних, що ви робите? Як ви досліджуєте набір даних? Перш за все, якщо ви хочете об’єднати все це в зручний для читання звіт для себе, для колег тощо, вам потрібно враховувати багато речей.

По-перше, ви думаєте про те, що це за змінні, тому що це вплине на те, як ви їх аналізуєте та як до них ставитеся. Дані означають те, що дано. Отже, бракує лише тих даних, яких у нас немає. Інша справа — візуалізувати ці відносини. Як вони виглядають? Ми хочемо використовувати цю силу візуалізації на ранній стадії та часто.

Це багато взаємопов’язаних складних питань. Хороша річ у тому, що доступна ця функція звіту про профілювання, яка дасть нам ці відповіді. Отже, давайте подивимося на все це в Python.

Зміст

Досліджуйте набори даних у Pandas за допомогою функції ProfileReport().

Спочатку ми завантажимо набір даних.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Потім з pandas_profiling ми збираємося імпортувати цю штуку під назвою звіт профілю. Тепер, якщо ви отримуєте тут помилку, можливо, вам потрібно його встановити. Я використовую Anaconda. Я пропоную вам також використати це. Давайте запустимо це, а потім роздрукуємо.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Так ось воно. У нас є огляд . Це дає нам розподіл типів змінних. У нас є статистика набору даних. Ми бачимо кількість стовпців рядків і так далі і так далі. Приємно в цьому звіті те, що він схожий на єдиний магазин, а також виглядає дуже гарно. Він має дуже привабливу презентацію.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Ми прокручуємо тут і маємо. Ми отримуємо візуалізацію, і ми можемо перемикати більше деталей про змінну. У нас є прапори, які вказують на речі, які можуть бути трохи незвичними. Ми також маємо ці сповіщення та багато інших функцій, які нададуть нам більше інформації. І це для кожної окремої змінної.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Продовжуючи прокручувати вниз, ми знайдемо Interactions, де створено точкові діаграми для візуалізації даних.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

А потім у нас є кореляції , які підсумовують зв’язок.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Далі є, які дуже важливі. Як ви бачите, у нас є деякі відсутні значення, і ми хочемо знати, чому. Ці візуалізації покликані допомогти нам у цьому. Ми можемо клацати кожне зображення й аналізувати дані.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Нарешті, у нас є Зразок. Ми могли б отримати це багатьма способами, але все, що це робить, це лише друк перших кількох рядків, що корисно знати.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates




Висновок

Ось як ви досліджуєте набори даних у Pandas за допомогою функції ProfileReport(). Є багато способів розділити дані. Подумайте про всі комбінації перестановок даних. Це не зможе зробити все за вас, але це справді хороший початок.

Коли ми досліджуємо дані, це дійсно ітеративний процес. Немає одноразової чарівної таблетки, як би нам цього не хотілося. Проте ProfilerReport() справді чудовий інструмент. Ми отримуємо багато інформації та лише один рядок коду. Це безкоштовний інструмент, тому я сподіваюся, що ви зможете використовувати його у своїй роботі. Дайте нам знати, як ви це робите.

Все найкраще!


Що таке Power Query та мова M: детальний огляд

Що таке Power Query та мова M: детальний огляд

Цей підручник містить огляд редактора Power Query і мови M на робочому столі LuckyTemplates.

Створення звіту з розбивкою на сторінки: додавання текстів і зображень

Створення звіту з розбивкою на сторінки: додавання текстів і зображень

Дізнайтеся, як створити звіт із розбивкою на сторінки, додати тексти та зображення, а потім експортувати звіт у різні формати документів.

Функція автоматизації SharePoint | Вступ

Функція автоматизації SharePoint | Вступ

Дізнайтеся, як використовувати функцію автоматизації SharePoint для створення робочих процесів і допомоги в мікрокеруванні користувачами, бібліотеками та списками SharePoint.

Вирішіть задачу аналізу даних за допомогою прискорювача LuckyTemplates

Вирішіть задачу аналізу даних за допомогою прискорювача LuckyTemplates

Відточіть свої навички розробки звітів, приєднавшись до змагання з аналізу даних. Прискорювач може допомогти вам стати суперкористувачем LuckyTemplates!

Підсумки в LuckyTemplates за допомогою DAX

Підсумки в LuckyTemplates за допомогою DAX

Дізнайтеся, як обчислювати поточні підсумки в LuckyTemplates за допомогою DAX. Поточні підсумки дозволяють вам не потрапити в окремий результат.

Змінні LuckyTemplates Dax постійні: що це означає?

Змінні LuckyTemplates Dax постійні: що це означає?

Зрозумійте концепцію змінних у DAX у LuckyTemplates і значення змінних для обчислення показників.

Діаграма нахилу LuckyTemplates: огляд

Діаграма нахилу LuckyTemplates: огляд

Дізнайтеся більше про настроюваний візуал під назвою LuckyTemplates Slope chart, який використовується для показу зростання/зменшення для одного чи кількох показників.

Колірні теми LuckyTemplates для однорідної візуалізації

Колірні теми LuckyTemplates для однорідної візуалізації

Відкрийте для себе кольорові теми в LuckyTemplates. Це необхідно для того, щоб ваші звіти та візуалізації виглядали та працювали без проблем.

Обчислення середнього значення в LuckyTemplates: виділення результатів у будні чи вихідні за допомогою DAX

Обчислення середнього значення в LuckyTemplates: виділення результатів у будні чи вихідні за допомогою DAX

Розрахувати середнє значення в LuckyTemplates можна кількома способами, щоб отримати точну інформацію для ваших бізнес-звітів.

Шаблони LuckyTemplates | Стандартне оформлення робочого столу LuckyTemplates

Шаблони LuckyTemplates | Стандартне оформлення робочого столу LuckyTemplates

Давайте заглибимося в стандартну тематику LuckyTemplates і розглянемо деякі функції, вбудовані в саму програму LuckyTemplates Desktop.