Набори даних у Pandas із ProfileReport() | Python у LuckyTemplates

Одне з найпоширеніших запитань, з якими ви зіткнетеся як аналітик даних, це те, який найкращий спосіб дослідити певний набір даних. Це важливий момент, перш за все, якщо ви хочете об’єднати всі дані у звіті, який вам або вашій команді буде легко інтерпретувати. У цьому підручнику я збираюся продемонструвати, як ви можете ефективно досліджувати набори даних у Pandas за допомогою ProfileReport(). Ви можете переглянути повне відео цього підручника внизу цього блогу.

Коли вам надають набір даних, що ви робите? Як ви досліджуєте набір даних? Перш за все, якщо ви хочете об’єднати все це в зручний для читання звіт для себе, для колег тощо, вам потрібно враховувати багато речей.

По-перше, ви думаєте про те, що це за змінні, тому що це вплине на те, як ви їх аналізуєте та як до них ставитеся. Дані означають те, що дано. Отже, бракує лише тих даних, яких у нас немає. Інша справа — візуалізувати ці відносини. Як вони виглядають? Ми хочемо використовувати цю силу візуалізації на ранній стадії та часто.

Це багато взаємопов’язаних складних питань. Хороша річ у тому, що доступна ця функція звіту про профілювання, яка дасть нам ці відповіді. Отже, давайте подивимося на все це в Python.

Зміст

Досліджуйте набори даних у Pandas за допомогою функції ProfileReport().

Спочатку ми завантажимо набір даних.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Потім з pandas_profiling ми збираємося імпортувати цю штуку під назвою звіт профілю. Тепер, якщо ви отримуєте тут помилку, можливо, вам потрібно його встановити. Я використовую Anaconda. Я пропоную вам також використати це. Давайте запустимо це, а потім роздрукуємо.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Так ось воно. У нас є огляд . Це дає нам розподіл типів змінних. У нас є статистика набору даних. Ми бачимо кількість стовпців рядків і так далі і так далі. Приємно в цьому звіті те, що він схожий на єдиний магазин, а також виглядає дуже гарно. Він має дуже привабливу презентацію.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Ми прокручуємо тут і маємо. Ми отримуємо візуалізацію, і ми можемо перемикати більше деталей про змінну. У нас є прапори, які вказують на речі, які можуть бути трохи незвичними. Ми також маємо ці сповіщення та багато інших функцій, які нададуть нам більше інформації. І це для кожної окремої змінної.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Продовжуючи прокручувати вниз, ми знайдемо Interactions, де створено точкові діаграми для візуалізації даних.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

А потім у нас є кореляції , які підсумовують зв’язок.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Далі є, які дуже важливі. Як ви бачите, у нас є деякі відсутні значення, і ми хочемо знати, чому. Ці візуалізації покликані допомогти нам у цьому. Ми можемо клацати кожне зображення й аналізувати дані.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates

Нарешті, у нас є Зразок. Ми могли б отримати це багатьма способами, але все, що це робить, це лише друк перших кількох рядків, що корисно знати.

Набори даних у Pandas із ProfileReport() |  Python у LuckyTemplates




Висновок

Ось як ви досліджуєте набори даних у Pandas за допомогою функції ProfileReport(). Є багато способів розділити дані. Подумайте про всі комбінації перестановок даних. Це не зможе зробити все за вас, але це справді хороший початок.

Коли ми досліджуємо дані, це дійсно ітеративний процес. Немає одноразової чарівної таблетки, як би нам цього не хотілося. Проте ProfilerReport() справді чудовий інструмент. Ми отримуємо багато інформації та лише один рядок коду. Це безкоштовний інструмент, тому я сподіваюся, що ви зможете використовувати його у своїй роботі. Дайте нам знати, як ви це робите.

Все найкраще!


Змініть формати дати за допомогою редактора Power Query

Змініть формати дати за допомогою редактора Power Query

У цьому посібнику ви дізнаєтеся, як перетворити текст у формат дати за допомогою редактора Power Query в LuckyTemplates.

Power Query: об’єднайте файли з кількох папок

Power Query: об’єднайте файли з кількох папок

Дізнайтеся, як об’єднати файли з кількох папок у мережі, робочому столі, OneDrive або SharePoint за допомогою Power Query.

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Обчисліть місячне ковзне середнє з початку року (з початку року) у LuckyTemplates

Цей підручник пояснює, як обчислити місячне ковзне середнє на базі даних з початку року за допомогою функцій AVERAGEX, TOTALYTD та FILTER у LuckyTemplates.

Створення таблиці дат у LuckyTemplates

Створення таблиці дат у LuckyTemplates

Дізнайтеся, чому важлива спеціальна таблиця дат у LuckyTemplates, і вивчіть найшвидший і найефективніший спосіб це зробити.

Мобільні звіти LuckyTemplates. Поради та методи

Мобільні звіти LuckyTemplates. Поради та методи

У цьому короткому посібнику розповідається про функцію мобільних звітів LuckyTemplates. Я збираюся показати вам, як ви можете ефективно створювати звіти для мобільних пристроїв.

Звіти про професійну аналітику послуг у LuckyTemplates

Звіти про професійну аналітику послуг у LuckyTemplates

У цій презентації LuckyTemplates ми розглянемо звіти, що демонструють професійну аналітику послуг від фірми, яка має кілька контрактів і залучених клієнтів.

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Оновлення Microsoft Power Platform | Microsoft Ignite 2021

Ознайомтеся з основними оновленнями для Power Apps і Power Automate, а також їх перевагами та наслідками для Microsoft Power Platform.

Загальні функції SQL: огляд

Загальні функції SQL: огляд

Відкрийте для себе деякі поширені функції SQL, які ми можемо використовувати, наприклад String, Date і деякі розширені функції для обробки та маніпулювання даними.

Створення шаблону LuckyTemplates: керівництво та поради

Створення шаблону LuckyTemplates: керівництво та поради

У цьому підручнику ви дізнаєтеся, як створити свій ідеальний шаблон LuckyTemplates, налаштований відповідно до ваших потреб і вподобань.

Параметри полів і малі кратні в LuckyTemplates

Параметри полів і малі кратні в LuckyTemplates

У цьому блозі ми продемонструємо, як шарувати параметри поля з малими кратними, щоб створити неймовірно корисну інформацію та візуальні ефекти.