Як завантажити зразки наборів даних у Python

У цій публікації ми розглянемо, як завантажити зразки наборів даних у Python. Це може здатися не найпривабливішою темою, але насправді вона дуже важлива. В ідеалі у вас будуть деякі набори даних у Python, на яких ви зможете попрактикуватися, вивчаючи нові поняття. Ви можете переглянути повне відео цього підручника внизу цього блогу.

Якщо ви збираєтеся поділитися своїм кодом , задокументувати те, що ви зробили , або потребуєте допомоги , справді гарною ідеєю буде використовувати загальнодоступний набір даних, щоб створити щось, що називається мінімально відтворюваним прикладом .

Ви матимете готовий код або сценарій, який хтось інший в Інтернеті може запустити та допомогти вам із ним. Якщо ви не створите ці мінімально відтворювані приклади , ви отримаєте спалах у таких місцях, як Stack Overflow, що може бути трохи шоком, якщо ви з цим не знайомі.

Як завантажити зразки наборів даних у Python

Давайте розглянемо кілька способів створити ці мінімально відтворювані приклади та отримати набори даних. Є кілька пакетів, які можна використовувати для завантаження готового набору даних у Python і поширення цього коду.

Ми розглянемо три пакети, які є найпоширенішими. Давайте запустимо чистий блокнот Jupyter і почнемо.

Як завантажити зразки наборів даних у Python

Зміст

Завантажте набори даних на Python із Sklearn

Перший, який ми розглянемо, називається Sklearn . Якщо ви використовуєте Anaconda, вам не потрібно буде завантажувати це. Якщо вам потрібна додаткова допомога з Python, у LuckyTemplates є сайт, на якому ви можете зареєструватися.

Я припускаю, що ви вже знаєте такі речі, як пакунки, і продовжу. Ми збираємося додати pandas і Sklearn, зокрема, підмодуль набору даних.

Як завантажити зразки наборів даних у Python

Ми збираємося привести деякі з цих наборів даних. Scikit-learn – бібліотека даних машинного навчання – називає їх іграшковими наборами даних. Ми збираємося завантажити Бостон, який є набором даних про ціни на житло. Коли ми вносимо це, нам потрібно мати це як фрейм даних.

Нам потрібно фактично вказати, що дані та стовпці надходять із набору даних Scikit-learn, і розділити змінні функції та цільові змінні.

Як завантажити зразки наборів даних у Python

Ми отримаємо це як фрейм даних, щоб ми могли оперувати та робити з ним різні речі. Користувачеві LuckyTemplates чудово знати Panda.

Завантажте набори даних у Python із наборів даних Vega

Іншим варіантом, який ми можемо вивчити, є пакет наборів даних Vega. Цей не доступний на Anaconda, але ми можемо встановити його через PIP. Це те, що ми будемо вводити в командному рядку, щоб інсталювати набори даних Vega та інсталювати або імпортувати локальний модуль даних.

Як завантажити зразки наборів даних у Python

Деякі з них ви можете отримати, але вам знадобиться підключення до Інтернету. Ми залучимо ті, які інстальовано локально, імпортувавши локальні дані та запустивши їх.

Як завантажити зразки наборів даних у Python

Як бачите, наборів даних досить багато. Деякі з них є часовими рядами, тоді як деякі з них мають категоричні або безперервні змінні. Давайте виберемо набір даних cars у кадрі даних, щоб ми могли запустити на ньому метод head.

Як завантажити зразки наборів даних у Python

Тепер у нас є інший зразок набору даних, який ми можемо використовувати та ділитися.

Як завантажити зразки наборів даних у Python

Завантажте набори даних на Python із Seaborn

Seaborn — ще один пакет, доступний у дистрибутиві Anaconda. За замовчуванням Seaborn найбільше відомий візуалізацією даних, але він також має кілька чудових зразків наборів даних, які ви можете використовувати. Це те, що ми будемо вводити, щоб отримати набори даних.

Як завантажити зразки наборів даних у Python

Як бачите, тут досить багато наборів даних. Ми використаємо набір даних про пінгвінів і знову отримаємо кілька перших рядків.

Як завантажити зразки наборів даних у Python

У результаті ми отримуємо ще один набір даних для практики.

Як завантажити зразки наборів даних у Python

Ідея полягає не лише в тому, щоб мати набори даних для практики. Якщо ми бачимо деякі відсутні значення, маємо проблеми з видаленням наборів даних, хочемо заповнити категоріальну змінну або показати приклад іншим людям, не надавши конфіденційних даних, ви можете просто використати один із цих загальнодоступних наборів даних, які дуже, дуже легко щоб люди могли використовувати та ділитися. Це ідея мінімально відтворюваного прикладу.



Висновок

Підсумовуючи, є три місця для пошуку зразків наборів даних. Scikit-learn — це пакет машинного навчання. Це трохи важче конвертувати, але якщо ви займаєтеся речами, пов’язаними з машинним навчанням, сюди варто піти. Vega datasets також має досить велику кількість наборів даних, особливо якщо ви використовуєте метод для отримання наборів даних з Інтернету, але його відносно важче завантажити, тому вам просто потрібно використовувати PIP, а не попередньо інсталювати його з Anaconda. Seaborn є найкращим місцем, тому що він завантажує кадр даних і має багато можливостей, коли справа доходить до використання вибіркових наборів даних і відтворюваних прикладів.

У Stack Overflow також є навчальний посібник про те, як написати гарний мінімально відтворюваний приклад або ІМН, тож перевірте це, якщо хочете опублікувати щось онлайн.

Знати, де отримати хороші набори даних і поділитися хорошим ІМН, є справді важливою навичкою для аналітика.

Якщо вам сподобався вміст, розглянутий у цьому посібнику, підпишіться на телеканал LuckyTemplates. У нас постійно надходить величезна кількість вмісту від мене та низки творців контенту – усі ми прагнемо покращити спосіб використання LuckyTemplates і Power Platform.


Функція параметра LuckyTemplates «Що, якщо».

Функція параметра LuckyTemplates «Що, якщо».

У цьому блозі представлено нову функцію в LuckyTemplates — параметр аналізу «Що, якщо». Ви побачите, як це робить усе швидким і легким для аналізу сценарію.

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Дізнайтеся, як визначити, чи добре зростає ваш дохід, перевіривши, чи зросла ваша маржа за допомогою розгалуження міри LuckyTemplates.

Параметри LuckyTemplates через редактор запитів

Параметри LuckyTemplates через редактор запитів

Дізнайтеся та зрозумійте, як можна створювати та використовувати параметри LuckyTemplates, які є потужною функцією редактора запитів.

Кругла гістограма – візуалізація для вашої інформаційної панелі

Кругла гістограма – візуалізація для вашої інформаційної панелі

У цьому підручнику буде обговорено створення круглої гістограми за допомогою Charticulator. Ви дізнаєтеся, як створити їх для звіту LuckyTemplates.

Функції та формули PowerApps | Вступ

Функції та формули PowerApps | Вступ

Дізнайтеся, як використовувати функції та формули PowerApps, щоб покращити функціональність і змінити поведінку в нашій програмі Canvas Power Apps.

Труба в R: підключення функцій за допомогою Dplyr

Труба в R: підключення функцій за допомогою Dplyr

У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.

Вилучення тем і зображень LuckyTemplates із PBIX

Вилучення тем і зображень LuckyTemplates із PBIX

Дізнайтеся, як розібрати файл PBIX, щоб витягти теми та зображення LuckyTemplates із фону та використовувати їх для створення звіту!

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Шпаргалка формул Excel: Посібник середнього рівня

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися

Календарна таблиця LuckyTemplates: що це таке та як ним користуватися