Mintaadatkészletek betöltése Pythonban

Ebben a bejegyzésben megvizsgáljuk, hogyan tölthetünk be mintaadatkészleteket a Pythonban. Talán nem ez tűnik a legelbűvölőbb témának, de valójában nagyon fontos. Ideális esetben van néhány adatkészlete a Pythonban, amelyeket gyakorolhat, amikor új fogalmakat tanul. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Ha meg akarja osztani a kódot , dokumentálni szeretné, hogy mit tett , vagy segítségre van szüksége , akkor valóban jó ötlet egy általánosan elérhető adatkészletet használni egy úgynevezett minimálisan reprodukálható példa létrehozásához .

Lesz egy előre csomagolt kódja vagy szkriptje, amelyet valaki más az interneten futtathat, és segíthet rajta. Ha nem állítja elő ezeket a minimálisan reprodukálható példákat , akkor olyan helyekre kerülhet sor, mint a Stack Overflow, ami egy kicsit sokkoló lehet, ha nem ismeri.

Mintaadatkészletek betöltése Pythonban

Nézzünk meg néhány módot ezeknek a minimálisan reprodukálható példáknak a létrehozására és az adatkészletek beszerzésére. Van néhány csomag, amellyel előre elkészített adatkészletet tölthet be a Pythonba, és megoszthatja a kódot.

Megvizsgálunk három csomagot, amelyek a leggyakoribbak. Gyújtsunk be egy üres Jupyter-jegyzetfüzetet, és kezdjük el.

Mintaadatkészletek betöltése Pythonban

Tartalomjegyzék

Adatkészletek betöltése Pythonban a Sklearnből

Az első, amit megnézünk, a Sklearn . Ha Anacondát használ, ezt nem kell letöltenie. Ha további segítségre van szüksége a Python használatához, a LuckyTemplates rendelkezik egy feliratkozással.

Feltételezem, hogy már ismer olyan dolgokat, mint a csomagok, és menjen tovább. Be fogjuk hozni a pandákat és a Sklearnt, konkrétan az adatkészlet almodult.

Mintaadatkészletek betöltése Pythonban

Néhány ilyen adatkészletet fogunk hozni. A Scikit-learn – egy gépi tanulási adattár – játékadatkészleteknek nevezi őket. Be fogjuk tölteni Bostont, ami egy lakásárak adatkészlet. Amikor ezt bevisszük, adatkeretként kell rendelkeznünk vele.

Valójában meg kell határoznunk, hogy az adatok és az oszlopok a Scikit-learn adatkészletből származnak, és el kell különítenünk a jellemzőváltozókat és a célváltozókat.

Mintaadatkészletek betöltése Pythonban

Ezt egy adatkeretként fogjuk bevinni, hogy működhessenek és különböző dolgokat végezhessünk vele. A Panda egy nagyszerű csomag, amelyet LuckyTemplates felhasználóként ismerhet.

Adatkészletek betöltése Pythonban a Vega-adatkészletekből

Egy másik lehetőség, amelyet megtanulhatunk, a Vega adatkészletek csomagja. Ez nem érhető el az Anacondán, de PIP-n keresztül telepíthetjük. Ezt fogjuk beírni a parancssorba a Vega-adatkészletek telepítéséhez, valamint a helyi adatmodul telepítéséhez vagy importálásához.

Mintaadatkészletek betöltése Pythonban

Ezek közül néhányat valóban beszerezhet, de webkapcsolatra lesz szüksége. A helyi adatok importálásával és futtatásával a helyileg telepítetteket hozzuk be.

Mintaadatkészletek betöltése Pythonban

Amint látja, jó néhány adatkészlet létezik. Ezek egy része idősor, míg egy részük kategorikus vagy folytonos változókkal rendelkezik. Válasszuk ki az autók adatkészletét egy adatkeretben, hogy le tudjuk futtatni rajta a head metódust.

Mintaadatkészletek betöltése Pythonban

Most van egy másik mintaadatkészletünk, amelyet használhatunk és megoszthatunk.

Mintaadatkészletek betöltése Pythonban

Adatkészletek betöltése Pythonban a Seabornból

A Seaborn egy másik csomag, amely elérhető az Anaconda disztribúcióban. Alapértelmezés szerint a Seaborn leginkább az adatvizualizációról ismert, de van néhány nagyszerű mintaadatkészlet is, amelyeket használhat. Ezt írjuk be az adatkészletek lekéréséhez.

Mintaadatkészletek betöltése Pythonban

Mint látható, itt jó néhány adatkészlet található. A pingvinek adatkészletét használjuk, és újra megkapjuk az első néhány sort.

Mintaadatkészletek betöltése Pythonban

Az eredmény egy újabb adatkészlet, amelyen gyakorolhatunk.

Mintaadatkészletek betöltése Pythonban

Itt nem csak az az ötlet, hogy rendelkezzenek az adathalmazokkal a gyakorlatban. Ha hiányzó értékeket látunk, problémái vannak az adatkészletek eldobásával, ki akarjuk tölteni a kategorikus változót, vagy példát mutatunk másoknak anélkül, hogy bizalmas adatokat adnánk meg, akkor egyszerűen használhatja a nyilvánosan elérhető adatkészletek egyikét, amelyek nagyon-nagyon egyszerűek. hogy az emberek használhassák és megosszák. Ez egy minimálisan reprodukálható példa ötlete.



Következtetés

Összefoglalva, három helyen lehet mintaadatkészleteket keresni. A Scikit-learn egy gépi tanulási csomag. Kicsit nehezebb konvertálni, de ha gépi tanulással kapcsolatos dolgokat csinál, akkor ez a jó hely. A Vega adatkészletek is meglehetősen sok adatkészlettel rendelkeznek, különösen akkor, ha a módszert az adatkészletek webről való lekérésére használja, de viszonylag nehezebb betölteni, így csak a PIP-t kell használnia, szemben az Anaconda előre telepítettével. A Seaborn a legjobb hely, mert betölti az adatkeretet, és sokoldalúan használható mintaadatkészletek és reprodukálható példák használatakor.

A Stack Overflow egy oktatóanyaggal is rendelkezik egy jó, minimálisan reprodukálható példa vagy MRE megírásához, ezért nézze meg, ha valamit közzé szeretne tenni az interneten.

A jó adatkészletek beszerzésének és a jó MRE megosztásának ismerete nagyon fontos elemzői készség.

Ha tetszett az oktatóanyagban szereplő tartalom, kérjük, iratkozzon fel a LuckyTemplates TV-csatornára. Rengeteg tartalom jön ki folyamatosan tőlem és egy sor tartalomkészítőtől – mindannyian elkötelezettek a LuckyTemplates és a Power Platform használatának javításáért.


A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

Ismerje meg, hogyan töltheti le és telepítheti a DAX Studio és a Tabular Editor 3 alkalmazást, és hogyan konfigurálhatja őket a LuckyTemplates és az Excel programban való használatra.

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

Ez a blog tartalmazza a Shape Map vizualizációt a LuckyTemplates térbeli elemzéséhez. Megmutatom, hogyan használhatja hatékonyan ezt a vizualizációt annak funkcióival és elemeivel.

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

Ebben az oktatóanyagban egy egyedülálló ötletet mutatok be a pénzügyi jelentésekkel kapcsolatban, amely az eredmények hozzárendelését jelenti a LuckyTemplates-en belüli táblázatsablonok előre meghatározásához.

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

Hozzon létre DAX-mértékeket a LuckyTemplates alkalmazásban meglévő mértékek vagy képletek használatával. Ezt nevezem mértékelágazási technikának.

A legerősebb funkcióhívás a LuckyTemplatesben

A legerősebb funkcióhívás a LuckyTemplatesben

Ebben a blogban fedezze fel a LuckyTemplates adatkészletet, a leghatékonyabb függvényhívást, amely M- és DAX-függvények ezreit juttatja a keze ügyébe.

Adatmodellezési technikák a DAX-mérések megszervezéséhez

Adatmodellezési technikák a DAX-mérések megszervezéséhez

A mai oktatóanyagban megosztok néhány adatmodellezési technikát a DAX-mérések jobb rendszerezéséhez a hatékonyabb munkafolyamat érdekében.

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

A LuckyTemplates egy nagyszerű eszköz a pénzügyi jelentésekhez. Itt található egy oktatóanyag, amely bemutatja, hogyan hozhat létre személyre szabott táblázatokat a LuckyTemplates pénzügyi irányítópultjához.

A Power Query nyelvi folyamatának bevált gyakorlatai

A Power Query nyelvi folyamatának bevált gyakorlatai

Ez az oktatóanyag megvitatja a Power Query nyelvi folyamatot, és azt, hogyan segíthet zökkenőmentes és hatékony adatjelentések létrehozásában.

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

Az egyik kedvenc technikámról fogok beszélni a LuckyTemplates egyéni ikonok körül, amely dinamikusan használja az egyéni ikonokat a LuckyTemplates vizualizációkban.

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

Ebben a blogban megmutatom, hogyan hozhat létre LuckyTemplates táblázatokat olyan képlet segítségével, amely egyesíti az UNION és a ROW függvényt.