Mintaadatkészletek betöltése Pythonban

Ebben a bejegyzésben megvizsgáljuk, hogyan tölthetünk be mintaadatkészleteket a Pythonban. Talán nem ez tűnik a legelbűvölőbb témának, de valójában nagyon fontos. Ideális esetben van néhány adatkészlete a Pythonban, amelyeket gyakorolhat, amikor új fogalmakat tanul. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Ha meg akarja osztani a kódot , dokumentálni szeretné, hogy mit tett , vagy segítségre van szüksége , akkor valóban jó ötlet egy általánosan elérhető adatkészletet használni egy úgynevezett minimálisan reprodukálható példa létrehozásához .

Lesz egy előre csomagolt kódja vagy szkriptje, amelyet valaki más az interneten futtathat, és segíthet rajta. Ha nem állítja elő ezeket a minimálisan reprodukálható példákat , akkor olyan helyekre kerülhet sor, mint a Stack Overflow, ami egy kicsit sokkoló lehet, ha nem ismeri.

Mintaadatkészletek betöltése Pythonban

Nézzünk meg néhány módot ezeknek a minimálisan reprodukálható példáknak a létrehozására és az adatkészletek beszerzésére. Van néhány csomag, amellyel előre elkészített adatkészletet tölthet be a Pythonba, és megoszthatja a kódot.

Megvizsgálunk három csomagot, amelyek a leggyakoribbak. Gyújtsunk be egy üres Jupyter-jegyzetfüzetet, és kezdjük el.

Mintaadatkészletek betöltése Pythonban

Tartalomjegyzék

Adatkészletek betöltése Pythonban a Sklearnből

Az első, amit megnézünk, a Sklearn . Ha Anacondát használ, ezt nem kell letöltenie. Ha további segítségre van szüksége a Python használatához, a LuckyTemplates rendelkezik egy feliratkozással.

Feltételezem, hogy már ismer olyan dolgokat, mint a csomagok, és menjen tovább. Be fogjuk hozni a pandákat és a Sklearnt, konkrétan az adatkészlet almodult.

Mintaadatkészletek betöltése Pythonban

Néhány ilyen adatkészletet fogunk hozni. A Scikit-learn – egy gépi tanulási adattár – játékadatkészleteknek nevezi őket. Be fogjuk tölteni Bostont, ami egy lakásárak adatkészlet. Amikor ezt bevisszük, adatkeretként kell rendelkeznünk vele.

Valójában meg kell határoznunk, hogy az adatok és az oszlopok a Scikit-learn adatkészletből származnak, és el kell különítenünk a jellemzőváltozókat és a célváltozókat.

Mintaadatkészletek betöltése Pythonban

Ezt egy adatkeretként fogjuk bevinni, hogy működhessenek és különböző dolgokat végezhessünk vele. A Panda egy nagyszerű csomag, amelyet LuckyTemplates felhasználóként ismerhet.

Adatkészletek betöltése Pythonban a Vega-adatkészletekből

Egy másik lehetőség, amelyet megtanulhatunk, a Vega adatkészletek csomagja. Ez nem érhető el az Anacondán, de PIP-n keresztül telepíthetjük. Ezt fogjuk beírni a parancssorba a Vega-adatkészletek telepítéséhez, valamint a helyi adatmodul telepítéséhez vagy importálásához.

Mintaadatkészletek betöltése Pythonban

Ezek közül néhányat valóban beszerezhet, de webkapcsolatra lesz szüksége. A helyi adatok importálásával és futtatásával a helyileg telepítetteket hozzuk be.

Mintaadatkészletek betöltése Pythonban

Amint látja, jó néhány adatkészlet létezik. Ezek egy része idősor, míg egy részük kategorikus vagy folytonos változókkal rendelkezik. Válasszuk ki az autók adatkészletét egy adatkeretben, hogy le tudjuk futtatni rajta a head metódust.

Mintaadatkészletek betöltése Pythonban

Most van egy másik mintaadatkészletünk, amelyet használhatunk és megoszthatunk.

Mintaadatkészletek betöltése Pythonban

Adatkészletek betöltése Pythonban a Seabornból

A Seaborn egy másik csomag, amely elérhető az Anaconda disztribúcióban. Alapértelmezés szerint a Seaborn leginkább az adatvizualizációról ismert, de van néhány nagyszerű mintaadatkészlet is, amelyeket használhat. Ezt írjuk be az adatkészletek lekéréséhez.

Mintaadatkészletek betöltése Pythonban

Mint látható, itt jó néhány adatkészlet található. A pingvinek adatkészletét használjuk, és újra megkapjuk az első néhány sort.

Mintaadatkészletek betöltése Pythonban

Az eredmény egy újabb adatkészlet, amelyen gyakorolhatunk.

Mintaadatkészletek betöltése Pythonban

Itt nem csak az az ötlet, hogy rendelkezzenek az adathalmazokkal a gyakorlatban. Ha hiányzó értékeket látunk, problémái vannak az adatkészletek eldobásával, ki akarjuk tölteni a kategorikus változót, vagy példát mutatunk másoknak anélkül, hogy bizalmas adatokat adnánk meg, akkor egyszerűen használhatja a nyilvánosan elérhető adatkészletek egyikét, amelyek nagyon-nagyon egyszerűek. hogy az emberek használhassák és megosszák. Ez egy minimálisan reprodukálható példa ötlete.



Következtetés

Összefoglalva, három helyen lehet mintaadatkészleteket keresni. A Scikit-learn egy gépi tanulási csomag. Kicsit nehezebb konvertálni, de ha gépi tanulással kapcsolatos dolgokat csinál, akkor ez a jó hely. A Vega adatkészletek is meglehetősen sok adatkészlettel rendelkeznek, különösen akkor, ha a módszert az adatkészletek webről való lekérésére használja, de viszonylag nehezebb betölteni, így csak a PIP-t kell használnia, szemben az Anaconda előre telepítettével. A Seaborn a legjobb hely, mert betölti az adatkeretet, és sokoldalúan használható mintaadatkészletek és reprodukálható példák használatakor.

A Stack Overflow egy oktatóanyaggal is rendelkezik egy jó, minimálisan reprodukálható példa vagy MRE megírásához, ezért nézze meg, ha valamit közzé szeretne tenni az interneten.

A jó adatkészletek beszerzésének és a jó MRE megosztásának ismerete nagyon fontos elemzői készség.

Ha tetszett az oktatóanyagban szereplő tartalom, kérjük, iratkozzon fel a LuckyTemplates TV-csatornára. Rengeteg tartalom jön ki folyamatosan tőlem és egy sor tartalomkészítőtől – mindannyian elkötelezettek a LuckyTemplates és a Power Platform használatának javításáért.


Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.

Gyakori SQL-függvények: Áttekintés

Gyakori SQL-függvények: Áttekintés

Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.

LuckyTemplates sablonok létrehozása: útmutató és tippek

LuckyTemplates sablonok létrehozása: útmutató és tippek

Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.

LuckyTemplates rangsor és egyéni csoportosítás

LuckyTemplates rangsor és egyéni csoportosítás

Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.