Mintaadatkészletek betöltése Pythonban

Ebben a bejegyzésben megvizsgáljuk, hogyan tölthetünk be mintaadatkészleteket a Pythonban. Talán nem ez tűnik a legelbűvölőbb témának, de valójában nagyon fontos. Ideális esetben van néhány adatkészlete a Pythonban, amelyeket gyakorolhat, amikor új fogalmakat tanul. Az oktatóanyag teljes videóját a blog alján tekintheti meg.

Ha meg akarja osztani a kódot , dokumentálni szeretné, hogy mit tett , vagy segítségre van szüksége , akkor valóban jó ötlet egy általánosan elérhető adatkészletet használni egy úgynevezett minimálisan reprodukálható példa létrehozásához .

Lesz egy előre csomagolt kódja vagy szkriptje, amelyet valaki más az interneten futtathat, és segíthet rajta. Ha nem állítja elő ezeket a minimálisan reprodukálható példákat , akkor olyan helyekre kerülhet sor, mint a Stack Overflow, ami egy kicsit sokkoló lehet, ha nem ismeri.

Mintaadatkészletek betöltése Pythonban

Nézzünk meg néhány módot ezeknek a minimálisan reprodukálható példáknak a létrehozására és az adatkészletek beszerzésére. Van néhány csomag, amellyel előre elkészített adatkészletet tölthet be a Pythonba, és megoszthatja a kódot.

Megvizsgálunk három csomagot, amelyek a leggyakoribbak. Gyújtsunk be egy üres Jupyter-jegyzetfüzetet, és kezdjük el.

Mintaadatkészletek betöltése Pythonban

Tartalomjegyzék

Adatkészletek betöltése Pythonban a Sklearnből
Adatkészletek betöltése Pythonban a Vega-adatkészletekből
Adatkészletek betöltése Pythonban a Seabornból
Következtetés

Adatkészletek betöltése Pythonban a Sklearnből

Az első, amit megnézünk, a Sklearn . Ha Anacondát használ, ezt nem kell letöltenie. Ha további segítségre van szüksége a Python használatához, a LuckyTemplates rendelkezik egy feliratkozással.

Feltételezem, hogy már ismer olyan dolgokat, mint a csomagok, és menjen tovább. Be fogjuk hozni a pandákat és a Sklearnt, konkrétan az adatkészlet almodult.

Mintaadatkészletek betöltése Pythonban

Néhány ilyen adatkészletet fogunk hozni. A Scikit-learn – egy gépi tanulási adattár – játékadatkészleteknek nevezi őket. Be fogjuk tölteni Bostont, ami egy lakásárak adatkészlet. Amikor ezt bevisszük, adatkeretként kell rendelkeznünk vele.

Valójában meg kell határoznunk, hogy az adatok és az oszlopok a Scikit-learn adatkészletből származnak, és el kell különítenünk a jellemzőváltozókat és a célváltozókat.

Mintaadatkészletek betöltése Pythonban

Ezt egy adatkeretként fogjuk bevinni, hogy működhessenek és különböző dolgokat végezhessünk vele. A Panda egy nagyszerű csomag, amelyet LuckyTemplates felhasználóként ismerhet.

Adatkészletek betöltése Pythonban a Vega-adatkészletekből

Egy másik lehetőség, amelyet megtanulhatunk, a Vega adatkészletek csomagja. Ez nem érhető el az Anacondán, de PIP-n keresztül telepíthetjük. Ezt fogjuk beírni a parancssorba a Vega-adatkészletek telepítéséhez, valamint a helyi adatmodul telepítéséhez vagy importálásához.

Mintaadatkészletek betöltése Pythonban

Ezek közül néhányat valóban beszerezhet, de webkapcsolatra lesz szüksége. A helyi adatok importálásával és futtatásával a helyileg telepítetteket hozzuk be.

Mintaadatkészletek betöltése Pythonban

Amint látja, jó néhány adatkészlet létezik. Ezek egy része idősor, míg egy részük kategorikus vagy folytonos változókkal rendelkezik. Válasszuk ki az autók adatkészletét egy adatkeretben, hogy le tudjuk futtatni rajta a head metódust.

Mintaadatkészletek betöltése Pythonban

Most van egy másik mintaadatkészletünk, amelyet használhatunk és megoszthatunk.

Mintaadatkészletek betöltése Pythonban

Adatkészletek betöltése Pythonban a Seabornból

A Seaborn egy másik csomag, amely elérhető az Anaconda disztribúcióban. Alapértelmezés szerint a Seaborn leginkább az adatvizualizációról ismert, de van néhány nagyszerű mintaadatkészlet is, amelyeket használhat. Ezt írjuk be az adatkészletek lekéréséhez.

Mintaadatkészletek betöltése Pythonban

Mint látható, itt jó néhány adatkészlet található. A pingvinek adatkészletét használjuk, és újra megkapjuk az első néhány sort.

Mintaadatkészletek betöltése Pythonban

Az eredmény egy újabb adatkészlet, amelyen gyakorolhatunk.

Mintaadatkészletek betöltése Pythonban

Itt nem csak az az ötlet, hogy rendelkezzenek az adathalmazokkal a gyakorlatban. Ha hiányzó értékeket látunk, problémái vannak az adatkészletek eldobásával, ki akarjuk tölteni a kategorikus változót, vagy példát mutatunk másoknak anélkül, hogy bizalmas adatokat adnánk meg, akkor egyszerűen használhatja a nyilvánosan elérhető adatkészletek egyikét, amelyek nagyon-nagyon egyszerűek. hogy az emberek használhassák és megosszák. Ez egy minimálisan reprodukálható példa ötlete.

Következtetés

Összefoglalva, három helyen lehet mintaadatkészleteket keresni. A Scikit-learn egy gépi tanulási csomag. Kicsit nehezebb konvertálni, de ha gépi tanulással kapcsolatos dolgokat csinál, akkor ez a jó hely. A Vega adatkészletek is meglehetősen sok adatkészlettel rendelkeznek, különösen akkor, ha a módszert az adatkészletek webről való lekérésére használja, de viszonylag nehezebb betölteni, így csak a PIP-t kell használnia, szemben az Anaconda előre telepítettével. A Seaborn a legjobb hely, mert betölti az adatkeretet, és sokoldalúan használható mintaadatkészletek és reprodukálható példák használatakor.

A Stack Overflow egy oktatóanyaggal is rendelkezik egy jó, minimálisan reprodukálható példa vagy MRE megírásához, ezért nézze meg, ha valamit közzé szeretne tenni az interneten.

A jó adatkészletek beszerzésének és a jó MRE megosztásának ismerete nagyon fontos elemzői készség.

Ha tetszett az oktatóanyagban szereplő tartalom, kérjük, iratkozzon fel a LuckyTemplates TV-csatornára. Rengeteg tartalom jön ki folyamatosan tőlem és egy sor tartalomkészítőtől – mindannyian elkötelezettek a LuckyTemplates és a Power Platform használatának javításáért.

Hagyj kommentárt

E-mail melléklet mentése SharePointba a Power Automate segítségével

Ebből a blogból megtudhatja, hogyan mentheti automatikusan az e-mail mellékleteket a SharePointba, majd törölheti az e-maileket a Power Automate segítségével.

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Power Automate folyamatok létrehozása a semmiből

Ismerje meg, hogyan hozhat létre Power Automate folyamatokat a semmiből. Sablon használata helyett mi magunk hozzuk létre a kiváltó okokat és a műveleteket.

4 módszer a Pi használatára a Pythonban példákkal

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Ebben az útmutatóban bemutatom, hogyan lehet Pénzügyi információk mátrixát létrehozni a Profit és veszteség (P&L) kimutatással a LuckyTemplates alkalmazásban.

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Fedezze fel, hogyan lehet dinamikusan egyesíteni oszlopokat a Power Query Table.CombineColumns függvény segítségével.

SharePoint-fájlok hozzáadása a számítógéphez

Ismerje meg, hogyan adhatjuk hozzá és szinkronizálhatjuk SharePoint-fájljainkat az asztalon és a OneDrive-on.

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.