Kuinka ladata näytetietojoukkoja Pythonissa

Tässä viestissä aiomme tarkastella, kuinka ladata näytetietojoukkoja Pythonissa. Tämä ei ehkä vaikuta hohdokkaimmalta aiheelta, mutta se on itse asiassa varsin tärkeä. Ihannetapauksessa sinulla on Pythonissa joitain tietojoukkoja, joita voit harjoitella, kun opit uusia käsitteitä. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Jos aiot jakaa koodisi , dokumentoida tekemäsi tai tarvitset apua , on todella hyvä idea käyttää yleisesti saatavilla olevaa tietojoukkoa rakentaaksesi jotain niin kutsuttua minimaalisesti toistettavaa esimerkkiä .

Sinulla on valmiiksi niputettu koodi tai komentosarja, jonka joku muu Internetissä voi suorittaa ja auttaa sinua sen kanssa. Jos et tuota näitä minimaalisesti toistettavia esimerkkejä , tulet syttymään paikoissa, kuten Stack Overflow, mikä voi olla hieman järkytys, jos et tunne sitä.

Kuinka ladata näytetietojoukkoja Pythonissa

Katsotaanpa muutamia tapoja rakentaa nämä minimaalisesti toistettavat esimerkit ja saada tietojoukot. On olemassa muutamia paketteja, joita voit käyttää valmiiden tietojoukon lataamiseen Pythoniin ja koodin jakamiseen.

Tarkastellaan kolmea yleisintä pakettia. Käynnistetään tyhjä Jupyter-muistikirja ja aloitetaan.

Kuinka ladata näytetietojoukkoja Pythonissa

Sisällysluettelo

Lataa tietojoukot Pythonissa Sklearnista

Ensimmäinen, jota tarkastelemme, on nimeltään Sklearn . Jos käytät Anacondaa, sinun ei tarvitse ladata tätä. Jos haluat lisää apua Pythonin kanssa, LuckyTemplatesilla on mahdollisuus rekisteröityä.

Oletan, että tiedät jo esimerkiksi paketeista, ja jatka sieltä. Aiomme tuoda pandat ja Sklearnin, erityisesti tietojoukon alamoduulin.

Kuinka ladata näytetietojoukkoja Pythonissa

Aiomme tuoda muutaman näistä tietojoukoista. Scikit-learn – koneoppimisdatakirjasto – kutsuu niitä lelutietosarjoiksi. Aiomme ladata Bostonin, joka on asuntojen hintatietojoukko. Kun tuomme tämän sisään, meillä on oltava se tietokehyksenä.

Meidän on itse asiassa määritettävä, että tiedot ja sarakkeet tulevat Scikit-learn-tietojoukosta, ja erotettava ominaisuusmuuttujat ja kohdemuuttujat.

Kuinka ladata näytetietojoukkoja Pythonissa

Saamme tämän tietokehykseksi, jotta voimme toimia ja tehdä sen kanssa erilaisia ​​asioita. Panda on niin hieno paketti, joka on hyvä tietää LuckyTemplates-käyttäjänä.

Lataa tietojoukot Pythonissa Vega-tietosarjoista

Toinen vaihtoehto, jonka voimme oppia, on Vega datasets -paketti. Tämä ei ole saatavilla Anacondassa, mutta voimme asentaa sen PIP:n kautta. Tämän kirjoitamme komentoriville asentaaksemme Vega-tietojoukot ja asentaaksemme tai tuodaksemme paikallisen datamoduulin.

Kuinka ladata näytetietojoukkoja Pythonissa

Jotkut näistä voit itse saada, mutta tarvitset verkkoyhteyden. Tuomme ne, jotka asennetaan paikallisesti tuomalla paikalliset tiedot ja suorittamalla ne.

Kuinka ladata näytetietojoukkoja Pythonissa

Kuten näet, tietojoukkoja on melko vähän. Osa näistä on aikasarjoja, kun taas osalla on kategorisia tai jatkuvia muuttujia. Valitaan autojen tietojoukko tietokehyksessä, jotta voimme ajaa siinä head-menetelmää.

Kuinka ladata näytetietojoukkoja Pythonissa

Nyt meillä on toinen esimerkkitietojoukko, jota voimme käyttää ja jakaa.

Kuinka ladata näytetietojoukkoja Pythonissa

Lataa tietojoukot Pythonissa Seabornista

Seaborn on toinen paketti, joka on saatavilla Anaconda-jakelussa. Oletusarvoisesti Seaborn tunnetaan parhaiten tietojen visualisoinnista, mutta siinä on myös joitain hienoja esimerkkitietojoukkoja, joita voit käyttää. Kirjoitamme tämän saadaksemme tietojoukot.

Kuinka ladata näytetietojoukkoja Pythonissa

Kuten näet, täällä on melko vähän tietojoukkoja. Jatkamme pingviinien tietojoukkoa ja hankimme ensimmäiset rivit uudelleen.

Kuinka ladata näytetietojoukkoja Pythonissa

Tuloksena on toinen tietojoukko, jota voimme harjoitella.

Kuinka ladata näytetietojoukkoja Pythonissa

Ajatuksena tässä ei ole vain tietojoukkojen harjoittelua. Jos huomaamme puuttuvia arvoja, meillä on vaikeuksia pudottaa tietojoukkoja, haluamme täyttää kategorisen muuttujan tai näyttää esimerkkiä muille antamatta arkaluonteisia tietoja, voit käyttää jotakin näistä julkisesti saatavilla olevista tietojoukoista, jotka ovat todella, todella helppoja. ihmisten käytettäväksi ja jaettavaksi. Se on idea minimaalisesti toistettavasta esimerkistä.



Johtopäätös

Yhteenvetona totean, että näytetietojoukkoja voi etsiä kolmesta paikasta. Scikit-learn on koneoppimispaketti. Muuntaminen on hieman vaikeampaa, mutta jos teet koneoppimiseen liittyviä asioita, tämä on oikea paikka. Vega datasetsillä on myös melko hyvä määrä tietojoukkoja varsinkin jos käytät menetelmää tietojoukkojen hakemiseen verkosta, mutta sen lataaminen on suhteellisen vaikeampaa, joten sinun on vain käytettävä PIP:tä verrattuna siihen, että se on esiasennettu Anacondan kanssa. Seaborn on suloinen paikka, koska se lataa tietokehyksen ja siinä on paljon monipuolisuutta esimerkkitietosarjojen ja toistettavien esimerkkien käytössä.

Stack Overflow sisältää myös opetusohjelman hyvän minimaalisesti toistettavan esimerkin tai MRE:n kirjoittamiseen, joten tarkista se, jos haluat julkaista jotain verkossa.

Hyvien tietojoukkojen hankkiminen ja hyvän MRE:n jakaminen on todella tärkeä taito analyytikkona.

Jos pidit tämän opetusohjelman sisällöstä, tilaa LuckyTemplates-TV-kanava. Meillä on jatkuvasti valtava määrä sisältöä minulta ja useilta sisällöntuottajilta – kaikki on omistautunut parantamaan tapaa, jolla käytät LuckyTemplatesia ja Power Platformia.


Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Opi lataamaan ja asentamaan DAX Studio ja Tabular Editor 3 ja miten ne määritetään käytettäväksi LuckyTemplatesissa ja Excelissä.

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

Tämä blogi sisältää Shape Map -visualisoinnin tilaanalyysiä varten LuckyTemplatesissa. Näytän sinulle, kuinka voit käyttää tätä visualisointia tehokkaasti sen ominaisuuksien ja elementtien kanssa.

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

Tässä opetusohjelmassa esittelen ainutlaatuisen idean talousraportoinnista, joka allokoi tulokset LuckyTemplatesin sisällä olevien taulukkopohjien ennalta määrittämiseen.

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

Luo DAX-suureita LuckyTemplatesissa käyttämällä olemassa olevia suureita tai kaavoja. Tätä kutsun mittahaaroitustekniikaksi.

Tehokkain toimintopuhelu LuckyTemplatesissa

Tehokkain toimintopuhelu LuckyTemplatesissa

Tässä blogissa tutustu LuckyTemplates-tietojoukkoon, tehokkaimpaan funktiokutsuun, joka tuo tuhansia M- ja DAX-funktioita sormiesi ulottuville.

Datamallinnustekniikat DAX-mittausten järjestämiseen

Datamallinnustekniikat DAX-mittausten järjestämiseen

Tämän päivän opetusohjelmassa jaan muutamia datamallinnustekniikoita DAX-mittausten järjestämiseksi paremmin tehokkaamman työnkulun aikaansaamiseksi.

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates on loistava työkalu talousraportointiin. Tässä on opetusohjelma räätälöityjen taulukoiden luomisesta LuckyTemplates-talouden hallintapaneelillesi.

Power Queryn kielivirran parhaat käytännöt

Power Queryn kielivirran parhaat käytännöt

Tässä opetusohjelmassa keskustellaan Power Query Language Flowsta ja siitä, kuinka se voi auttaa luomaan sujuvan ja tehokkaan dataraportin.

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

Keskustelen yhdestä suosikkitekniikoistani mukautettujen LuckyTemplates-kuvakkeiden ympärillä, joka käyttää mukautettuja kuvakkeita dynaamisella tavalla LuckyTemplates-visuaaleissa.

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

Tässä blogissa näytän sinulle, kuinka voit luoda LuckyTemplates-taulukoita käyttämällä kaavaa, joka yhdistää UNION-funktion ja ROW-funktion.