Kuinka ladata näytetietojoukkoja Pythonissa

Tässä viestissä aiomme tarkastella, kuinka ladata näytetietojoukkoja Pythonissa. Tämä ei ehkä vaikuta hohdokkaimmalta aiheelta, mutta se on itse asiassa varsin tärkeä. Ihannetapauksessa sinulla on Pythonissa joitain tietojoukkoja, joita voit harjoitella, kun opit uusia käsitteitä. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta.

Jos aiot jakaa koodisi , dokumentoida tekemäsi tai tarvitset apua , on todella hyvä idea käyttää yleisesti saatavilla olevaa tietojoukkoa rakentaaksesi jotain niin kutsuttua minimaalisesti toistettavaa esimerkkiä .

Sinulla on valmiiksi niputettu koodi tai komentosarja, jonka joku muu Internetissä voi suorittaa ja auttaa sinua sen kanssa. Jos et tuota näitä minimaalisesti toistettavia esimerkkejä , tulet syttymään paikoissa, kuten Stack Overflow, mikä voi olla hieman järkytys, jos et tunne sitä.

Kuinka ladata näytetietojoukkoja Pythonissa

Katsotaanpa muutamia tapoja rakentaa nämä minimaalisesti toistettavat esimerkit ja saada tietojoukot. On olemassa muutamia paketteja, joita voit käyttää valmiiden tietojoukon lataamiseen Pythoniin ja koodin jakamiseen.

Tarkastellaan kolmea yleisintä pakettia. Käynnistetään tyhjä Jupyter-muistikirja ja aloitetaan.

Kuinka ladata näytetietojoukkoja Pythonissa

Sisällysluettelo

Lataa tietojoukot Pythonissa Sklearnista

Ensimmäinen, jota tarkastelemme, on nimeltään Sklearn . Jos käytät Anacondaa, sinun ei tarvitse ladata tätä. Jos haluat lisää apua Pythonin kanssa, LuckyTemplatesilla on mahdollisuus rekisteröityä.

Oletan, että tiedät jo esimerkiksi paketeista, ja jatka sieltä. Aiomme tuoda pandat ja Sklearnin, erityisesti tietojoukon alamoduulin.

Kuinka ladata näytetietojoukkoja Pythonissa

Aiomme tuoda muutaman näistä tietojoukoista. Scikit-learn – koneoppimisdatakirjasto – kutsuu niitä lelutietosarjoiksi. Aiomme ladata Bostonin, joka on asuntojen hintatietojoukko. Kun tuomme tämän sisään, meillä on oltava se tietokehyksenä.

Meidän on itse asiassa määritettävä, että tiedot ja sarakkeet tulevat Scikit-learn-tietojoukosta, ja erotettava ominaisuusmuuttujat ja kohdemuuttujat.

Kuinka ladata näytetietojoukkoja Pythonissa

Saamme tämän tietokehykseksi, jotta voimme toimia ja tehdä sen kanssa erilaisia ​​asioita. Panda on niin hieno paketti, joka on hyvä tietää LuckyTemplates-käyttäjänä.

Lataa tietojoukot Pythonissa Vega-tietosarjoista

Toinen vaihtoehto, jonka voimme oppia, on Vega datasets -paketti. Tämä ei ole saatavilla Anacondassa, mutta voimme asentaa sen PIP:n kautta. Tämän kirjoitamme komentoriville asentaaksemme Vega-tietojoukot ja asentaaksemme tai tuodaksemme paikallisen datamoduulin.

Kuinka ladata näytetietojoukkoja Pythonissa

Jotkut näistä voit itse saada, mutta tarvitset verkkoyhteyden. Tuomme ne, jotka asennetaan paikallisesti tuomalla paikalliset tiedot ja suorittamalla ne.

Kuinka ladata näytetietojoukkoja Pythonissa

Kuten näet, tietojoukkoja on melko vähän. Osa näistä on aikasarjoja, kun taas osalla on kategorisia tai jatkuvia muuttujia. Valitaan autojen tietojoukko tietokehyksessä, jotta voimme ajaa siinä head-menetelmää.

Kuinka ladata näytetietojoukkoja Pythonissa

Nyt meillä on toinen esimerkkitietojoukko, jota voimme käyttää ja jakaa.

Kuinka ladata näytetietojoukkoja Pythonissa

Lataa tietojoukot Pythonissa Seabornista

Seaborn on toinen paketti, joka on saatavilla Anaconda-jakelussa. Oletusarvoisesti Seaborn tunnetaan parhaiten tietojen visualisoinnista, mutta siinä on myös joitain hienoja esimerkkitietojoukkoja, joita voit käyttää. Kirjoitamme tämän saadaksemme tietojoukot.

Kuinka ladata näytetietojoukkoja Pythonissa

Kuten näet, täällä on melko vähän tietojoukkoja. Jatkamme pingviinien tietojoukkoa ja hankimme ensimmäiset rivit uudelleen.

Kuinka ladata näytetietojoukkoja Pythonissa

Tuloksena on toinen tietojoukko, jota voimme harjoitella.

Kuinka ladata näytetietojoukkoja Pythonissa

Ajatuksena tässä ei ole vain tietojoukkojen harjoittelua. Jos huomaamme puuttuvia arvoja, meillä on vaikeuksia pudottaa tietojoukkoja, haluamme täyttää kategorisen muuttujan tai näyttää esimerkkiä muille antamatta arkaluonteisia tietoja, voit käyttää jotakin näistä julkisesti saatavilla olevista tietojoukoista, jotka ovat todella, todella helppoja. ihmisten käytettäväksi ja jaettavaksi. Se on idea minimaalisesti toistettavasta esimerkistä.



Johtopäätös

Yhteenvetona totean, että näytetietojoukkoja voi etsiä kolmesta paikasta. Scikit-learn on koneoppimispaketti. Muuntaminen on hieman vaikeampaa, mutta jos teet koneoppimiseen liittyviä asioita, tämä on oikea paikka. Vega datasetsillä on myös melko hyvä määrä tietojoukkoja varsinkin jos käytät menetelmää tietojoukkojen hakemiseen verkosta, mutta sen lataaminen on suhteellisen vaikeampaa, joten sinun on vain käytettävä PIP:tä verrattuna siihen, että se on esiasennettu Anacondan kanssa. Seaborn on suloinen paikka, koska se lataa tietokehyksen ja siinä on paljon monipuolisuutta esimerkkitietosarjojen ja toistettavien esimerkkien käytössä.

Stack Overflow sisältää myös opetusohjelman hyvän minimaalisesti toistettavan esimerkin tai MRE:n kirjoittamiseen, joten tarkista se, jos haluat julkaista jotain verkossa.

Hyvien tietojoukkojen hankkiminen ja hyvän MRE:n jakaminen on todella tärkeä taito analyytikkona.

Jos pidit tämän opetusohjelman sisällöstä, tilaa LuckyTemplates-TV-kanava. Meillä on jatkuvasti valtava määrä sisältöä minulta ja useilta sisällöntuottajilta – kaikki on omistautunut parantamaan tapaa, jolla käytät LuckyTemplatesia ja Power Platformia.


Päivämäärätaulukon luominen LuckyTemplatesissa

Päivämäärätaulukon luominen LuckyTemplatesissa

Ota selvää, miksi LuckyTemplatesissa on tärkeää pitää oma päivämäärätaulukko ja opi nopein ja tehokkain tapa tehdä se.

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

Tämä lyhyt opetusohjelma korostaa LuckyTemplates-mobiiliraportointiominaisuutta. Näytän sinulle, kuinka voit kehittää raportteja tehokkaasti mobiililaitteille.

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Tässä LuckyTemplates Showcase -esittelyssä käymme läpi raportteja, jotka näyttävät ammattitaitoisen palveluanalytiikan yritykseltä, jolla on useita sopimuksia ja asiakkaiden sitoumuksia.

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Käy läpi tärkeimmät Power Appsin ja Power Automaten päivitykset sekä niiden edut ja vaikutukset Microsoft Power Platformiin.

Yleiset SQL-funktiot: Yleiskatsaus

Yleiset SQL-funktiot: Yleiskatsaus

Tutustu joihinkin yleisiin SQL-toimintoihin, joita voimme käyttää, kuten merkkijono, päivämäärä ja joitain lisätoimintoja tietojen käsittelyyn tai käsittelyyn.

LuckyTemplates-mallin luominen: opas ja vinkkejä

LuckyTemplates-mallin luominen: opas ja vinkkejä

Tässä opetusohjelmassa opit luomaan täydellisen LuckyTemplates-mallin, joka on määritetty tarpeidesi ja mieltymystesi mukaan.

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Tässä blogissa esittelemme, kuinka kerrostat kenttäparametreja pienillä kerroilla uskomattoman hyödyllisten näkemysten ja visuaalien luomiseksi.

LuckyTemplates-sijoitus ja mukautettu ryhmittely

LuckyTemplates-sijoitus ja mukautettu ryhmittely

Tässä blogissa opit käyttämään LuckyTemplates-sijoitus- ja mukautettuja ryhmittelyominaisuuksia näytetietojen segmentoimiseen ja luokitteluun kriteerien mukaan.

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

Tässä opetusohjelmassa käsittelen tiettyä tekniikkaa, jolla voit näyttää kumulatiivisen kokonaissumman LuckyTemplates-visuaaleissasi vain tiettyyn päivämäärään asti.

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Opi luomaan ja mukauttamaan Bullet-kaavioita LuckyTemplatesissa, joita käytetään pääasiassa suorituskyvyn mittaamiseen suhteessa tavoitteeseen tai edellisiin vuosiin.