Python-tietojoukko: Toistettavien koodien käyttäminen

Tässä blogissa opit käyttämään toistettavia koodeja tai toimintoja samantyyppisten tulosteiden tuottamiseksi. Tämä auttaa sinua olemaan tehokkaampi ja käyttämään vähemmän vaivaa tiettyjen tietojen hakemisessa eri tietojoukoista. Tässä opetusohjelmassa käytämme esimerkkinä olemassa olevaa koodia, jonka olen aiemmin luonut.

Opit myös tekemään kopioita tietojoukoista, jotta tietojoukon alkuperäinen versio ei vahingoitu, tuoda kirjastoja ja toimintoja toistettavien koodien avulla ja .

Tätä blogia varten suosittelen, että hankit CSV- tiedoston koko ajan ja tuot sen LuckyTemplatesille. Näytän myös, kuinka voimme tuoda tämän CSV-tiedoston ja sijoittaa sen suoraan LuckyTemplatesiin siltä varalta, että sinun on tehtävä se.

Sisällysluettelo

CSV-tiedoston hakeminen LuckyTemplatesissa

Jos haluat tuoda CSV-tiedoston LuckyTemplatesille, sinun on ensin napsautettava Koti-nauhan Hae tiedot -valikkoa .

Python-tietojoukko: Toistettavien koodien käyttäminen

Napsautuksen jälkeen avattava valikko tulee näkyviin ja sinun on valittava valikosta teksti/CSV -vaihtoehto.

Python-tietojoukko: Toistettavien koodien käyttäminen

Kun olet valinnut " Teksti/CSV " -vaihtoehdon, avautuu ikkuna, jossa voimme valita tiedoston, jonka haluamme tuoda LuckyTemplatesiin. Tässä esimerkissä käytetään IMDB Dataset -tiedostoa. 

Python-tietojoukko: Toistettavien koodien käyttäminen

Kun avaat IMDB Dataset.csv- tiedoston, näet toisen ikkunan, joka näyttää tiedoston sisältämät tiedot. Koska tämä tiedosto sisältää suuren määrän tietoa, se esikatselee vain osaa tiedoista.

Ensimmäinen asia, jonka aiomme tehdä tässä tiedostossa, on muuttaa se. Voit tehdä sen napsauttamalla " Muunna tiedot " -vaihtoehtoa ikkunan oikeassa alakulmassa.

Python-tietojoukko: Toistettavien koodien käyttäminen

Kopion tekeminen Python-tietojoukosta

Ennen kuin teemme muutoksia tähän tietojoukkoon, on tärkeää tehdä kopio alkuperäisestä tietojoukosta. Voit tehdä tämän napsauttamalla tietojoukkoa hiiren kakkospainikkeella. 

Python-tietojoukko: Toistettavien koodien käyttäminen

Valitse sitten valikosta " Kopioi ".

Python-tietojoukko: Toistettavien koodien käyttäminen

Napsauta lopuksi hiiren kakkospainikkeella Kyselyt- paneelia ja valitse sitten vaihtoehdoista " Liitä ".

Python-tietojoukko: Toistettavien koodien käyttäminen

Kun olet suorittanut nämä vaiheet, sinulla pitäisi olla kopio alkuperäisestä IMDB-tietojoukosta Kyselyt- paneelissa .

Python-tietojoukko: Toistettavien koodien käyttäminen

Tietojoukon muuntaminen suorittamalla Python-komentosarja

Muuttamalla CSV-tiedoston voit pilkkoa suuria määriä Python-tietojoukkoja pienemmiksi. Voimme tehdä sen käyttämällä jotain Python-komentosarjaa tähän tiedostoon.

Mutta ensin meidän on varmistettava, että otsikot on asetettu oikein. Napsauta Koti -valikkoa ja etsi sitten " Käytä ensimmäistä riviä otsikoina " -vaihtoehto ja napsauta sitä.

Python-tietojoukko: Toistettavien koodien käyttäminen

Kun olet napsauttanut " Käytä ensimmäistä riviä otsikoina " -vaihtoehtoa, otsikot muuttuivat aiempien ensimmäisten rivien tiedoiksi, jotka ovat " arvostelu " ja " tunne ".

Python-tietojoukko: Toistettavien koodien käyttäminen

Siirry seuraavaksi Muunna -valikkoon ja napsauta " Suorita Python-skripti " -vaihtoehtoa " Skriptit " -asetusryhmässä.

Python-tietojoukko: Toistettavien koodien käyttäminen

Sen jälkeen " Suorita Python Script " -ikkuna avautuu. Tässä ikkunassa voit suorittaa minkä tahansa Python-komentosarjan muuttaaksesi nykyisen käyttämäsi tiedoston. Tässä esimerkissä aion pienentää tietojoukon suorittamalla seuraavan koodin.

Python-tietojoukko: Toistettavien koodien käyttäminen

Käytin tietojoukon .iloc- funktiota valitakseni tietyt rivit ja sarakkeet IMDB-tietojoukosta. Sitten valitsin parametreista kaikki ensimmäiset 500 riviä ja kaikki sarakkeet IMDB-tietojoukosta. Tallensin sen muuttujaan nimeltä " datasarja ".

Skriptin suorittamisen jälkeen meidän pitäisi nähdä "tietojoukko", joka on muuttuja, jonka loimme edellisessä vaiheessa. Se sisältää tiedot, joita olemme muuttaneet Python-skriptillä.

Python-tietojoukko: Toistettavien koodien käyttäminen

Tietojoukon tarkistaminen

Avaa tietojoukkotaulukko napsauttamalla Arvo- sarakkeen alla olevaa Taulukko - kohtaa .

Python-tietojoukko: Toistettavien koodien käyttäminen

Voimme nähdä, että tämä tietojoukko on nyt 500 riviä .

Python-tietojoukko: Toistettavien koodien käyttäminen

Nyt kun olemme jakaneet tietojoukkomme 500 riviin, seuraavaksi aiomme tuoda tarvitsemamme kirjastot. Teemme sen samalla menettelyllä kuin muutimme IMDB-tietojoukon sisältöä. Tällä varmistetaan, että koodimme on hallittavissa tietyissä skenaarioissa vähemmällä muutoksilla.

Kirjastojen ja funktioiden tuominen toistettavien koodien avulla

Tuodaksesi kirjastot, palataan muistikirjaamme ja kopioidaan tarvitsemamme kirjastot. Muista, että ennen tätä opetusohjelmaa olen jo luonut nämä kirjastot, jotka olemme kopioimassa. Käytän näitä vain uudelleen, jotta saat selkeän käsityksen funktioiden käytöstä toistettavissa olevina koodeina.

Python-tietojoukko: Toistettavien koodien käyttäminen

Kun kirjastot on kopioitu, liitä ne " Suorita komentosarja " -ikkunaan ja älä unohda lisätä riviä " from collections import Counter " skriptin loppuun. 

Python-tietojoukko: Toistettavien koodien käyttäminen

Sitten kopioimme tietojen puhdistustoiminnon muistikirjastamme ja lisäämme sen LuckyTemplatesin skriptiin.

Python-tietojoukko: Toistettavien koodien käyttäminen

Lisäämme sen kirjastojen alle. 

Python-tietojoukko: Toistettavien koodien käyttäminen

Kopioimme myös koodin juuri lisäämämme funktion kutsumiseksi.

Python-tietojoukko: Toistettavien koodien käyttäminen

Liitä se sitten Python-skriptiin LuckyTemplatesissa.

Python-tietojoukko: Toistettavien koodien käyttäminen

Datataulukoiden luominen

Nyt kun olemme lisänneet koodin funktion kutsua varten, meidän on muutettava " df2 " muotoon " datasarja " ja " otsikko " arvoksi " tarkistus ". Teimme tämän tietoaineistoon tekemiemme muutosten vuoksi.

Muutimme "df2":ksi " datajoukon ", koska tallensimme 500 rivin tiedot "tietojoukkoon". Sitten "otsikko" päivitimme sen arvoksi "arvostelu" sarakkeiden otsikoiden muuttamisen seurauksena.

Kun nämä koodit on lisätty, meidän pitäisi pystyä saamaan tai luomaan 3 taulukkoa, jotka ovat data1 sanan taajuudelle, data2 bittitaajuudelle ja data3 trigrammien taajuudelle.

Python-tietojoukko: Toistettavien koodien käyttäminen

Voit myös tehdä uuden kopion tästä muutetusta IMDB-tietojoukosta (2) avataksesi toisen taulukon myöhemmin.

Python-tietojoukko: Toistettavien koodien käyttäminen

Avataan nyt IMDB-tietojoukossa (2) data1 - taulukko

Python-tietojoukko: Toistettavien koodien käyttäminen

 Kun data1-taulukko on avattu, voimme nähdä sanaluettelon sekä esiintymistiheyden.

Python-tietojoukko: Toistettavien koodien käyttäminen

Kuten näet, voimme suorittaa tiettyjä toimenpiteitä päätietojoukosta käyttämällä toistettavia koodeja, jotka otimme Jupyter-muistikirjasta. Näiden toistettavien koodien avulla pystymme muuttamaan Python-tietojoukon ja luomaan taulukon sanan taajuudelle, bigrammin taajuudelle ja trigrammitaajuudelle kirjoittamatta koodeja uudestaan.

Avataan IMDB- tietojoukossa (3) data2-taulukko nähdäksesi bigg-taajuus.

Python-tietojoukko: Toistettavien koodien käyttäminen

Bigg-taajuustaulukossa näet luettelossa olevan " br ". Tämä on luultavasti yhdistetty HTML-koodiin. Voimme yksinkertaisesti palata takaisin ja lisätä jotain muuta, mutta emme aio tehdä sitä tässä opetusohjelmassa.

Nyt kun tiedot on ladattu toistettavien koodien avulla, voimme alkaa tehdä niistä visualisointeja LuckyTemplatesissa. Esimerkiksi a kunkin sanan tiheydelle. 

Python-tietojoukko: Toistettavien koodien käyttäminen




Johtopäätös

Yhteenvetona voidaan todeta, että toistettavat koodit voivat auttaa sinua suorittamaan tiettyjä toimenpiteitä tietojoukolle pienemmällä vaivalla. Olet oppinut käyttämään toistettavia koodeja Python-tietojoukon muuntamiseen LuckyTemplatesissa. Pystyit myös käyttämään .iloc -funktiota määrittämään rivit ja sarakkeet, jotka valitaan tietojoukkoa muuttaessa.

Lisäksi olet luonut kopioita tietojoukoista ja luonut visualisoinnin pylväsdiagrammin avulla. Tämä visualisointi perustuu Python-tietosarjoihin, joita olemme luoneet ja muuttaneet toistettavien koodien avulla.

Kaikki parhaat,

Gaellim


Päivämäärätaulukon luominen LuckyTemplatesissa

Päivämäärätaulukon luominen LuckyTemplatesissa

Ota selvää, miksi LuckyTemplatesissa on tärkeää pitää oma päivämäärätaulukko ja opi nopein ja tehokkain tapa tehdä se.

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

Tämä lyhyt opetusohjelma korostaa LuckyTemplates-mobiiliraportointiominaisuutta. Näytän sinulle, kuinka voit kehittää raportteja tehokkaasti mobiililaitteille.

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Tässä LuckyTemplates Showcase -esittelyssä käymme läpi raportteja, jotka näyttävät ammattitaitoisen palveluanalytiikan yritykseltä, jolla on useita sopimuksia ja asiakkaiden sitoumuksia.

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Käy läpi tärkeimmät Power Appsin ja Power Automaten päivitykset sekä niiden edut ja vaikutukset Microsoft Power Platformiin.

Yleiset SQL-funktiot: Yleiskatsaus

Yleiset SQL-funktiot: Yleiskatsaus

Tutustu joihinkin yleisiin SQL-toimintoihin, joita voimme käyttää, kuten merkkijono, päivämäärä ja joitain lisätoimintoja tietojen käsittelyyn tai käsittelyyn.

LuckyTemplates-mallin luominen: opas ja vinkkejä

LuckyTemplates-mallin luominen: opas ja vinkkejä

Tässä opetusohjelmassa opit luomaan täydellisen LuckyTemplates-mallin, joka on määritetty tarpeidesi ja mieltymystesi mukaan.

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Tässä blogissa esittelemme, kuinka kerrostat kenttäparametreja pienillä kerroilla uskomattoman hyödyllisten näkemysten ja visuaalien luomiseksi.

LuckyTemplates-sijoitus ja mukautettu ryhmittely

LuckyTemplates-sijoitus ja mukautettu ryhmittely

Tässä blogissa opit käyttämään LuckyTemplates-sijoitus- ja mukautettuja ryhmittelyominaisuuksia näytetietojen segmentoimiseen ja luokitteluun kriteerien mukaan.

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

Tässä opetusohjelmassa käsittelen tiettyä tekniikkaa, jolla voit näyttää kumulatiivisen kokonaissumman LuckyTemplates-visuaaleissasi vain tiettyyn päivämäärään asti.

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Opi luomaan ja mukauttamaan Bullet-kaavioita LuckyTemplatesissa, joita käytetään pääasiassa suorituskyvyn mittaamiseen suhteessa tavoitteeseen tai edellisiin vuosiin.