Aikasarjatiedot Pandaissa

Tässä opetusohjelmassa opit ottamaan uudelleen näytteitä aikasarjan tiedoista Pandan avulla. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta .

Mikä tämä uudelleennäytteenoton idea on? Tämä liittyy aikasarjatietoihin, ja muutamme tietojen raportointitiheyttä. Esimerkiksi vuosittaisen arvon muuttaminen kuukausittain tai viikoittain tai tuntitietojen muuttaminen päivittäisiksi. Lyhyesti sanottuna, muutamme tasoa hierarkiassa.

Tätä voidaan käyttää useista syistä, kuten luotettavampien trendien , otoskokojen ja kausiluonteisuuden saamiseksi . Joissakin raporteissa on järkevämpää, jos käytämme jotakin hierarkian tasoa verrattuna toiseen.

Lisäksi uudelleennäytteenotto voi auttaa, jos sinulla on erilaisia ​​tietolähteitä ja sinun on suoritettava aikasarjatietojen yhdistäminen. Tämä auttaa myös silloin, kun käsitellään .

Aikasarjatiedot Pandaissa

Tämän erittelyn lisäämiseksi käytämme ala- ja ylösnäytteistystä.

Alasnäytteenoton tarkoituksena on vähentää raportointitiheyttä . Se voi olla esimerkiksi muuntaminen sekunnista tuntiin, jotta arvot olisivat pienempiä, tai otoksen alentaminen kuukaudesta neljännekseen.

Toisaalta näytteenotto lisää raportointitiheyttä kuukausitasolta päivään . Tästä saamme lisää esimerkkejä myöhemmin.

Aikasarjatiedot Pandaissa

Sisällysluettelo

Kuinka ottaa uudelleen näyte aikasarjan tiedoista Pandan avulla

Kuinka aiomme tehdä tämän Pandasissa?

Ensinnäkin muutamme . Tämän jälkeen voimme ottaa näytteen ylös käyttämällä interpolaatiota, joka täyttää arvot, ja alasnäytteenottoa, jotta voimme kerätä arvot yhteen.

Aikasarjatiedot Pandaissa

Siirrytään Jupyter Notebook Pythoniin ja tarkistetaan tämä Pandan kanssa.

Aluksi käytämme Pandaa kirjoittamalla import pandat muodossa pd , jonka jälkeen visualisoimaan sen ja tuoda matplotlib.pyplot muodossa plt muokataksesi .

Seuraava asia on saada tiedot vega_datasets - tuontitiedoista . Se on mukava paikka saada näytelähteitä. Lisäksi saamme sp = data.sp500 ( ) ja sp.head ( ) kirjaston .

Aikasarjatiedot Pandaissa

Tässä ovat tietomme tähän mennessä. Meillä on päivittäiset palautukset ja hinta jokaiselle päivälle.

Aikasarjatiedot Pandaissa

Aseta indeksin päivämääräsarake kirjoittamalla sp.set_index(['date'], inplace=True) ja kutsu sitten uudelleen sp.head .

Aikasarjatiedot Pandaissa

Upsamplingin käyttö arvojen saamiseksi

Käytä sitten ylösnäytteistystä saadaksesi lisää arvoja. Koska meillä on tiedot jokaisesta päivästä, voimme siirtyä tuntiin käyttämällä yksinkertaisinta funktiota, joka on sp [['hinta']]. resample ('H').ffill ( ) , ja suorita se. H tarkoittaa tuntia, M kuukautta, D päivää ja niin edelleen. Saat lisätietoja tästä Pandasin dokumentaatiosta .

Kuten näemme, 1. tammikuuta keskiyöllä hinta on 1394,46, sama kuin seuraavat ajat klo 1.00-04.00. Toinen esimerkki on tammikuun 2. päivä, jolloin päätöskurssi on 1366,42.

Aikasarjatiedot Pandaissa

On olemassa muita tapoja tehdä tämä, vaikka arvo ei olisi käytettävissä tuntitasolla. Lisäksi on olemassa kehittyneempiä tapoja kuin pelkkä täyttö eteenpäin . Esimerkkimme tapauksessa se, mitä teimme, on perustapa tehdä upsampling-interpolointi.

Seuraavaksi siirrytään alasnäytteenottoon kirjoittamalla avg_month = sp [['price]].resample ('M').mean ( ) , sitten avg_month.head ( ) ja suorita se tarkistaaksesi.

Kuten kuvasta, voimme nähdä kunkin kuukauden viimeisen päivän ja keskihinnan. Voimme pienentää näytteitä niin, että niillä on vähemmän arvoja, tai niin sanottua supistamista.

Aikasarjatiedot Pandaissa

Tämän visualisoimiseksi kirjoitetaan piirretyt mitat uudelleen. Sen jälkeen sns.lineplot . Viivakaavio toimii paremmin pidemmällä X-akselilla, kun taas Y-arvo on keskimääräinen kuukausihinta.

Suorita tämä, jotta näet kuukauden keskihinnan piirrettynä.

Aikasarjatiedot Pandaissa

Jälleen kerran voimme tehdä tämän monella eri tavalla. Jos esimerkiksi haluamme tietää alimman neljänneshinnan, meidän tarvitsee vain kirjoittaa quarter_low ja sitten quarter_low.head suorittaaksesi sen.

Joten siellä voimme nyt nähdä neljännesvuosittaisen alimman arvon jokaiselta vuosineljännekseltä. Näin teet uudelleennäytteen.

Aikasarjatiedot Pandaissa




Johtopäätös

Pandat on todella suunniteltu uudelleennäytteenottoa ja aikasarjojen dataa varten . Jos työskentelet aikasarjatietojen parissa ja niiden tarkkuus on erilainen, uudelleennäytteenotto voi olla erittäin hyödyllistä.

Lisäksi muista lukea Pandas-dokumentaatio uudelleennäytteenottomenetelmästä oppiaksesi monia erilaisia ​​tapoja tehdä tämä. Tarkastelimme perusasioita, mutta voit tehdä esimerkiksi kahdesti viikossa, kuukauden viimeisenä työpäivänä ja muita vaihtoehtoja uudelleennäytteenottoon.

Kaikki parhaat,

George Mount


Päivämäärätaulukon luominen LuckyTemplatesissa

Päivämäärätaulukon luominen LuckyTemplatesissa

Ota selvää, miksi LuckyTemplatesissa on tärkeää pitää oma päivämäärätaulukko ja opi nopein ja tehokkain tapa tehdä se.

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

LuckyTemplates mobiiliraportointivinkkejä ja -tekniikoita

Tämä lyhyt opetusohjelma korostaa LuckyTemplates-mobiiliraportointiominaisuutta. Näytän sinulle, kuinka voit kehittää raportteja tehokkaasti mobiililaitteille.

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Ammattimainen palveluanalyysiraportit LuckyTemplatesissa

Tässä LuckyTemplates Showcase -esittelyssä käymme läpi raportteja, jotka näyttävät ammattitaitoisen palveluanalytiikan yritykseltä, jolla on useita sopimuksia ja asiakkaiden sitoumuksia.

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Microsoft Power Platform -päivitykset | Microsoft Ignite 2021

Käy läpi tärkeimmät Power Appsin ja Power Automaten päivitykset sekä niiden edut ja vaikutukset Microsoft Power Platformiin.

Yleiset SQL-funktiot: Yleiskatsaus

Yleiset SQL-funktiot: Yleiskatsaus

Tutustu joihinkin yleisiin SQL-toimintoihin, joita voimme käyttää, kuten merkkijono, päivämäärä ja joitain lisätoimintoja tietojen käsittelyyn tai käsittelyyn.

LuckyTemplates-mallin luominen: opas ja vinkkejä

LuckyTemplates-mallin luominen: opas ja vinkkejä

Tässä opetusohjelmassa opit luomaan täydellisen LuckyTemplates-mallin, joka on määritetty tarpeidesi ja mieltymystesi mukaan.

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Kenttäparametrit ja pienet kertoimet LuckyTemplatesissa

Tässä blogissa esittelemme, kuinka kerrostat kenttäparametreja pienillä kerroilla uskomattoman hyödyllisten näkemysten ja visuaalien luomiseksi.

LuckyTemplates-sijoitus ja mukautettu ryhmittely

LuckyTemplates-sijoitus ja mukautettu ryhmittely

Tässä blogissa opit käyttämään LuckyTemplates-sijoitus- ja mukautettuja ryhmittelyominaisuuksia näytetietojen segmentoimiseen ja luokitteluun kriteerien mukaan.

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

LuckyTemplatesissa näytetään vain tiettyyn päivämäärään asti kumulatiivinen kokonaissumma

Tässä opetusohjelmassa käsittelen tiettyä tekniikkaa, jolla voit näyttää kumulatiivisen kokonaissumman LuckyTemplates-visuaaleissasi vain tiettyyn päivämäärään asti.

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Bullet Charts: Kehittyneet mukautetut visuaalit LuckyTemplatesille

Opi luomaan ja mukauttamaan Bullet-kaavioita LuckyTemplatesissa, joita käytetään pääasiassa suorituskyvyn mittaamiseen suhteessa tavoitteeseen tai edellisiin vuosiin.