Aikasarjatiedot Pandaissa

Tässä opetusohjelmassa opit ottamaan uudelleen näytteitä aikasarjan tiedoista Pandan avulla. Voit katsoa tämän opetusohjelman koko videon tämän blogin alaosasta .

Mikä tämä uudelleennäytteenoton idea on? Tämä liittyy aikasarjatietoihin, ja muutamme tietojen raportointitiheyttä. Esimerkiksi vuosittaisen arvon muuttaminen kuukausittain tai viikoittain tai tuntitietojen muuttaminen päivittäisiksi. Lyhyesti sanottuna, muutamme tasoa hierarkiassa.

Tätä voidaan käyttää useista syistä, kuten luotettavampien trendien , otoskokojen ja kausiluonteisuuden saamiseksi . Joissakin raporteissa on järkevämpää, jos käytämme jotakin hierarkian tasoa verrattuna toiseen.

Lisäksi uudelleennäytteenotto voi auttaa, jos sinulla on erilaisia ​​tietolähteitä ja sinun on suoritettava aikasarjatietojen yhdistäminen. Tämä auttaa myös silloin, kun käsitellään .

Aikasarjatiedot Pandaissa

Tämän erittelyn lisäämiseksi käytämme ala- ja ylösnäytteistystä.

Alasnäytteenoton tarkoituksena on vähentää raportointitiheyttä . Se voi olla esimerkiksi muuntaminen sekunnista tuntiin, jotta arvot olisivat pienempiä, tai otoksen alentaminen kuukaudesta neljännekseen.

Toisaalta näytteenotto lisää raportointitiheyttä kuukausitasolta päivään . Tästä saamme lisää esimerkkejä myöhemmin.

Aikasarjatiedot Pandaissa

Sisällysluettelo

Kuinka ottaa uudelleen näyte aikasarjan tiedoista Pandan avulla

Kuinka aiomme tehdä tämän Pandasissa?

Ensinnäkin muutamme . Tämän jälkeen voimme ottaa näytteen ylös käyttämällä interpolaatiota, joka täyttää arvot, ja alasnäytteenottoa, jotta voimme kerätä arvot yhteen.

Aikasarjatiedot Pandaissa

Siirrytään Jupyter Notebook Pythoniin ja tarkistetaan tämä Pandan kanssa.

Aluksi käytämme Pandaa kirjoittamalla import pandat muodossa pd , jonka jälkeen visualisoimaan sen ja tuoda matplotlib.pyplot muodossa plt muokataksesi .

Seuraava asia on saada tiedot vega_datasets - tuontitiedoista . Se on mukava paikka saada näytelähteitä. Lisäksi saamme sp = data.sp500 ( ) ja sp.head ( ) kirjaston .

Aikasarjatiedot Pandaissa

Tässä ovat tietomme tähän mennessä. Meillä on päivittäiset palautukset ja hinta jokaiselle päivälle.

Aikasarjatiedot Pandaissa

Aseta indeksin päivämääräsarake kirjoittamalla sp.set_index(['date'], inplace=True) ja kutsu sitten uudelleen sp.head .

Aikasarjatiedot Pandaissa

Upsamplingin käyttö arvojen saamiseksi

Käytä sitten ylösnäytteistystä saadaksesi lisää arvoja. Koska meillä on tiedot jokaisesta päivästä, voimme siirtyä tuntiin käyttämällä yksinkertaisinta funktiota, joka on sp [['hinta']]. resample ('H').ffill ( ) , ja suorita se. H tarkoittaa tuntia, M kuukautta, D päivää ja niin edelleen. Saat lisätietoja tästä Pandasin dokumentaatiosta .

Kuten näemme, 1. tammikuuta keskiyöllä hinta on 1394,46, sama kuin seuraavat ajat klo 1.00-04.00. Toinen esimerkki on tammikuun 2. päivä, jolloin päätöskurssi on 1366,42.

Aikasarjatiedot Pandaissa

On olemassa muita tapoja tehdä tämä, vaikka arvo ei olisi käytettävissä tuntitasolla. Lisäksi on olemassa kehittyneempiä tapoja kuin pelkkä täyttö eteenpäin . Esimerkkimme tapauksessa se, mitä teimme, on perustapa tehdä upsampling-interpolointi.

Seuraavaksi siirrytään alasnäytteenottoon kirjoittamalla avg_month = sp [['price]].resample ('M').mean ( ) , sitten avg_month.head ( ) ja suorita se tarkistaaksesi.

Kuten kuvasta, voimme nähdä kunkin kuukauden viimeisen päivän ja keskihinnan. Voimme pienentää näytteitä niin, että niillä on vähemmän arvoja, tai niin sanottua supistamista.

Aikasarjatiedot Pandaissa

Tämän visualisoimiseksi kirjoitetaan piirretyt mitat uudelleen. Sen jälkeen sns.lineplot . Viivakaavio toimii paremmin pidemmällä X-akselilla, kun taas Y-arvo on keskimääräinen kuukausihinta.

Suorita tämä, jotta näet kuukauden keskihinnan piirrettynä.

Aikasarjatiedot Pandaissa

Jälleen kerran voimme tehdä tämän monella eri tavalla. Jos esimerkiksi haluamme tietää alimman neljänneshinnan, meidän tarvitsee vain kirjoittaa quarter_low ja sitten quarter_low.head suorittaaksesi sen.

Joten siellä voimme nyt nähdä neljännesvuosittaisen alimman arvon jokaiselta vuosineljännekseltä. Näin teet uudelleennäytteen.

Aikasarjatiedot Pandaissa




Johtopäätös

Pandat on todella suunniteltu uudelleennäytteenottoa ja aikasarjojen dataa varten . Jos työskentelet aikasarjatietojen parissa ja niiden tarkkuus on erilainen, uudelleennäytteenotto voi olla erittäin hyödyllistä.

Lisäksi muista lukea Pandas-dokumentaatio uudelleennäytteenottomenetelmästä oppiaksesi monia erilaisia ​​tapoja tehdä tämä. Tarkastelimme perusasioita, mutta voit tehdä esimerkiksi kahdesti viikossa, kuukauden viimeisenä työpäivänä ja muita vaihtoehtoja uudelleennäytteenottoon.

Kaikki parhaat,

George Mount


Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Kuinka asentaa DAX Studio & Tabular Editor LuckyTemplatesissa

Opi lataamaan ja asentamaan DAX Studio ja Tabular Editor 3 ja miten ne määritetään käytettäväksi LuckyTemplatesissa ja Excelissä.

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

LuckyTemplates -muotokartan visualisointi tilaanalyysiin

Tämä blogi sisältää Shape Map -visualisoinnin tilaanalyysiä varten LuckyTemplatesissa. Näytän sinulle, kuinka voit käyttää tätä visualisointia tehokkaasti sen ominaisuuksien ja elementtien kanssa.

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

LuckyTemplatesin talousraportointi: tulosten kohdentaminen malleihin jokaisella rivillä

Tässä opetusohjelmassa esittelen ainutlaatuisen idean talousraportoinnista, joka allokoi tulokset LuckyTemplatesin sisällä olevien taulukkopohjien ennalta määrittämiseen.

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

DAX-mittaukset LuckyTemplatesissa käyttämällä mittahaaroitusta

Luo DAX-suureita LuckyTemplatesissa käyttämällä olemassa olevia suureita tai kaavoja. Tätä kutsun mittahaaroitustekniikaksi.

Tehokkain toimintopuhelu LuckyTemplatesissa

Tehokkain toimintopuhelu LuckyTemplatesissa

Tässä blogissa tutustu LuckyTemplates-tietojoukkoon, tehokkaimpaan funktiokutsuun, joka tuo tuhansia M- ja DAX-funktioita sormiesi ulottuville.

Datamallinnustekniikat DAX-mittausten järjestämiseen

Datamallinnustekniikat DAX-mittausten järjestämiseen

Tämän päivän opetusohjelmassa jaan muutamia datamallinnustekniikoita DAX-mittausten järjestämiseksi paremmin tehokkaamman työnkulun aikaansaamiseksi.

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates Financial Dashboard: Täydelliset taulukon mukautusvinkit

LuckyTemplates on loistava työkalu talousraportointiin. Tässä on opetusohjelma räätälöityjen taulukoiden luomisesta LuckyTemplates-talouden hallintapaneelillesi.

Power Queryn kielivirran parhaat käytännöt

Power Queryn kielivirran parhaat käytännöt

Tässä opetusohjelmassa keskustellaan Power Query Language Flowsta ja siitä, kuinka se voi auttaa luomaan sujuvan ja tehokkaan dataraportin.

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

LuckyTemplates mukautetut kuvakkeet | PBI-visualisointitekniikka

Keskustelen yhdestä suosikkitekniikoistani mukautettujen LuckyTemplates-kuvakkeiden ympärillä, joka käyttää mukautettuja kuvakkeita dynaamisella tavalla LuckyTemplates-visuaaleissa.

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

LuckyTemplates -taulukoiden luominen UNION & ROW -funktiolla

Tässä blogissa näytän sinulle, kuinka voit luoda LuckyTemplates-taulukoita käyttämällä kaavaa, joka yhdistää UNION-funktion ja ROW-funktion.