Idősoros adatok Pandákban

Ebből az oktatóanyagból megtudhatja, hogyan lehet újra mintavételezni az idősorok adatait a Pandák használatával. Az oktatóanyag teljes videóját a blog alján tekintheti meg .

Mi az újramintavételezés ötlete? Ez az idősoros adatokkal kapcsolatos, és amit meg fogunk tenni, az az, hogy megváltoztatjuk az adatok jelentésének gyakoriságát. Például az éves érték havi vagy heti értékre, vagy az óránkénti adatok napira történő módosítása. Röviden, megváltoztatjuk a hierarchia szintjét.

Ez számos okból használható, például megbízhatóbb trendek , mintaméretek és szezonalitás érdekében . Egyes jelentéseknél sokkal értelmesebb, ha a hierarchia valamely szintjét használjuk a másikkal szemben.

Ezenkívül az újramintavétel segíthet abban az esetben, ha különböző adatforrásokkal rendelkezik, és össze kell kapcsolnia az idősoros adatokat. Ez akkor is segít, ha a .

Idősoros adatok Pandákban

Ennek további bontásához le- és felmintavételezést alkalmazunk.

A mintavételezés csökkenti a jelentéskészítés gyakoriságát . Ilyen lehet például a másodpercről egy órára való átalakítás annak érdekében, hogy kevesebb értéket kapjunk, vagy a mintavételezés hónapról negyedévre.

Másrészt a mintavételezés a jelentések gyakoriságának növelésére szolgál a hónapról a napra . Erre később több példát is hozunk.

Idősoros adatok Pandákban

Tartalomjegyzék

Hogyan lehet újra mintavételezni az idősoros adatokat pandákkal

Hogyan fogjuk ezt megtenni Pandákban?

Először is megváltoztatjuk a . Ezután interpolációval felfelé mintavételezhetünk, amely kitölti az értékeket, és lemintázhatjuk az értékek összesítésével.

Idősoros adatok Pandákban

Menjünk át a Jupyter Notebook Pythonra, és nézzük meg ezt a Pandákkal.

Kezdetben a Pandákat úgy fogjuk használni, hogy beírjuk az import pandas parancsot pd néven , majd az import seaborn as sns parancsot a megjelenítéshez, és a matplotlib.pyplot mint plt parancsot a testreszabásához.

A következő teendő az, hogy lekérjük az adatokat a vega_datasets importált adatokból . Ez egy jó hely mintaforrások beszerzésére. Ezenkívül kapunk sp = data.sp500 ( ) és sp.head ( ) könyvtárat .

Idősoros adatok Pandákban

Íme az eddigi adataink. Megvan a napi visszaküldés és az ár minden napra.

Idősoros adatok Pandákban

Az index dátum oszlopra állításához írja be az sp.set_index(['dátum'], inplace=True), majd hívja meg újra az sp.head parancsot .

Idősoros adatok Pandákban

Felmintavételezés használata értékek lekéréséhez

Ezután, hogy több értékünk legyen, használjunk felmintavételezést. Mivel minden napra vonatkozóan rendelkezünk adatokkal, a legegyszerűbb függvénnyel, amely az sp [['ár']], lemehetünk az órára . resample ('H').ffill ( ) , majd futtassa. A H az órát, az M a hónapot, a D a napot és így tovább. Erről többet megtudhat a Pandas dokumentációjában .

Mint látjuk, január 1-jén éjfélkor az ár 1394,46, megegyezik a következő órákkal 1:00 és 4:00 óra között. Egy másik példa január 2-án, ahol a záróár 1366,42.

Idősoros adatok Pandákban

Ennek más módjai is vannak, még akkor is, ha az érték nem érhető el óra szinten. Ezenkívül vannak kifinomultabb módszerek is, mint az előre történő kitöltés . Példánkban, amit mi tettünk, az a felmintavételezési interpoláció alapvető módja.

Ezután menjünk a lefelé mintavételezéshez úgy, hogy beírjuk az avg_month = sp [['price]].resample ('M').mean ( ) , majd avg_month.head ( ) parancsot , és futtassuk le az ellenőrzéshez.

Az ábrán látható módon minden hónap utolsó napját és az átlagárat láthatjuk. Csökkenthetjük a mintákat, hogy kevesebb értéket kapjanak, vagy amit leépítésnek nevezünk.

Idősoros adatok Pandákban

Ennek megjelenítéséhez írjuk be, hogy újrarajzolja a megrajzolt méreteket. Ezután az sns.lineplot követi . A vonalábra jobban működik egy hosszabb X-tengellyel, míg az Y érték a havi átlagár.

A havi átlagár megjelenítéséhez futtassuk le ezt.

Idősoros adatok Pandákban

Ismét sokféleképpen tehetjük ezt meg. Például, ha meg akarjuk tudni a legalacsonyabb negyedéves árat, csak be kell írnunk a quarter_low , majd a quarter_low.head parancsot a futtatáshoz.

Így most láthatjuk az egyes negyedévekben talált negyedéves legalacsonyabb értéket. Így kell újramintát venni.

Idősoros adatok Pandákban




Következtetés

Mindezt a Pandas valóban újramintavételezésre és idősoros adatokra készült . Ha idősoros adatokkal dolgozik, és eltérő részletességgel rendelkezik, az újramintavételezés nagyon hasznos lehet.

Ezenkívül feltétlenül olvassa el a Pandas dokumentációját az újramintavételi módszerről, hogy megtudja ennek sokféle módját. Megnéztük az alapszintűeket, de olyan dolgokat is megtehet, mint kéthetente, a hónap utolsó munkanapján, és több lehetőség az újramintavételezésre.

Minden jót,

George Mount


A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

Ismerje meg, hogyan töltheti le és telepítheti a DAX Studio és a Tabular Editor 3 alkalmazást, és hogyan konfigurálhatja őket a LuckyTemplates és az Excel programban való használatra.

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

Ez a blog tartalmazza a Shape Map vizualizációt a LuckyTemplates térbeli elemzéséhez. Megmutatom, hogyan használhatja hatékonyan ezt a vizualizációt annak funkcióival és elemeivel.

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

Ebben az oktatóanyagban egy egyedülálló ötletet mutatok be a pénzügyi jelentésekkel kapcsolatban, amely az eredmények hozzárendelését jelenti a LuckyTemplates-en belüli táblázatsablonok előre meghatározásához.

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

Hozzon létre DAX-mértékeket a LuckyTemplates alkalmazásban meglévő mértékek vagy képletek használatával. Ezt nevezem mértékelágazási technikának.

A legerősebb funkcióhívás a LuckyTemplatesben

A legerősebb funkcióhívás a LuckyTemplatesben

Ebben a blogban fedezze fel a LuckyTemplates adatkészletet, a leghatékonyabb függvényhívást, amely M- és DAX-függvények ezreit juttatja a keze ügyébe.

Adatmodellezési technikák a DAX-mérések megszervezéséhez

Adatmodellezési technikák a DAX-mérések megszervezéséhez

A mai oktatóanyagban megosztok néhány adatmodellezési technikát a DAX-mérések jobb rendszerezéséhez a hatékonyabb munkafolyamat érdekében.

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

A LuckyTemplates egy nagyszerű eszköz a pénzügyi jelentésekhez. Itt található egy oktatóanyag, amely bemutatja, hogyan hozhat létre személyre szabott táblázatokat a LuckyTemplates pénzügyi irányítópultjához.

A Power Query nyelvi folyamatának bevált gyakorlatai

A Power Query nyelvi folyamatának bevált gyakorlatai

Ez az oktatóanyag megvitatja a Power Query nyelvi folyamatot, és azt, hogyan segíthet zökkenőmentes és hatékony adatjelentések létrehozásában.

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

Az egyik kedvenc technikámról fogok beszélni a LuckyTemplates egyéni ikonok körül, amely dinamikusan használja az egyéni ikonokat a LuckyTemplates vizualizációkban.

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

Ebben a blogban megmutatom, hogyan hozhat létre LuckyTemplates táblázatokat olyan képlet segítségével, amely egyesíti az UNION és a ROW függvényt.