Idősoros adatok Pandákban

Ebből az oktatóanyagból megtudhatja, hogyan lehet újra mintavételezni az idősorok adatait a Pandák használatával. Az oktatóanyag teljes videóját a blog alján tekintheti meg .

Mi az újramintavételezés ötlete? Ez az idősoros adatokkal kapcsolatos, és amit meg fogunk tenni, az az, hogy megváltoztatjuk az adatok jelentésének gyakoriságát. Például az éves érték havi vagy heti értékre, vagy az óránkénti adatok napira történő módosítása. Röviden, megváltoztatjuk a hierarchia szintjét.

Ez számos okból használható, például megbízhatóbb trendek , mintaméretek és szezonalitás érdekében . Egyes jelentéseknél sokkal értelmesebb, ha a hierarchia valamely szintjét használjuk a másikkal szemben.

Ezenkívül az újramintavétel segíthet abban az esetben, ha különböző adatforrásokkal rendelkezik, és össze kell kapcsolnia az idősoros adatokat. Ez akkor is segít, ha a .

Idősoros adatok Pandákban

Ennek további bontásához le- és felmintavételezést alkalmazunk.

A mintavételezés csökkenti a jelentéskészítés gyakoriságát . Ilyen lehet például a másodpercről egy órára való átalakítás annak érdekében, hogy kevesebb értéket kapjunk, vagy a mintavételezés hónapról negyedévre.

Másrészt a mintavételezés a jelentések gyakoriságának növelésére szolgál a hónapról a napra . Erre később több példát is hozunk.

Idősoros adatok Pandákban

Tartalomjegyzék

Hogyan lehet újra mintavételezni az idősoros adatokat pandákkal

Hogyan fogjuk ezt megtenni Pandákban?

Először is megváltoztatjuk a . Ezután interpolációval felfelé mintavételezhetünk, amely kitölti az értékeket, és lemintázhatjuk az értékek összesítésével.

Idősoros adatok Pandákban

Menjünk át a Jupyter Notebook Pythonra, és nézzük meg ezt a Pandákkal.

Kezdetben a Pandákat úgy fogjuk használni, hogy beírjuk az import pandas parancsot pd néven , majd az import seaborn as sns parancsot a megjelenítéshez, és a matplotlib.pyplot mint plt parancsot a testreszabásához.

A következő teendő az, hogy lekérjük az adatokat a vega_datasets importált adatokból . Ez egy jó hely mintaforrások beszerzésére. Ezenkívül kapunk sp = data.sp500 ( ) és sp.head ( ) könyvtárat .

Idősoros adatok Pandákban

Íme az eddigi adataink. Megvan a napi visszaküldés és az ár minden napra.

Idősoros adatok Pandákban

Az index dátum oszlopra állításához írja be az sp.set_index(['dátum'], inplace=True), majd hívja meg újra az sp.head parancsot .

Idősoros adatok Pandákban

Felmintavételezés használata értékek lekéréséhez

Ezután, hogy több értékünk legyen, használjunk felmintavételezést. Mivel minden napra vonatkozóan rendelkezünk adatokkal, a legegyszerűbb függvénnyel, amely az sp [['ár']], lemehetünk az órára . resample ('H').ffill ( ) , majd futtassa. A H az órát, az M a hónapot, a D a napot és így tovább. Erről többet megtudhat a Pandas dokumentációjában .

Mint látjuk, január 1-jén éjfélkor az ár 1394,46, megegyezik a következő órákkal 1:00 és 4:00 óra között. Egy másik példa január 2-án, ahol a záróár 1366,42.

Idősoros adatok Pandákban

Ennek más módjai is vannak, még akkor is, ha az érték nem érhető el óra szinten. Ezenkívül vannak kifinomultabb módszerek is, mint az előre történő kitöltés . Példánkban, amit mi tettünk, az a felmintavételezési interpoláció alapvető módja.

Ezután menjünk a lefelé mintavételezéshez úgy, hogy beírjuk az avg_month = sp [['price]].resample ('M').mean ( ) , majd avg_month.head ( ) parancsot , és futtassuk le az ellenőrzéshez.

Az ábrán látható módon minden hónap utolsó napját és az átlagárat láthatjuk. Csökkenthetjük a mintákat, hogy kevesebb értéket kapjanak, vagy amit leépítésnek nevezünk.

Idősoros adatok Pandákban

Ennek megjelenítéséhez írjuk be, hogy újrarajzolja a megrajzolt méreteket. Ezután az sns.lineplot követi . A vonalábra jobban működik egy hosszabb X-tengellyel, míg az Y érték a havi átlagár.

A havi átlagár megjelenítéséhez futtassuk le ezt.

Idősoros adatok Pandákban

Ismét sokféleképpen tehetjük ezt meg. Például, ha meg akarjuk tudni a legalacsonyabb negyedéves árat, csak be kell írnunk a quarter_low , majd a quarter_low.head parancsot a futtatáshoz.

Így most láthatjuk az egyes negyedévekben talált negyedéves legalacsonyabb értéket. Így kell újramintát venni.

Idősoros adatok Pandákban




Következtetés

Mindezt a Pandas valóban újramintavételezésre és idősoros adatokra készült . Ha idősoros adatokkal dolgozik, és eltérő részletességgel rendelkezik, az újramintavételezés nagyon hasznos lehet.

Ezenkívül feltétlenül olvassa el a Pandas dokumentációját az újramintavételi módszerről, hogy megtudja ennek sokféle módját. Megnéztük az alapszintűeket, de olyan dolgokat is megtehet, mint kéthetente, a hónap utolsó munkanapján, és több lehetőség az újramintavételezésre.

Minden jót,

George Mount

Leave a Comment

E-mail melléklet mentése SharePointba a Power Automate segítségével

E-mail melléklet mentése SharePointba a Power Automate segítségével

Ebből a blogból megtudhatja, hogyan mentheti automatikusan az e-mail mellékleteket a SharePointba, majd törölheti az e-maileket a Power Automate segítségével.

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Microsoft LuckyTemplates irányítópult 18 legjobb példája 2023

A Power Automate folyamatok létrehozása a semmiből

A Power Automate folyamatok létrehozása a semmiből

Ismerje meg, hogyan hozhat létre <strong>Power Automate</strong> folyamatokat a semmiből. Sablon használata helyett mi magunk hozzuk létre a kiváltó okokat és a műveleteket.

4 módszer a Pi használatára a Pythonban példákkal

4 módszer a Pi használatára a Pythonban példákkal

4 módszer a Pi használatára a Pythonban példákkal

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Profit and Loss (P&L) kimutatások létrehozása a LuckyTemplates alkalmazásban

Ebben az útmutatóban bemutatom, hogyan lehet Pénzügyi információk mátrixát létrehozni a Profit és veszteség (P&L) kimutatással a LuckyTemplates alkalmazásban.

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Hogyan lehet dinamikusan egyesíteni az oszlopokat egy Power Query-táblázatban

Fedezze fel, hogyan lehet dinamikusan egyesíteni oszlopokat a Power Query Table.CombineColumns függvény segítségével.

SharePoint-fájlok hozzáadása a számítógéphez

SharePoint-fájlok hozzáadása a számítógéphez

Ismerje meg, hogyan adhatjuk hozzá és szinkronizálhatjuk SharePoint-fájljainkat az asztalon és a OneDrive-on.

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.