Python adatkészlet: Ismételhető kódok alkalmazása

Ebből a blogból megtudhatja, hogyan alkalmazhat megismételhető kódokat vagy függvényeket azonos típusú kimenetek előállítására. Ez segít hatékonyabbá tenni, és kevesebb erőfeszítést tesz bizonyos adatok különböző adatkészletekből való előhívása során. Ebben az oktatóanyagban egy létező kódot fogunk használni, amelyet korábban készítettem példaként.

Azt is megtudhatja, hogyan készíthet másolatokat az adatkészletekről, hogy elkerülje az adatkészlet eredeti verziójának károsodását, hogyan importálhat könyvtárakat és függvényeket ismételhető kódok használatával, valamint .

Ehhez a bloghoz azt javaslom, hogy mindig szerezze be a CSV- fájlt, és vigye át a LuckyTemplatesbe. Azt is bemutatom, hogyan hozhatjuk be ezt a CSV-fájlt, és hogyan helyezhetjük el közvetlenül a LuckyTemplates-be, arra az esetre, ha meg kell tennie.

Tartalomjegyzék

CSV-fájl letöltése a LuckyTemplates alkalmazásban

A CSV-fájl LuckyTemplates szolgáltatásba való hozásához először kattintson a Kezdőlap szalag „ Adatok beszerzése ” menüjére .

Python adatkészlet: Ismételhető kódok alkalmazása

A kattintás után egy legördülő menü jelenik meg, és ki kell választania a „ Szöveg/CSV ” opciót a menüből.

Python adatkészlet: Ismételhető kódok alkalmazása

Miután kiválasztotta a „ Szöveg/CSV ” opciót, megnyílik egy ablak, ahol kiválaszthatjuk azt a fájlt, amelyet be szeretnénk vinni a LuckyTemplatesbe. Ebben a példában használjuk az IMDB Dataset fájlt. 

Python adatkészlet: Ismételhető kódok alkalmazása

Az IMDB Dataset.csv fájl megnyitásakor egy másik ablak jelenik meg, amely megjeleníti a fájlon belüli adatokat. Mivel ez a fájl nagy mennyiségű adatot tartalmaz, csak az adatok egy részét jeleníti meg.

Az első dolog, amit ebben a fájlban meg fogunk tenni, az az átalakítás. Ehhez egyszerűen kattintson az „ Adatok átalakítása ” lehetőségre az ablak jobb alsó részén.

Python adatkészlet: Ismételhető kódok alkalmazása

Másolat készítése a Python adatkészletről

Mielőtt bármilyen változtatást végrehajtanánk ezen az adatkészleten, fontos, hogy másolatot készítsünk az eredeti adatkészletről. Ehhez kattintson a jobb gombbal az adatkészletre. 

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután a menüből válassza a „ Másolás ” lehetőséget.

Python adatkészlet: Ismételhető kódok alkalmazása

Végül kattintson a jobb gombbal a Lekérdezések panelre, majd válassza a „ Beillesztés ” lehetőséget a lehetőségek közül.

Python adatkészlet: Ismételhető kódok alkalmazása

A lépések végrehajtása után rendelkeznie kell az eredeti IMDB-adatkészlet másolatával a Lekérdezések panelen.

Python adatkészlet: Ismételhető kódok alkalmazása

Adatkészlet átalakítása Python-szkript futtatásával

Egy CSV-fájl átalakításával nagy mennyiségű Python-adatkészletet bonthat kisebbekre. Ezt úgy tehetjük meg, hogy alkalmazunk néhány Python-szkriptet ebben a fájlban.

De először meg kell győződnünk arról, hogy a fejlécek megfelelően vannak-e sorakozva. Kattintson a Kezdőlap menüre, majd keresse meg az „ Első sor használata fejlécként ” lehetőséget, és kattintson rá.

Python adatkészlet: Ismételhető kódok alkalmazása

Miután rákattintott az „ Első sor használata fejlécként ” lehetőségre, a fejlécek az előző első sorok adataivá változtak, amelyek a következők: „ vélemény ” és „ vélemény ”.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután lépjen az Átalakítás menübe, és kattintson a „ Python Script futtatása lehetőségre a „ Szkriptek ” csoportban.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezt követően megjelenik egy „ Python Script futtatása ” ablak. Ebben az ablakban bármely kívánt Python-szkriptet futtathat az aktuálisan használt fájl átalakításához. Ebben a példában a következő kód futtatásával kisebbre fogom tenni az adatkészletet.

Python adatkészlet: Ismételhető kódok alkalmazása

Az adatkészleten az .iloc függvényt használtam az IMDB adatkészlet adott sorainak és oszlopainak kiválasztásához. Ezután a paraméterekben az IMDB Dataset összes első 500 sorát és oszlopát kiválasztottam . Egy „ dataset ” nevű változóban tároltam .

A szkript végrehajtása után látnunk kell az „adatkészletet”, amely az előző lépésben létrehozott változó. Tartalmazza azokat az adatokat, amelyeket a Python-szkripttel módosítottunk.

Python adatkészlet: Ismételhető kódok alkalmazása

Az adatkészlet ellenőrzése

Az adatkészlettábla megnyitásához kattintson a „ Táblázatelemre az Érték oszlopban.

Python adatkészlet: Ismételhető kódok alkalmazása

Láthatjuk, hogy ez az adatkészlet immár 500 sornyira csökkent .

Python adatkészlet: Ismételhető kódok alkalmazása

Most, hogy az adatkészletünket 500 sorra bontottuk, a következő lépés a szükséges könyvtárak importálása. Ezt ugyanazzal az eljárással fogjuk megtenni, mint az IMDB Dataset tartalmának megváltoztatásakor. Ez annak biztosítására szolgál, hogy kódunk bizonyos forgatókönyvekben kevesebb módosítással kezelhető legyen.

Könyvtárak és függvények importálása megismételhető kódok használatával

A könyvtárak importálásához térjünk vissza a jegyzetfüzetünkhöz, és másoljuk át a szükséges könyvtárakat. Ne feledje, hogy az oktatóanyag előtt már létrehoztam ezeket a könyvtárakat, amelyeket másolni készülünk. Ezeket csak azért használom fel újra, hogy világos képet kapj a függvények ismételhető kódként való használatáról.

Python adatkészlet: Ismételhető kódok alkalmazása

A könyvtárak másolása után illessze be őket a „ Szkript futtatása ” ablakba, és ne felejtse el beilleszteni a „ from collections import Counter ” sort a szkript végére. 

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután kimásoljuk az adattisztító funkciót a notebookunkból, és hozzáadjuk a LuckyTemplates szkripthez.

Python adatkészlet: Ismételhető kódok alkalmazása

Hozzáadjuk a könyvtárak alá. 

Python adatkészlet: Ismételhető kódok alkalmazása

Az imént hozzáadott függvény meghívásához szükséges kódot is átmásoljuk.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután illessze be a LuckyTemplates Python-szkriptbe.

Python adatkészlet: Ismételhető kódok alkalmazása

Adattáblázatok generálása

Most, hogy hozzáadtuk a függvény meghívásához szükséges kódot, a „ df2 ”-t „adatkészletre , a „ címet ” pedig „ ellenőrzésre ” kell módosítanunk . Ezt az adatkészletben végrehajtott változtatások miatt tettük.

A „df2”-t „ adatkészletre ” változtattuk , mert az adatokat 500 sorral tároltuk az „adatkészletben”. Majd a „title”-nél frissítettük „review”-ra az oszlopok fejléceinek megváltoztatása miatt.

Ezekkel a kódokkal hozzá kell tudnunk hozni vagy előállítani 3 táblát, amelyek a data1 a szógyakorisághoz, a data2 a bitgyakorisághoz és a data3 a trigramok gyakoriságához.

Python adatkészlet: Ismételhető kódok alkalmazása

Másik másolatot is készíthet erről a módosított IMDB-adatkészletről (2), hogy később egy másik táblát nyisson meg.

Python adatkészlet: Ismételhető kódok alkalmazása

Most az IMDB Datasetben (2) nyissuk meg a data1 táblát

Python adatkészlet: Ismételhető kódok alkalmazása

 A data1 tábla megnyitása után láthatjuk a szavak listáját, valamint a gyakoriságot.

Python adatkészlet: Ismételhető kódok alkalmazása

Amint láthatja, bizonyos eljárásokat a fő adatkészletből tudunk végrehajtani a Jupyter Notebookból vett megismételhető kódok használatával. Ezekkel az ismételhető kódokkal képesek vagyunk átalakítani egy Python-adatkészletet, és táblázatot generálni a szógyakorisághoz, a nagyszámú gyakorisághoz és a trigramok gyakoriságához anélkül, hogy újra begépelnénk a kódokat.

Az IMDB Datasetben (3) nyissuk meg a data2 táblát , hogy megnézhessük a bigram gyakoriságot.

Python adatkészlet: Ismételhető kódok alkalmazása

A nagyszámú gyakorisági táblázatban a listában szereplő „ br ” látható . Ez valószínűleg egy HTML kódhoz kapcsolódik. Egyszerűen visszatérhetünk és hozzáadhatunk valami mást, de ebben az oktatóanyagban ezt nem fogjuk megtenni.

Most, hogy az adatok betöltése megtörtént az ismételhető kódok segítségével, elkezdhetjük a LuckyTemplates vizualizációk készítését. Például a az egyes szavak gyakoriságára. 

Python adatkészlet: Ismételhető kódok alkalmazása




Következtetés

Összefoglalva, az ismételhető kódok segíthetnek abban, hogy bizonyos eljárásokat kisebb erőfeszítéssel hajtson végre egy adatkészleten. Megtanulta, hogyan használhat megismételhető kódokat Python-adatkészletek átalakítására a LuckyTemplates alkalmazásban. Az .iloc függvényt is használhatta az adatkészlet módosításánál kiválasztandó sorok és oszlopok megadására.

Ezenkívül másolatokat hozott létre az adatkészletekről, és egy oszlopdiagram segítségével vizualizációt hozott létre. Ez a vizualizáció az általunk létrehozott és megismételhető kódok segítségével módosított Python-adatkészleteken alapul.

Minden jót,

Gaellim


Mi az a Power Query & M Language: Részletes áttekintés

Mi az a Power Query & M Language: Részletes áttekintés

Ez az oktatóanyag áttekintést nyújt a Power Query szerkesztőről és az M nyelvről a LuckyTemplates asztalon.

Oldalszámozott jelentés készítése: Szövegek és képek hozzáadása

Oldalszámozott jelentés készítése: Szövegek és képek hozzáadása

Ismerje meg, hogyan hozhat létre oldalszámozott jelentést, hogyan adhat hozzá szövegeket és képeket, majd exportálhatja a jelentést különböző dokumentumformátumokba.

A SharePoint automatizálási szolgáltatás | Bevezetés

A SharePoint automatizálási szolgáltatás | Bevezetés

Ismerje meg, hogyan használhatja a SharePoint automatizálási funkcióját munkafolyamatok létrehozására, és segít a SharePoint-felhasználók, -könyvtárak és -listák mikrokezelésében.

Oldja meg az adatelemzési kihívást a LuckyTemplates Accelerator segítségével

Oldja meg az adatelemzési kihívást a LuckyTemplates Accelerator segítségével

Fejlessze jelentéskészítési készségeit, ha csatlakozik egy adatelemzési kihíváshoz. Az Accelerator segítségével LuckyTemplates szuperfelhasználóvá válhatsz!

Összesítések futtatása a LuckyTemplates alkalmazásban a DAX segítségével

Összesítések futtatása a LuckyTemplates alkalmazásban a DAX segítségével

Ismerje meg, hogyan számíthatja ki a futó összegeket a LuckyTemplates programban a DAX segítségével. Az összesítések futtatása lehetővé teszi, hogy ne ragadjon le egyetlen egyéni eredménynél sem.

A LuckyTemplates Dax-változói állandóak: mit jelent ez?

A LuckyTemplates Dax-változói állandóak: mit jelent ez?

Ismerje meg a változók fogalmát a DAX-ban a LuckyTemplates-en belül, és a változók hatásait a mérőszámok kiszámítására.

LuckyTemplates lejtődiagram: Áttekintés

LuckyTemplates lejtődiagram: Áttekintés

Tudjon meg többet a LuckyTemplates Slope diagram nevű egyéni vizualizációról, amely egyetlen vagy több mérőszám növekedésének/csökkenésének megjelenítésére szolgál.

LuckyTemplates színes témák az egységes vizualizációkhoz

LuckyTemplates színes témák az egységes vizualizációkhoz

Fedezze fel a LuckyTemplates színtémáit. Ezek elengedhetetlenek ahhoz, hogy jelentései és vizualizációi zökkenőmentesen nézzenek ki és működjenek.

Átlag kiszámítása LuckyTemplatesben: Hétköznapi vagy hétvégi eredmények elkülönítése a DAX segítségével

Átlag kiszámítása LuckyTemplatesben: Hétköznapi vagy hétvégi eredmények elkülönítése a DAX segítségével

Az átlag kiszámítása a LuckyTemplates alkalmazásban számos módon elvégezhető, hogy pontos információkat kapjon üzleti jelentéseihez.

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

LuckyTemplates Theming | LuckyTemplates Desktop Standard Theming

Nézzük meg a Standard LuckyTemplates Theming témakört, és tekintsünk át néhány olyan funkciót, amely magában a LuckyTemplates Desktop alkalmazásban található.