Python adatkészlet: Ismételhető kódok alkalmazása

Ebből a blogból megtudhatja, hogyan alkalmazhat megismételhető kódokat vagy függvényeket azonos típusú kimenetek előállítására. Ez segít hatékonyabbá tenni, és kevesebb erőfeszítést tesz bizonyos adatok különböző adatkészletekből való előhívása során. Ebben az oktatóanyagban egy létező kódot fogunk használni, amelyet korábban készítettem példaként.

Azt is megtudhatja, hogyan készíthet másolatokat az adatkészletekről, hogy elkerülje az adatkészlet eredeti verziójának károsodását, hogyan importálhat könyvtárakat és függvényeket ismételhető kódok használatával, valamint .

Ehhez a bloghoz azt javaslom, hogy mindig szerezze be a CSV- fájlt, és vigye át a LuckyTemplatesbe. Azt is bemutatom, hogyan hozhatjuk be ezt a CSV-fájlt, és hogyan helyezhetjük el közvetlenül a LuckyTemplates-be, arra az esetre, ha meg kell tennie.

Tartalomjegyzék

CSV-fájl letöltése a LuckyTemplates alkalmazásban

A CSV-fájl LuckyTemplates szolgáltatásba való hozásához először kattintson a Kezdőlap szalag „ Adatok beszerzése ” menüjére .

Python adatkészlet: Ismételhető kódok alkalmazása

A kattintás után egy legördülő menü jelenik meg, és ki kell választania a „ Szöveg/CSV ” opciót a menüből.

Python adatkészlet: Ismételhető kódok alkalmazása

Miután kiválasztotta a „ Szöveg/CSV ” opciót, megnyílik egy ablak, ahol kiválaszthatjuk azt a fájlt, amelyet be szeretnénk vinni a LuckyTemplatesbe. Ebben a példában használjuk az IMDB Dataset fájlt. 

Python adatkészlet: Ismételhető kódok alkalmazása

Az IMDB Dataset.csv fájl megnyitásakor egy másik ablak jelenik meg, amely megjeleníti a fájlon belüli adatokat. Mivel ez a fájl nagy mennyiségű adatot tartalmaz, csak az adatok egy részét jeleníti meg.

Az első dolog, amit ebben a fájlban meg fogunk tenni, az az átalakítás. Ehhez egyszerűen kattintson az „ Adatok átalakítása ” lehetőségre az ablak jobb alsó részén.

Python adatkészlet: Ismételhető kódok alkalmazása

Másolat készítése a Python adatkészletről

Mielőtt bármilyen változtatást végrehajtanánk ezen az adatkészleten, fontos, hogy másolatot készítsünk az eredeti adatkészletről. Ehhez kattintson a jobb gombbal az adatkészletre. 

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután a menüből válassza a „ Másolás ” lehetőséget.

Python adatkészlet: Ismételhető kódok alkalmazása

Végül kattintson a jobb gombbal a Lekérdezések panelre, majd válassza a „ Beillesztés ” lehetőséget a lehetőségek közül.

Python adatkészlet: Ismételhető kódok alkalmazása

A lépések végrehajtása után rendelkeznie kell az eredeti IMDB-adatkészlet másolatával a Lekérdezések panelen.

Python adatkészlet: Ismételhető kódok alkalmazása

Adatkészlet átalakítása Python-szkript futtatásával

Egy CSV-fájl átalakításával nagy mennyiségű Python-adatkészletet bonthat kisebbekre. Ezt úgy tehetjük meg, hogy alkalmazunk néhány Python-szkriptet ebben a fájlban.

De először meg kell győződnünk arról, hogy a fejlécek megfelelően vannak-e sorakozva. Kattintson a Kezdőlap menüre, majd keresse meg az „ Első sor használata fejlécként ” lehetőséget, és kattintson rá.

Python adatkészlet: Ismételhető kódok alkalmazása

Miután rákattintott az „ Első sor használata fejlécként ” lehetőségre, a fejlécek az előző első sorok adataivá változtak, amelyek a következők: „ vélemény ” és „ vélemény ”.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután lépjen az Átalakítás menübe, és kattintson a „ Python Script futtatása lehetőségre a „ Szkriptek ” csoportban.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezt követően megjelenik egy „ Python Script futtatása ” ablak. Ebben az ablakban bármely kívánt Python-szkriptet futtathat az aktuálisan használt fájl átalakításához. Ebben a példában a következő kód futtatásával kisebbre fogom tenni az adatkészletet.

Python adatkészlet: Ismételhető kódok alkalmazása

Az adatkészleten az .iloc függvényt használtam az IMDB adatkészlet adott sorainak és oszlopainak kiválasztásához. Ezután a paraméterekben az IMDB Dataset összes első 500 sorát és oszlopát kiválasztottam . Egy „ dataset ” nevű változóban tároltam .

A szkript végrehajtása után látnunk kell az „adatkészletet”, amely az előző lépésben létrehozott változó. Tartalmazza azokat az adatokat, amelyeket a Python-szkripttel módosítottunk.

Python adatkészlet: Ismételhető kódok alkalmazása

Az adatkészlet ellenőrzése

Az adatkészlettábla megnyitásához kattintson a „ Táblázatelemre az Érték oszlopban.

Python adatkészlet: Ismételhető kódok alkalmazása

Láthatjuk, hogy ez az adatkészlet immár 500 sornyira csökkent .

Python adatkészlet: Ismételhető kódok alkalmazása

Most, hogy az adatkészletünket 500 sorra bontottuk, a következő lépés a szükséges könyvtárak importálása. Ezt ugyanazzal az eljárással fogjuk megtenni, mint az IMDB Dataset tartalmának megváltoztatásakor. Ez annak biztosítására szolgál, hogy kódunk bizonyos forgatókönyvekben kevesebb módosítással kezelhető legyen.

Könyvtárak és függvények importálása megismételhető kódok használatával

A könyvtárak importálásához térjünk vissza a jegyzetfüzetünkhöz, és másoljuk át a szükséges könyvtárakat. Ne feledje, hogy az oktatóanyag előtt már létrehoztam ezeket a könyvtárakat, amelyeket másolni készülünk. Ezeket csak azért használom fel újra, hogy világos képet kapj a függvények ismételhető kódként való használatáról.

Python adatkészlet: Ismételhető kódok alkalmazása

A könyvtárak másolása után illessze be őket a „ Szkript futtatása ” ablakba, és ne felejtse el beilleszteni a „ from collections import Counter ” sort a szkript végére. 

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután kimásoljuk az adattisztító funkciót a notebookunkból, és hozzáadjuk a LuckyTemplates szkripthez.

Python adatkészlet: Ismételhető kódok alkalmazása

Hozzáadjuk a könyvtárak alá. 

Python adatkészlet: Ismételhető kódok alkalmazása

Az imént hozzáadott függvény meghívásához szükséges kódot is átmásoljuk.

Python adatkészlet: Ismételhető kódok alkalmazása

Ezután illessze be a LuckyTemplates Python-szkriptbe.

Python adatkészlet: Ismételhető kódok alkalmazása

Adattáblázatok generálása

Most, hogy hozzáadtuk a függvény meghívásához szükséges kódot, a „ df2 ”-t „adatkészletre , a „ címet ” pedig „ ellenőrzésre ” kell módosítanunk . Ezt az adatkészletben végrehajtott változtatások miatt tettük.

A „df2”-t „ adatkészletre ” változtattuk , mert az adatokat 500 sorral tároltuk az „adatkészletben”. Majd a „title”-nél frissítettük „review”-ra az oszlopok fejléceinek megváltoztatása miatt.

Ezekkel a kódokkal hozzá kell tudnunk hozni vagy előállítani 3 táblát, amelyek a data1 a szógyakorisághoz, a data2 a bitgyakorisághoz és a data3 a trigramok gyakoriságához.

Python adatkészlet: Ismételhető kódok alkalmazása

Másik másolatot is készíthet erről a módosított IMDB-adatkészletről (2), hogy később egy másik táblát nyisson meg.

Python adatkészlet: Ismételhető kódok alkalmazása

Most az IMDB Datasetben (2) nyissuk meg a data1 táblát

Python adatkészlet: Ismételhető kódok alkalmazása

 A data1 tábla megnyitása után láthatjuk a szavak listáját, valamint a gyakoriságot.

Python adatkészlet: Ismételhető kódok alkalmazása

Amint láthatja, bizonyos eljárásokat a fő adatkészletből tudunk végrehajtani a Jupyter Notebookból vett megismételhető kódok használatával. Ezekkel az ismételhető kódokkal képesek vagyunk átalakítani egy Python-adatkészletet, és táblázatot generálni a szógyakorisághoz, a nagyszámú gyakorisághoz és a trigramok gyakoriságához anélkül, hogy újra begépelnénk a kódokat.

Az IMDB Datasetben (3) nyissuk meg a data2 táblát , hogy megnézhessük a bigram gyakoriságot.

Python adatkészlet: Ismételhető kódok alkalmazása

A nagyszámú gyakorisági táblázatban a listában szereplő „ br ” látható . Ez valószínűleg egy HTML kódhoz kapcsolódik. Egyszerűen visszatérhetünk és hozzáadhatunk valami mást, de ebben az oktatóanyagban ezt nem fogjuk megtenni.

Most, hogy az adatok betöltése megtörtént az ismételhető kódok segítségével, elkezdhetjük a LuckyTemplates vizualizációk készítését. Például a az egyes szavak gyakoriságára. 

Python adatkészlet: Ismételhető kódok alkalmazása




Következtetés

Összefoglalva, az ismételhető kódok segíthetnek abban, hogy bizonyos eljárásokat kisebb erőfeszítéssel hajtson végre egy adatkészleten. Megtanulta, hogyan használhat megismételhető kódokat Python-adatkészletek átalakítására a LuckyTemplates alkalmazásban. Az .iloc függvényt is használhatta az adatkészlet módosításánál kiválasztandó sorok és oszlopok megadására.

Ezenkívül másolatokat hozott létre az adatkészletekről, és egy oszlopdiagram segítségével vizualizációt hozott létre. Ez a vizualizáció az általunk létrehozott és megismételhető kódok segítségével módosított Python-adatkészleteken alapul.

Minden jót,

Gaellim


Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Dátumtáblázat létrehozása a LuckyTemplates alkalmazásban

Tudja meg, miért fontos egy dedikált dátumtáblázat a LuckyTemplatesben, és ismerje meg ennek leggyorsabb és leghatékonyabb módját.

LuckyTemplates mobil jelentéskészítési tippek és technikák

LuckyTemplates mobil jelentéskészítési tippek és technikák

Ez a rövid oktatóanyag kiemeli a LuckyTemplates mobil jelentési funkcióját. Megmutatom, hogyan készíthet hatékony jelentéseket mobileszközökön.

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Professzionális szolgáltatáselemzési jelentések LuckyTemplatesben

Ebben a LuckyTemplates bemutatóban olyan jelentéseket tekintünk át, amelyek professzionális szolgáltatáselemzést mutatnak be egy olyan cégtől, amely több szerződéssel és ügyfél-elkötelezettséggel rendelkezik.

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Microsoft Power Platform frissítések | Microsoft Ignite 2021

Tekintse át a Power Apps és a Power Automate legfontosabb frissítéseit, valamint azok előnyeit és következményeit a Microsoft Power Platform számára.

Gyakori SQL-függvények: Áttekintés

Gyakori SQL-függvények: Áttekintés

Fedezzen fel néhány gyakori SQL-függvényt, amelyeket használhatunk, például a karakterláncot, a dátumot és néhány speciális függvényt az adatok feldolgozásához vagy manipulálásához.

LuckyTemplates sablonok létrehozása: útmutató és tippek

LuckyTemplates sablonok létrehozása: útmutató és tippek

Ebből az oktatóanyagból megtudhatja, hogyan hozhatja létre a tökéletes LuckyTemplates sablont, amely az Ön igényeinek és preferenciáinak megfelelően van konfigurálva.

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Mezőparaméterek és kis többszörösek a LuckyTemplatesben

Ebben a blogban bemutatjuk, hogyan lehet a mezőparamétereket kis többszörösekkel rétegezni, hogy hihetetlenül hasznos betekintést és látványelemeket hozzon létre.

LuckyTemplates rangsor és egyéni csoportosítás

LuckyTemplates rangsor és egyéni csoportosítás

Ebből a blogból megtudhatja, hogyan használhatja a LuckyTemplates rangsorolási és egyéni csoportosítási funkcióit a mintaadatok szegmentálására és kritériumok szerinti rangsorolására.

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

A LuckyTemplatesben csak egy meghatározott dátumig összesített összeg látható

Ebben az oktatóanyagban egy konkrét technikát fogok bemutatni, hogyan jelenítheti meg a kumulatív összeget csak egy adott dátumig a LuckyTemplates vizualizációjában.

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Bullet Charts: speciális egyéni látványelemek a LuckyTemplates számára

Ismerje meg, hogyan hozhat létre és testreszabhat Bullet diagramokat a LuckyTemplates alkalmazásban, amelyeket főként a teljesítmény mérésére használnak a célhoz vagy az előző évekhez képest.