Excel-fájl megnyitása Pythonban: lépésről lépésre

Az Excel-fájlokkal való munka sok szakember mindennapi életében gyakori feladat, egyesek szeretik, mások pedig utálják. A Python azonban számos könyvtárat biztosít, amelyek megkönnyítik, egyszerűbbé és hatékonyabbá teszik ezt a folyamatot.

Mind a Pandas Library, mind az openpyxl lehetővé teszi a felhasználók számára, hogy Pythonban nyissanak meg Excel fájlokat. A Pandas egy beépített módszerrel rendelkezik, amely megkönnyíti a munkát, míg az openpyxl nagyszerű, ha jobban szabályozni kell a fájl szerkezetét és formázását.

Ebben a cikkben különféle módszereket vizsgálunk meg a táblázatok Pythonban való megnyitására és kezelésére ezen könyvtárak használatával. Ezzel a tudással képes lesz hatékonyan feldolgozni és elemezni az Excel-adatokat a Python kiterjedt ökoszisztémája által biztosított hatékony eszközökkel!

Excel-fájl megnyitása Pythonban: lépésről lépésre

Tartalomjegyzék

Mik az előfeltételek?

Mielőtt belemerülne egy Excel-fájl Pythonban való megnyitásának folyamatába, meg kell felelnie néhány előfeltételnek. Mindenekelőtt alapvető ismeretekkel kell rendelkeznie a Python programozásról, beleértve a változókat, függvényeket és a könyvtárak importálását.

Ez segít a cikkben található kódpéldák egyszerű megértésében és kezelésében.

Az alapvető Python ismeretek mellett a szükséges könyvtárak telepítése is fontos. Számos Python-könyvtár áll rendelkezésre az Excel-fájlokkal való munkavégzéshez, többek között:

  • pandák: Hatékony adatkezelési könyvtár.

  • openpyxl: Népszerű könyvtár Excel-fájlok olvasására és írására.

  • xlrd: Excel-fájlokból származó adatok olvasására és formázására szolgáló könyvtár.

  • xlwt: Az adatok Excel-fájlokba való írására és formázására szolgáló könyvtár.

  • xlutils: Eszközkészlet az Excel-munkafüzetekkel való munkavégzéshez, beleértve az adatok olvasását, írását és módosítását.

A fenti könyvtárak bármelyikének pip használatával történő telepítéséhez nyissa meg a parancssort vagy a terminált, és írja be a következő parancsot, a " könyvtárnév" helyére a kívánt könyvtárra cserélve:

pip install 

Egy másik fontos előfeltétel, hogy legyen egy táblázat, amellyel dolgozni kell. Készítsen egy Excel-munkafüzetet, amely a Python segítségével kezelni kívánt adatokat tartalmazza.

Minta munkafüzeteket tölthet le a Microsoftról és más oktatówebhelyekről.

Bár a fájl több lapból és különböző formázásokból állhat, ajánlatos egy egyszerű adatkészlettel kezdeni a kezdeti tanulási folyamathoz. Az összetett táblázatokkal is megbirkózhat, ha több tapasztalatot és megértést szerez a használt könyvtárakkal kapcsolatban.

Excel-fájl megnyitása Pythonban: lépésről lépésre

A szükséges könyvtárak telepítése

Az Excel-táblázatok Pythonban való használatához telepítenie kell a megfelelő könyvtárakat. Számos könyvtár áll rendelkezésre erre a célra, de a legnépszerűbbek közül kettő az openPyXL és az xlrd .

Az OpenPyXL egy Python-könyvtár, amely lehetővé teszi Excel fájlok (különösen xltm, xlsm, xltx és xlsx fájlok) olvasását és írását. Nem szükséges a Microsoft Excel telepítése, és minden platformon működik. Az OpenPyXL pip használatával történő telepítéséhez futtassa a következő parancsot a terminálon:

pip install openpyxl

Másrészt az xlrd egy másik széles körben használt könyvtár az adatok olvasásához és az információk formázásához Excel-fájlokból. Kifejezetten támogatja az xls és xlsx fájlformátumokat.

Az xlrd pip használatával történő telepítéséhez futtassa a következő parancsot a terminálon:

pip install xlrd

A kívánt könyvtár telepítése után folytathatja az Excel-fájlok olvasását vagy írását a Pythonban. Minden könyvtárnak megvannak a maga egyedi jellemzői és szintaxisa, ezért elengedhetetlen, hogy az igényeinek leginkább megfelelőt válasszuk.

2 módszer az Excel fájl megnyitására a Pythonban

Ebben a részben az Excel-táblázat megnyitásának két népszerű módszerét tárgyaljuk. Megvizsgáljuk, hogyan teheti ezt meg mind a Pandas, mind az Openpyxl könyvtárral.

1. Pandák használata

A Pandas egy hatékony adatelemző könyvtár a Pythonban, amely kényelmes funkciókat biztosít a különféle formátumokból származó adatok olvasásához, írásához és kezeléséhez, beleértve az Excel és CSV fájlformátumokat is.

A képességeit ebben a videóban tekintheti meg: Hogyan lehet újramintázni az idősoros adatokat pandákkal az elemzés javítása érdekében:

Egy Excel-táblázat Pandas használatával történő megnyitásához kövesse az alábbi utasításokat:

  1. Először telepítse a Pandas könyvtárat, ha még nem tette meg. A pip segítségével telepítheti:

    pip install pandas
    Excel-fájl megnyitása Pythonban: lépésről lépésre
  2. Ezután importálja a Pandákat a Python-szkriptbe, és használja a read_excel() függvényt a fájl betöltéséhez:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Ez beolvassa a megadott Excel-lapot egy Pandas DataFrame-be, amely aztán könnyen kezelhető különféle beépített funkciókkal.

Megjegyzés: Ha nem ad meg lapnevet, a pandas könyvtár importálja az összes lapot, és egy szótárban tárolja. Ezeket a lapokat a lapnév kulcsként való használatával érheti el.

Ha például egy ' havi_jelentés ' nevű lapot szeretne lekérni, használja az alábbi kódot:

print(df['monthly_report'])

2. Openpyxl használata

Az Openpyxl egy másik népszerű könyvtár a Pythonban, amely kifejezetten Excel fájlokkal dolgozik. Egy Excel-munkafüzet megnyitásához Pythonban az Openpyxl használatával, kövesse az alábbi utasításokat:

  1. Először telepítse az openpyxl-t, ha még nem tette meg. A pip segítségével telepítheti:

    pip install openpyxl
  2. Ezután importálja az openpyxl-t a Python IDE-be, és használja az l oad_workbook() függvényt az Excel-munkafüzet betöltéséhez:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Ez betölti a megadott Excel-fájlt, és hozzáférést biztosít a lapjaihoz, soraihoz és egyes celláihoz, lehetővé téve az adatok egyszerű kezelését.

Mind a Pandas, mind az openpyxl hatékony könyvtárak, amelyek lehetővé teszik az Excel-fájlok hatékony megnyitását és kezelését a Pythonban. Válassza ki azt, amelyik a legjobban megfelel speciális igényeinek és követelményeinek.

Hogyan lehet beolvasni az Excel adatokat Pythonban?

Az Excel adatok Pythonban történő beolvasása könnyen elérhető a Pandas könyvtár segítségével, amely hatékony és egyszerűen használható módszerkészletet biztosít a táblázatos adatokkal való munkavégzéshez. Ebben a részben megtudhatja, hogyan olvassa el az Excel-adatokat pandákkal, különös tekintettel az egyes lapok elérésére és a cellaértékek lekérésére.

Olvassa el az adott lapot

Ha egy adott munkalapot szeretne beolvasni egy Excel-fájlból pandákkal, egyszerűen át kell adnia a lap nevét vagy a lap indexét paraméterként a read_excelmethod-nak. Íme egy példa:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Ez a kódrészlet importálja a Pandas könyvtárat, és megadja az Excel-táblázat nevét, valamint az olvasandó lapot. Ezután a read_excel() metódussal beolvassa a megadott lapot, és kinyomtatja az eredményül kapott DataFrame-et.

Ha több lapot szeretne importálni az adatkeretbe, állítsa be a lapnév paramétert None értékre. Ezzel importálja a munkafüzet összes lapot az adatkeretébe.

Olvassa el a cellaértékeket

Ha végzett az adatok pandas DataFrame-be történő importálásával, a DataFrame iat[] metódusával elérheti az egyes cellaértékeket . A metódus sor- és oszlopindexeket vesz argumentumaként.

Íme egy példa:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Ez a kódrészlet kivonja az 1. sorindex és 2. oszlopindex cellaértékét (amely a második sornak és a harmadik oszlopnak felel meg) a korábban betöltött DataFrame-ből (df). A cellaérték kinyerése után kiírja az értéket.

Ebben a részben megtanulta, hogyan kell beolvasni az Excel-adatokat Pythonban, különös tekintettel az egyes lapok olvasására és a cellaértékek lekérésére a pandas könyvtár használatával. Ez a tudás lehetővé teszi, hogy hatékonyan dolgozzon az Excel-adatokkal a Python-projektekben.

Hogyan kezeljük az Excel adatokat

Ebben a részben megvitatjuk, hogyan frissítheti a cellaértékeket, és hogyan adhat hozzá vagy törölhet sorokat és oszlopokat egy Excel-fájlban Python használatával. Ezekben a példákban az OpenPyXL-t fogjuk használni, mivel számos módszert kínál az adatok módosítására vagy beillesztésére egy Excel-munkafüzetbe.

Frissítse a cellaértékeket

Az Excel cellaértékek módosításához az openpyXL könyvtárat használjuk. Ezután importálja a szükséges modult, és töltse be az Excel munkafüzetet:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Válassza ki a módosítani kívánt Excel-lapot.

sheet = workbook.active

Az aktív metódus kijelöli a munkafüzet első lapot. Ha másik lapot szeretne kiválasztani, használja a munkafüzet[< lapnév >] formátumot.

Egy cellaérték módosításához egyszerűen rendeljen hozzá egy új értéket a kívánt cellához:

sheet['A1'] = "New Value"

Végül mentse el a módosított munkafüzetet:

workbook.save('example_modified.xlsx')

Sorok és oszlopok hozzáadása és törlése

A sorok vagy oszlopok hozzáadása és törlése egyszerűen elvégezhető az OpenPyXL segítségével. Itt van, hogyan:

Sorok hozzáadása: Sorok beszúrásához használja az insert_rows() függvényt. A következő példa két sort ad hozzá az első sor után:

sheet.insert_rows(2, 2)

Sorok törlése: A sorok törléséhez használja a delete_rows() függvényt. A következő példa két sort töröl a 3. sortól kezdve:

sheet.delete_rows(3, 2)

Oszlopok hozzáadása: Oszlopok beszúrásához használja az insert_cols() függvényt. A következő példa két oszlopot ad az első oszlop után:

sheet.insert_cols(2, 2)

Oszlopok törlése: Oszlopok törléséhez használja a delete_cols() függvényt. A következő példa két oszlopot töröl a 3. oszloptól kezdve:

sheet.delete_cols(3, 2)

Ne felejtse el menteni a frissített munkafüzetet:

workbook.save('example_modified.xlsx')

Excel-fájl mentése Pythonban

Excel-fájl Pythonban való mentéséhez használhat olyan könyvtárakat, mint a Pandas vagy az openpyxl. Mindkét könyvtár különböző módszereket kínál az adatok Excel-fájlokba való írására. Ebben a részben megvizsgáljuk az egyes megközelítéseket, és példákat mutatunk be az Excel-fájlok Python használatával történő mentésére.

A Pandas használata: A Pandas egy népszerű könyvtár az adatok manipulálására és elemzésére. Van egy beépített to_excel() metódusa , amely lehetővé teszi a DataFrame elmentését Excel fájlként:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

Ebben a példában létrehozunk egy minta DataFrame-et, és elmentjük Excel-fájlként „output.xlsx” néven a to_excel() metódussal. Az eredményül kapott táblázatot alább láthatja.

Excel-fájl megnyitása Pythonban: lépésről lépésre

Az OpenPyXL használata: az openpyxl egy másik hatékony könyvtár, amelyet kifejezetten a Microsoft Excel fájlokkal való munkához terveztek. Íme egy példa arra, hogyan lehet adatokat menteni Excel-fájlba az OpenPyXL használatával:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

Ebben a példában létrehozunk egy új munkafüzetet, és az append() metódussal adatokat adunk az aktív munkalaphoz . Végül a munkafüzetet Excel-fájlként mentjük „ output_openpyxl.xlsx ” néven.

Excel-fájl megnyitása Pythonban: lépésről lépésre

Mind a Pandas, mind az openpyxl robusztus funkcionalitást biztosít az Excel-fájlok Pythonban való mentéséhez. Tehát választása a követelményektől és a feladatok összetettségétől függ.

Ideje lezárni a dolgokat

Ebben a cikkben különféle könyvtárakat vizsgáltunk meg az Excel-fájlok Pythonban való megnyitásához és kezeléséhez. Mindegyik könyvtárnak megvannak a saját egyedi jellemzői és előnyei, amelyek lehetővé teszik olyan feladatok végrehajtását, mint például az adatok olvasása és írása, a lapok elérése és a cellaértékek manipulálása.

A cikkben tárgyalt módszerek beépítésével hatékonyan dolgozhat az Excel-fájlokkal, bővítheti projektjei képességeit, valamint fejlesztheti adatelemzési és -kezelési készségeit.

Ahogy továbbra is használja ezeket a könyvtárakat és felfedezi funkcióikat, egyre jártasabb lesz a táblázatok Python segítségével történő kezelésében. Ez a cikk most felvértezte Önt a munka elvégzéséhez szükséges készségekkel. Itt az ideje, hogy próbára tegye új képességeit!


A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

A DAX Studio és a Tabular Editor telepítése a LuckyTemplates alkalmazásban

Ismerje meg, hogyan töltheti le és telepítheti a DAX Studio és a Tabular Editor 3 alkalmazást, és hogyan konfigurálhatja őket a LuckyTemplates és az Excel programban való használatra.

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

LuckyTemplates alakzattérkép-vizualizáció a térbeli elemzéshez

Ez a blog tartalmazza a Shape Map vizualizációt a LuckyTemplates térbeli elemzéséhez. Megmutatom, hogyan használhatja hatékonyan ezt a vizualizációt annak funkcióival és elemeivel.

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

LuckyTemplates pénzügyi jelentések: az eredmények hozzárendelése a sablonokhoz minden egyes sorban

Ebben az oktatóanyagban egy egyedülálló ötletet mutatok be a pénzügyi jelentésekkel kapcsolatban, amely az eredmények hozzárendelését jelenti a LuckyTemplates-en belüli táblázatsablonok előre meghatározásához.

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

DAX-mértékek a LuckyTemplates-ben mértékelágazás használatával

Hozzon létre DAX-mértékeket a LuckyTemplates alkalmazásban meglévő mértékek vagy képletek használatával. Ezt nevezem mértékelágazási technikának.

A legerősebb funkcióhívás a LuckyTemplatesben

A legerősebb funkcióhívás a LuckyTemplatesben

Ebben a blogban fedezze fel a LuckyTemplates adatkészletet, a leghatékonyabb függvényhívást, amely M- és DAX-függvények ezreit juttatja a keze ügyébe.

Adatmodellezési technikák a DAX-mérések megszervezéséhez

Adatmodellezési technikák a DAX-mérések megszervezéséhez

A mai oktatóanyagban megosztok néhány adatmodellezési technikát a DAX-mérések jobb rendszerezéséhez a hatékonyabb munkafolyamat érdekében.

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

LuckyTemplates pénzügyi irányítópult: Teljes táblázat testreszabási tippek

A LuckyTemplates egy nagyszerű eszköz a pénzügyi jelentésekhez. Itt található egy oktatóanyag, amely bemutatja, hogyan hozhat létre személyre szabott táblázatokat a LuckyTemplates pénzügyi irányítópultjához.

A Power Query nyelvi folyamatának bevált gyakorlatai

A Power Query nyelvi folyamatának bevált gyakorlatai

Ez az oktatóanyag megvitatja a Power Query nyelvi folyamatot, és azt, hogyan segíthet zökkenőmentes és hatékony adatjelentések létrehozásában.

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

LuckyTemplates egyéni ikonok | PBI vizualizációs technika

Az egyik kedvenc technikámról fogok beszélni a LuckyTemplates egyéni ikonok körül, amely dinamikusan használja az egyéni ikonokat a LuckyTemplates vizualizációkban.

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

LuckyTemplates táblázatok létrehozása UNION & ROW függvény használatával

Ebben a blogban megmutatom, hogyan hozhat létre LuckyTemplates táblázatokat olyan képlet segítségével, amely egyesíti az UNION és a ROW függvényt.