Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Práca s excelovými súbormi je bežnou úlohou v každodennom živote mnohých profesionálov, niektorí z nás ju milujú a iní nenávidia. Python však poskytuje niekoľko knižníc, ktoré tento proces zjednodušia, zefektívnia a zefektívnia.

Knižnica Pandas aj openpyxl umožňujú používateľom otvárať excelový súbor v Pythone. Pandas má zabudovanú metódu, ktorá to uľahčuje, zatiaľ čo openpyxl je skvelý, keď potrebujete väčšiu kontrolu nad štruktúrou a formátovaním súboru.

V tomto článku preskúmame rôzne metódy otvárania a práce s tabuľkami v Pythone pomocou týchto knižníc. S týmito znalosťami budete môcť efektívne spracovávať a analyzovať dáta Excelu pomocou výkonných nástrojov, ktoré poskytuje rozsiahly ekosystém Pythonu!

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Obsah

Aké sú predpoklady?

Predtým, ako sa ponoríte do procesu otvárania súboru Excel v Pythone, je potrebné splniť niekoľko predpokladov. V prvom rade by ste mali mať základné znalosti o programovaní v Pythone, vrátane premenných, funkcií a importu knižníc.

Pomôže vám to jednoducho pochopiť a pracovať s príkladmi kódu uvedenými v článku.

Okrem základných znalostí jazyka Python je dôležitá aj inštalácia potrebných knižníc. Na prácu so súbormi programu Excel je k dispozícii niekoľko knižníc Python, vrátane:

  • pandas: Výkonná knižnica na manipuláciu s údajmi.

  • openpyxl: Populárna knižnica na čítanie a písanie súborov programu Excel.

  • xlrd: Knižnica na čítanie údajov a formátovanie informácií zo súborov programu Excel.

  • xlwt: Knižnica na zapisovanie údajov a formátovanie informácií do súborov programu Excel.

  • xlutils: Sada nástrojov na prácu s excelovými zošitmi vrátane čítania, zápisu a úpravy údajov.

Ak chcete nainštalovať niektorú z vyššie uvedených knižníc pomocou pip, otvorte príkazový riadok alebo terminál a zadajte nasledujúci príkaz, pričom nahraďte ` library_name` želanou knižnicou:

pip install 

Ďalším dôležitým predpokladom je mať tabuľku na prácu. Mali by ste pripraviť excelový zošit obsahujúci údaje, s ktorými chcete manipulovať pomocou Pythonu.

Vzorové pracovné zošity si môžete stiahnuť zo spoločnosti Microsoft a iných stránok s výučbovými programami.

Hoci súbor môže mať viacero listov a rôzne formátovanie, odporúča sa začať s jednoduchým súborom údajov pre počiatočný proces učenia. Keď získate viac skúseností a porozumiete používaným knižniciam, môžete sa pustiť do zložitých tabuliek.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Ako nainštalovať požadované knižnice

Ak chcete pracovať s tabuľkami Excel v Pythone, musíte si nainštalovať príslušné knižnice. Na tento účel je k dispozícii niekoľko knižníc, ale dve z najpopulárnejších sú openPyXL a xlrd .

OpenPyXL je knižnica Pythonu, ktorá umožňuje čítanie a zápis súborov programu Excel (konkrétne súborov xltm, xlsm, xltx a xlsx). Nevyžaduje inštaláciu programu Microsoft Excel a funguje na všetkých platformách. Ak chcete nainštalovať OpenPyXL pomocou pip, spustite vo svojom termináli nasledujúci príkaz:

pip install openpyxl

Na druhej strane je xlrd ďalšou široko používanou knižnicou na čítanie údajov a formátovanie informácií zo súborov programu Excel. Konkrétne podporuje formáty súborov xls a xlsx.

Ak chcete nainštalovať xlrd pomocou pip, spustite nasledujúci príkaz v termináli:

pip install xlrd

Po nainštalovaní požadovanej knižnice môžete pokračovať v čítaní alebo písaní súborov programu Excel v Pythone. Každá knižnica má svoje jedinečné vlastnosti a syntax, preto je nevyhnutné vybrať si tú, ktorá najlepšie vyhovuje vašim požiadavkám.

2 spôsoby, ako otvoriť súbor Excel v Pythone

V tejto časti budeme diskutovať o dvoch populárnych metódach na otvorenie tabuľky programu Excel. Budeme skúmať, ako to môžete urobiť s knižnicami Pandas aj Openpyxl.

1.Používanie Pandy

Pandas je výkonná knižnica na analýzu údajov v jazyku Python, ktorá poskytuje pohodlné funkcie na čítanie, zápis a manipuláciu s údajmi z rôznych formátov vrátane formátov súborov Excel a CSV.

Jeho možnosti si môžete pozrieť v tomto videu o tom, ako prevzorkovať údaje časových radov pomocou Pandas na vylepšenie analýzy:

Ak chcete otvoriť tabuľku Excel pomocou Pandas, postupujte podľa pokynov nižšie:

  1. Najprv si nainštalujte knižnicu Pandas, ak ste tak ešte neurobili. Môžete ho nainštalovať pomocou pip:

    pip install pandas
    Ako otvoriť súbor programu Excel v Pythone: Krok za krokom
  2. Ďalej importujte Pandy do skriptu Python a pomocou funkcie read_excel() načítajte súbor:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Tým sa načíta špecifikovaný hárok Excelu do Pandas DataFrame, s ktorým sa potom dá jednoducho manipulovať pomocou rôznych vstavaných funkcií.

Poznámka: Ak nezadáte názov listu, knižnica pandas importuje všetky listy a uloží ich do slovníka. K týmto hárkom môžete pristupovať pomocou názvu hárka ako kľúča.

Napríklad, ak chcete získať hárok s názvom ' month_report ', môžete použiť kód nižšie:

print(df['monthly_report'])

2.Pomocou openpyxl

Openpyxl je ďalšia populárna knižnica v Pythone na prácu špecificky so súbormi Excel. Ak chcete otvoriť excelový zošit v Pythone pomocou Openpyxl, postupujte podľa pokynov nižšie:

  1. Najprv nainštalujte openpyxl, ak ste tak ešte neurobili. Môžete ho nainštalovať pomocou pip:

    pip install openpyxl
  2. Ďalej importujte openpyxl do vášho Python IDE a pomocou funkcie l load_workbook() načítajte excelový zošit:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Tým sa načíta určený súbor Excel a poskytuje prístup k jeho hárkom, riadkom a jednotlivým bunkám, čo vám umožní jednoducho pracovať s jeho údajmi.

Pandy aj openpyxl sú výkonné knižnice, ktoré vám umožňujú efektívne otvárať a manipulovať s excelovými súbormi v Pythone. Vyberte si ten, ktorý najlepšie vyhovuje vašim špecifickým potrebám a požiadavkám.

Ako čítať údaje Excelu v Pythone?

Čítanie údajov programu Excel v jazyku Python možno ľahko dosiahnuť pomocou knižnice Pandas, ktorá poskytuje výkonnú a jednoducho použiteľnú sadu metód na prácu s tabuľkovými údajmi. V tejto časti sa naučíte, ako čítať údaje programu Excel pomocou pand, so zameraním na prístup ku konkrétnym hárkom a získavanie hodnôt buniek.

Prečítajte si konkrétny list

Ak chcete čítať konkrétny hárok zo súboru programu Excel pomocou pandas, jednoducho musíte zadať názov hárka alebo index hárka ako parameter do metódy read_excel. Tu je príklad:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Tento útržok kódu importuje knižnicu Pandas a špecifikuje názov tabuľky Excel a hárok na čítanie. Potom prečíta zadaný hárok pomocou metódy read_excel() a vytlačí výsledný DataFrame.

Ak chcete do dátového rámca importovať viacero hárkov, stačí nastaviť parameter názov_hárka na hodnotu Žiadne. Týmto sa importujú všetky hárky v zošite do vášho dátového rámca.

Prečítajte si hodnoty buniek

Po dokončení importu údajov do dátového rámca pandas môžete pristupovať k hodnotám jednotlivých buniek pomocou metódy iat[] dátového rámca . Metóda berie ako argumenty riadkové a stĺpcové indexy.

Tu je príklad:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Tento útržok kódu extrahuje hodnotu bunky v indexe riadka 1 a indexe stĺpca 2 (zodpovedajúce druhému riadku a tretiemu stĺpcu) z predtým načítaného DataFrame (df). Po extrahovaní hodnoty bunky vytlačí hodnotu.

V tejto časti ste sa naučili čítať údaje Excelu v Pythone so zameraním na čítanie konkrétnych hárkov a získavanie hodnôt buniek pomocou knižnice pandas. Tieto znalosti vám umožnia efektívne pracovať s údajmi programu Excel vo vašich projektoch Python.

Ako manipulovať s údajmi programu Excel

V tejto časti budeme diskutovať o tom, ako aktualizovať hodnoty buniek a pridávať alebo odstraňovať riadky a stĺpce v súbore Excel pomocou Pythonu. Pre tieto príklady budeme používať OpenPyXL, pretože ponúka niekoľko metód, ktoré môžete použiť na zmenu alebo vloženie údajov do zošita programu Excel.

Aktualizujte hodnoty buniek

Na úpravu hodnôt buniek Excelu použijeme knižnicu openpyXL. Ďalej importujte požadovaný modul a načítajte zošit programu Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Vyberte hárok programu Excel, s ktorým chcete manipulovať.

sheet = workbook.active

Aktívna metóda vyberie prvý hárok v zošite. Ak chcete vybrať iný hárok, použite formát zošita[< názov hárku >] .

Ak chcete zmeniť hodnotu bunky, jednoducho priraďte novú hodnotu k požadovanej bunke:

sheet['A1'] = "New Value"

Nakoniec upravený zošit uložte:

workbook.save('example_modified.xlsx')

Pridať a odstrániť riadky a stĺpce

Pridávanie a odstraňovanie riadkov alebo stĺpcov je možné jednoducho vykonať pomocou OpenPyXL. Tu je postup:

Pridať riadky: Ak chcete vložiť riadky, použite funkciu insert_rows() . Nasledujúci príklad pridá dva riadky za prvý riadok:

sheet.insert_rows(2, 2)

Odstrániť riadky: Ak chcete odstrániť riadky, použite funkciu delete_rows() . Nasledujúci príklad vymaže dva riadky začínajúce od riadku 3:

sheet.delete_rows(3, 2)

Pridať stĺpce: Ak chcete vložiť stĺpce, použite funkciu insert_cols() . Nasledujúci príklad pridá dva stĺpce za prvý stĺpec:

sheet.insert_cols(2, 2)

Odstrániť stĺpce: Ak chcete odstrániť stĺpce, použite funkciu delete_cols() . Nasledujúci príklad vymaže dva stĺpce začínajúce od stĺpca 3:

sheet.delete_cols(3, 2)

Nezabudnite uložiť aktualizovaný zošit:

workbook.save('example_modified.xlsx')

Ako uložiť súbor Excel v Pythone

Ak chcete uložiť súbor Excel v Pythone, môžete použiť knižnice, ako sú Pandas alebo openpyxl. Obe knižnice ponúkajú rôzne metódy zapisovania údajov do súborov programu Excel. V tejto časti preskúmame každý prístup a poskytneme príklady, ako uložiť súbor Excel pomocou Pythonu.

Používanie Pandas: Pandas je populárna knižnica na manipuláciu a analýzu údajov. Má vstavanú metódu s názvom to_excel() , ktorá vám umožňuje uložiť DataFrame ako súbor programu Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

V tomto príklade vytvoríme vzorový DataFrame a uložíme ho ako súbor programu Excel s názvom „output.xlsx“ pomocou metódy to_excel() . Výslednú tabuľku si môžete pozrieť nižšie.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Používanie OpenPyXL: openpyxl je ďalšia výkonná knižnica špeciálne navrhnutá na prácu so súbormi Microsoft Excel. Tu je príklad, ako uložiť údaje do súboru Excel pomocou OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

V tomto príklade vytvoríme nový zošit a pridáme údaje do aktívneho hárka pomocou metódy append() . Nakoniec zošit uložíme ako súbor programu Excel s názvom „ output_openpyxl.xlsx “.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Pandy aj openpyxl poskytujú robustnú funkčnosť na ukladanie súborov Excel v Pythone. Takže váš výber závisí od požiadaviek a zložitosti vašich úloh.

Čas zabaliť veci

V tomto článku sme preskúmali rôzne knižnice na otváranie a prácu so súbormi Excel v Pythone. Každá z týchto knižníc má svoje vlastné jedinečné vlastnosti a výhody, ktoré vám umožňujú vykonávať úlohy, ako je čítanie a zapisovanie údajov, prístup k hárkom a manipulácia s hodnotami buniek.

Začlenením metód popísaných v tomto článku môžete efektívne pracovať so súbormi programu Excel, rozšíriť možnosti svojich projektov a zlepšiť svoje zručnosti v oblasti analýzy údajov a manipulácie s nimi.

Keď budete pokračovať v používaní týchto knižníc a skúmaní ich funkcií, stanete sa zdatnejšími v práci s tabuľkami v jazyku Python. Tento článok vás teraz vybavil zručnosťami, ktoré potrebujete na vykonanie práce. Je čas vyskúšať svoje nové zručnosti!


Tabulky proporcí a četností v Excelu

Tabulky proporcí a četností v Excelu

Chtěli jsme se ponořit do tabulek četností v Excelu a také do tabulek proporcí. Podívejte se, co to je a kdy je použít.

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Ako nainštalovať DAX Studio & Tabular Editor v LuckyTemplates

Zistite, ako stiahnuť a nainštalovať DAX Studio a Tabular Editor 3 a ako ich nakonfigurovať na použitie v LuckyTemplates a v Exceli.

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

LuckyTemplates Vizualizácia tvarovej mapy pre priestorovú analýzu

Tento blog obsahuje vizualizáciu Shape Map pre priestorovú analýzu v LuckyTemplates. Ukážem vám, ako môžete efektívne využiť túto vizualizáciu s jej funkciami a prvkami.

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

LuckyTemplates Finančné výkazníctvo: Prideľovanie výsledkov šablónam v každom jednom riadku

V tomto návode predstavujem jedinečný nápad týkajúci sa finančného výkazníctva, ktorý spočíva v prideľovaní výsledkov na vopred určené šablóny tabuliek v rámci LuckyTemplates.

DAX měří v LuckyTemplates pomocí Measure Branching

DAX měří v LuckyTemplates pomocí Measure Branching

Vytvářejte míry DAX v LuckyTemplates pomocí existujících mír nebo vzorců. Tomu říkám technika větvení opatření.

Najvýkonnejšie volanie funkcie v LuckyTemplates

Najvýkonnejšie volanie funkcie v LuckyTemplates

V tomto blogu preskúmajte množinu údajov LuckyTemplates, najvýkonnejšie volanie funkcií, ktoré vám prináša tisíce funkcií M a DAX na dosah ruky.

Techniky modelovania údajov na organizáciu opatrení DAX

Techniky modelovania údajov na organizáciu opatrení DAX

V dnešnom návode sa podelím o niekoľko techník modelovania údajov o tom, ako lepšie usporiadať vaše merania DAX pre efektívnejší pracovný tok.

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates Financial Dashboard: Kompletné tipy na prispôsobenie tabuľky

LuckyTemplates je skvelý nástroj pre finančné výkazníctvo. Tu je návod, ako vytvoriť prispôsobené tabuľky pre váš finančný dashboard LuckyTemplates.

Osvedčené postupy toku jazyka Power Query

Osvedčené postupy toku jazyka Power Query

V tomto návode sa bude diskutovať o toku jazyka Power Query a o tom, ako môže pomôcť vytvoriť hladkú a efektívnu zostavu údajov.

LuckyTemplates vlastní ikony | Vizualizační technika PBI

LuckyTemplates vlastní ikony | Vizualizační technika PBI

Budu diskutovat o jedné z mých oblíbených technik kolem vlastních ikon LuckyTemplates, která používá vlastní ikony dynamickým způsobem ve vizuálech LuckyTemplates.