Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Práca s excelovými súbormi je bežnou úlohou v každodennom živote mnohých profesionálov, niektorí z nás ju milujú a iní nenávidia. Python však poskytuje niekoľko knižníc, ktoré tento proces zjednodušia, zefektívnia a zefektívnia.

Knižnica Pandas aj openpyxl umožňujú používateľom otvárať excelový súbor v Pythone. Pandas má zabudovanú metódu, ktorá to uľahčuje, zatiaľ čo openpyxl je skvelý, keď potrebujete väčšiu kontrolu nad štruktúrou a formátovaním súboru.

V tomto článku preskúmame rôzne metódy otvárania a práce s tabuľkami v Pythone pomocou týchto knižníc. S týmito znalosťami budete môcť efektívne spracovávať a analyzovať dáta Excelu pomocou výkonných nástrojov, ktoré poskytuje rozsiahly ekosystém Pythonu!

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Obsah

Aké sú predpoklady?

Predtým, ako sa ponoríte do procesu otvárania súboru Excel v Pythone, je potrebné splniť niekoľko predpokladov. V prvom rade by ste mali mať základné znalosti o programovaní v Pythone, vrátane premenných, funkcií a importu knižníc.

Pomôže vám to jednoducho pochopiť a pracovať s príkladmi kódu uvedenými v článku.

Okrem základných znalostí jazyka Python je dôležitá aj inštalácia potrebných knižníc. Na prácu so súbormi programu Excel je k dispozícii niekoľko knižníc Python, vrátane:

  • pandas: Výkonná knižnica na manipuláciu s údajmi.

  • openpyxl: Populárna knižnica na čítanie a písanie súborov programu Excel.

  • xlrd: Knižnica na čítanie údajov a formátovanie informácií zo súborov programu Excel.

  • xlwt: Knižnica na zapisovanie údajov a formátovanie informácií do súborov programu Excel.

  • xlutils: Sada nástrojov na prácu s excelovými zošitmi vrátane čítania, zápisu a úpravy údajov.

Ak chcete nainštalovať niektorú z vyššie uvedených knižníc pomocou pip, otvorte príkazový riadok alebo terminál a zadajte nasledujúci príkaz, pričom nahraďte ` library_name` želanou knižnicou:

pip install 

Ďalším dôležitým predpokladom je mať tabuľku na prácu. Mali by ste pripraviť excelový zošit obsahujúci údaje, s ktorými chcete manipulovať pomocou Pythonu.

Vzorové pracovné zošity si môžete stiahnuť zo spoločnosti Microsoft a iných stránok s výučbovými programami.

Hoci súbor môže mať viacero listov a rôzne formátovanie, odporúča sa začať s jednoduchým súborom údajov pre počiatočný proces učenia. Keď získate viac skúseností a porozumiete používaným knižniciam, môžete sa pustiť do zložitých tabuliek.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Ako nainštalovať požadované knižnice

Ak chcete pracovať s tabuľkami Excel v Pythone, musíte si nainštalovať príslušné knižnice. Na tento účel je k dispozícii niekoľko knižníc, ale dve z najpopulárnejších sú openPyXL a xlrd .

OpenPyXL je knižnica Pythonu, ktorá umožňuje čítanie a zápis súborov programu Excel (konkrétne súborov xltm, xlsm, xltx a xlsx). Nevyžaduje inštaláciu programu Microsoft Excel a funguje na všetkých platformách. Ak chcete nainštalovať OpenPyXL pomocou pip, spustite vo svojom termináli nasledujúci príkaz:

pip install openpyxl

Na druhej strane je xlrd ďalšou široko používanou knižnicou na čítanie údajov a formátovanie informácií zo súborov programu Excel. Konkrétne podporuje formáty súborov xls a xlsx.

Ak chcete nainštalovať xlrd pomocou pip, spustite nasledujúci príkaz v termináli:

pip install xlrd

Po nainštalovaní požadovanej knižnice môžete pokračovať v čítaní alebo písaní súborov programu Excel v Pythone. Každá knižnica má svoje jedinečné vlastnosti a syntax, preto je nevyhnutné vybrať si tú, ktorá najlepšie vyhovuje vašim požiadavkám.

2 spôsoby, ako otvoriť súbor Excel v Pythone

V tejto časti budeme diskutovať o dvoch populárnych metódach na otvorenie tabuľky programu Excel. Budeme skúmať, ako to môžete urobiť s knižnicami Pandas aj Openpyxl.

1.Používanie Pandy

Pandas je výkonná knižnica na analýzu údajov v jazyku Python, ktorá poskytuje pohodlné funkcie na čítanie, zápis a manipuláciu s údajmi z rôznych formátov vrátane formátov súborov Excel a CSV.

Jeho možnosti si môžete pozrieť v tomto videu o tom, ako prevzorkovať údaje časových radov pomocou Pandas na vylepšenie analýzy:

Ak chcete otvoriť tabuľku Excel pomocou Pandas, postupujte podľa pokynov nižšie:

  1. Najprv si nainštalujte knižnicu Pandas, ak ste tak ešte neurobili. Môžete ho nainštalovať pomocou pip:

    pip install pandas
    Ako otvoriť súbor programu Excel v Pythone: Krok za krokom
  2. Ďalej importujte Pandy do skriptu Python a pomocou funkcie read_excel() načítajte súbor:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Tým sa načíta špecifikovaný hárok Excelu do Pandas DataFrame, s ktorým sa potom dá jednoducho manipulovať pomocou rôznych vstavaných funkcií.

Poznámka: Ak nezadáte názov listu, knižnica pandas importuje všetky listy a uloží ich do slovníka. K týmto hárkom môžete pristupovať pomocou názvu hárka ako kľúča.

Napríklad, ak chcete získať hárok s názvom ' month_report ', môžete použiť kód nižšie:

print(df['monthly_report'])

2.Pomocou openpyxl

Openpyxl je ďalšia populárna knižnica v Pythone na prácu špecificky so súbormi Excel. Ak chcete otvoriť excelový zošit v Pythone pomocou Openpyxl, postupujte podľa pokynov nižšie:

  1. Najprv nainštalujte openpyxl, ak ste tak ešte neurobili. Môžete ho nainštalovať pomocou pip:

    pip install openpyxl
  2. Ďalej importujte openpyxl do vášho Python IDE a pomocou funkcie l load_workbook() načítajte excelový zošit:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Tým sa načíta určený súbor Excel a poskytuje prístup k jeho hárkom, riadkom a jednotlivým bunkám, čo vám umožní jednoducho pracovať s jeho údajmi.

Pandy aj openpyxl sú výkonné knižnice, ktoré vám umožňujú efektívne otvárať a manipulovať s excelovými súbormi v Pythone. Vyberte si ten, ktorý najlepšie vyhovuje vašim špecifickým potrebám a požiadavkám.

Ako čítať údaje Excelu v Pythone?

Čítanie údajov programu Excel v jazyku Python možno ľahko dosiahnuť pomocou knižnice Pandas, ktorá poskytuje výkonnú a jednoducho použiteľnú sadu metód na prácu s tabuľkovými údajmi. V tejto časti sa naučíte, ako čítať údaje programu Excel pomocou pand, so zameraním na prístup ku konkrétnym hárkom a získavanie hodnôt buniek.

Prečítajte si konkrétny list

Ak chcete čítať konkrétny hárok zo súboru programu Excel pomocou pandas, jednoducho musíte zadať názov hárka alebo index hárka ako parameter do metódy read_excel. Tu je príklad:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Tento útržok kódu importuje knižnicu Pandas a špecifikuje názov tabuľky Excel a hárok na čítanie. Potom prečíta zadaný hárok pomocou metódy read_excel() a vytlačí výsledný DataFrame.

Ak chcete do dátového rámca importovať viacero hárkov, stačí nastaviť parameter názov_hárka na hodnotu Žiadne. Týmto sa importujú všetky hárky v zošite do vášho dátového rámca.

Prečítajte si hodnoty buniek

Po dokončení importu údajov do dátového rámca pandas môžete pristupovať k hodnotám jednotlivých buniek pomocou metódy iat[] dátového rámca . Metóda berie ako argumenty riadkové a stĺpcové indexy.

Tu je príklad:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Tento útržok kódu extrahuje hodnotu bunky v indexe riadka 1 a indexe stĺpca 2 (zodpovedajúce druhému riadku a tretiemu stĺpcu) z predtým načítaného DataFrame (df). Po extrahovaní hodnoty bunky vytlačí hodnotu.

V tejto časti ste sa naučili čítať údaje Excelu v Pythone so zameraním na čítanie konkrétnych hárkov a získavanie hodnôt buniek pomocou knižnice pandas. Tieto znalosti vám umožnia efektívne pracovať s údajmi programu Excel vo vašich projektoch Python.

Ako manipulovať s údajmi programu Excel

V tejto časti budeme diskutovať o tom, ako aktualizovať hodnoty buniek a pridávať alebo odstraňovať riadky a stĺpce v súbore Excel pomocou Pythonu. Pre tieto príklady budeme používať OpenPyXL, pretože ponúka niekoľko metód, ktoré môžete použiť na zmenu alebo vloženie údajov do zošita programu Excel.

Aktualizujte hodnoty buniek

Na úpravu hodnôt buniek Excelu použijeme knižnicu openpyXL. Ďalej importujte požadovaný modul a načítajte zošit programu Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Vyberte hárok programu Excel, s ktorým chcete manipulovať.

sheet = workbook.active

Aktívna metóda vyberie prvý hárok v zošite. Ak chcete vybrať iný hárok, použite formát zošita[< názov hárku >] .

Ak chcete zmeniť hodnotu bunky, jednoducho priraďte novú hodnotu k požadovanej bunke:

sheet['A1'] = "New Value"

Nakoniec upravený zošit uložte:

workbook.save('example_modified.xlsx')

Pridať a odstrániť riadky a stĺpce

Pridávanie a odstraňovanie riadkov alebo stĺpcov je možné jednoducho vykonať pomocou OpenPyXL. Tu je postup:

Pridať riadky: Ak chcete vložiť riadky, použite funkciu insert_rows() . Nasledujúci príklad pridá dva riadky za prvý riadok:

sheet.insert_rows(2, 2)

Odstrániť riadky: Ak chcete odstrániť riadky, použite funkciu delete_rows() . Nasledujúci príklad vymaže dva riadky začínajúce od riadku 3:

sheet.delete_rows(3, 2)

Pridať stĺpce: Ak chcete vložiť stĺpce, použite funkciu insert_cols() . Nasledujúci príklad pridá dva stĺpce za prvý stĺpec:

sheet.insert_cols(2, 2)

Odstrániť stĺpce: Ak chcete odstrániť stĺpce, použite funkciu delete_cols() . Nasledujúci príklad vymaže dva stĺpce začínajúce od stĺpca 3:

sheet.delete_cols(3, 2)

Nezabudnite uložiť aktualizovaný zošit:

workbook.save('example_modified.xlsx')

Ako uložiť súbor Excel v Pythone

Ak chcete uložiť súbor Excel v Pythone, môžete použiť knižnice, ako sú Pandas alebo openpyxl. Obe knižnice ponúkajú rôzne metódy zapisovania údajov do súborov programu Excel. V tejto časti preskúmame každý prístup a poskytneme príklady, ako uložiť súbor Excel pomocou Pythonu.

Používanie Pandas: Pandas je populárna knižnica na manipuláciu a analýzu údajov. Má vstavanú metódu s názvom to_excel() , ktorá vám umožňuje uložiť DataFrame ako súbor programu Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

V tomto príklade vytvoríme vzorový DataFrame a uložíme ho ako súbor programu Excel s názvom „output.xlsx“ pomocou metódy to_excel() . Výslednú tabuľku si môžete pozrieť nižšie.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Používanie OpenPyXL: openpyxl je ďalšia výkonná knižnica špeciálne navrhnutá na prácu so súbormi Microsoft Excel. Tu je príklad, ako uložiť údaje do súboru Excel pomocou OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

V tomto príklade vytvoríme nový zošit a pridáme údaje do aktívneho hárka pomocou metódy append() . Nakoniec zošit uložíme ako súbor programu Excel s názvom „ output_openpyxl.xlsx “.

Ako otvoriť súbor programu Excel v Pythone: Krok za krokom

Pandy aj openpyxl poskytujú robustnú funkčnosť na ukladanie súborov Excel v Pythone. Takže váš výber závisí od požiadaviek a zložitosti vašich úloh.

Čas zabaliť veci

V tomto článku sme preskúmali rôzne knižnice na otváranie a prácu so súbormi Excel v Pythone. Každá z týchto knižníc má svoje vlastné jedinečné vlastnosti a výhody, ktoré vám umožňujú vykonávať úlohy, ako je čítanie a zapisovanie údajov, prístup k hárkom a manipulácia s hodnotami buniek.

Začlenením metód popísaných v tomto článku môžete efektívne pracovať so súbormi programu Excel, rozšíriť možnosti svojich projektov a zlepšiť svoje zručnosti v oblasti analýzy údajov a manipulácie s nimi.

Keď budete pokračovať v používaní týchto knižníc a skúmaní ich funkcií, stanete sa zdatnejšími v práci s tabuľkami v jazyku Python. Tento článok vás teraz vybavil zručnosťami, ktoré potrebujete na vykonanie práce. Je čas vyskúšať svoje nové zručnosti!


Vytvoření tabulky data v LuckyTemplates

Vytvoření tabulky data v LuckyTemplates

Zjistěte, proč je důležité mít vyhrazenou tabulku s daty v LuckyTemplates, a naučte se nejrychlejší a nejefektivnější způsob, jak toho dosáhnout.

LuckyTemplates Mobile Reporting Tipy a techniky

LuckyTemplates Mobile Reporting Tipy a techniky

Tento stručný návod zdůrazňuje funkci mobilního hlášení LuckyTemplates. Ukážu vám, jak můžete efektivně vytvářet přehledy pro mobily.

Profesionální servisní analytické zprávy v LuckyTemplates

Profesionální servisní analytické zprávy v LuckyTemplates

V této ukázce LuckyTemplates si projdeme sestavy ukazující profesionální analýzy služeb od firmy, která má více smluv a zákaznických vztahů.

Aktualizácie Microsoft Power Platform | Microsoft Ignite 2021

Aktualizácie Microsoft Power Platform | Microsoft Ignite 2021

Pozrite si kľúčové aktualizácie pre Power Apps a Power Automate a ich výhody a dôsledky pre platformu Microsoft Power Platform.

Bežné funkcie SQL: Prehľad

Bežné funkcie SQL: Prehľad

Objavte niektoré bežné funkcie SQL, ktoré môžeme použiť, ako napríklad reťazec, dátum a niektoré pokročilé funkcie na spracovanie alebo manipuláciu s údajmi.

Vytvoření šablony LuckyTemplates: Průvodce a tipy

Vytvoření šablony LuckyTemplates: Průvodce a tipy

V tomto tutoriálu se naučíte, jak vytvořit dokonalou šablonu LuckyTemplates, která je nakonfigurována podle vašich potřeb a preferencí.

Parametry pole a malé násobky v LuckyTemplates

Parametry pole a malé násobky v LuckyTemplates

V tomto blogu si ukážeme, jak vrstvit parametry pole s malými násobky, abychom vytvořili neuvěřitelně užitečné přehledy a vizuály.

LuckyTemplates Rank a vlastní seskupení

LuckyTemplates Rank a vlastní seskupení

V tomto blogu se dozvíte, jak používat funkce hodnocení LuckyTemplates a vlastní seskupování k segmentaci ukázkových dat a jejich seřazení podle kritérií.

Zobrazení kumulativního součtu pouze do určitého data v LuckyTemplates

Zobrazení kumulativního součtu pouze do určitého data v LuckyTemplates

V tomto tutoriálu se budu zabývat konkrétní technikou, jak zobrazit kumulativní součet pouze do určitého data ve vašich vizuálech v LuckyTemplates.

Bullet Charts: Pokročilé vlastní vizuální prvky pro LuckyTemplates

Bullet Charts: Pokročilé vlastní vizuální prvky pro LuckyTemplates

Naučte se vytvářet a přizpůsobovat Bullet grafy v LuckyTemplates, které se používají hlavně pro měření výkonu oproti cílovým nebo předchozím rokům.