Sådan åbnes en Excel-fil i Python: Trin-for-trin

At arbejde med Excel-filer er en almindelig opgave i dagligdagen for mange fagfolk, nogle af os elsker det, og andre hader det. Python tilbyder dog flere biblioteker for at gøre denne proces nemmere, mere strømlinet og mere effektiv.

Både Pandas-biblioteket og openpyxl giver brugerne mulighed for at åbne en excel-fil i Python. Pandas har en indbygget metode, der gør det nemt, mens openpyxl er fantastisk, når du har brug for mere kontrol over filens struktur og formatering.

I denne artikel vil vi udforske forskellige metoder til at åbne og arbejde med regneark i Python ved hjælp af disse biblioteker. Med denne viden vil du være i stand til effektivt at behandle og analysere Excel-data ved hjælp af de kraftfulde værktøjer fra Pythons omfattende økosystem!

Sådan åbnes en Excel-fil i Python: Trin-for-trin

Indholdsfortegnelse

Hvad er forudsætningerne?

Før du dykker ned i processen med at åbne en Excel-fil i Python, er der et par forudsætninger, der skal være på plads. Først og fremmest bør du have en grundlæggende forståelse af Python-programmering, herunder variabler, funktioner og import af biblioteker.

Dette vil hjælpe dig med nemt at forstå og arbejde med kodeeksemplerne i artiklen.

Ud over grundlæggende Python-viden er det også vigtigt at installere de nødvendige biblioteker. Der er flere tilgængelige Python-biblioteker til at arbejde med Excel-filer, herunder:

  • pandas: Et kraftfuldt datamanipulationsbibliotek.

  • openpyxl: Et populært bibliotek til at læse og skrive Excel-filer.

  • xlrd: Et bibliotek til at læse data og formatere information fra Excel-filer.

  • xlwt: Et bibliotek til at skrive data og formatere information til Excel-filer.

  • xlutils: En suite af værktøjer til at arbejde med Excel-projektmapper, herunder læsning, skrivning og ændring af data.

For at installere et af de ovennævnte biblioteker ved hjælp af pip, skal du åbne kommandoprompten eller terminalen og skrive følgende kommando, og erstatte ` biblioteksnavn` med det ønskede bibliotek:

pip install 

En anden afgørende forudsætning er at have et regneark at arbejde med. Du bør forberede en Excel-projektmappe, der indeholder data, du ønsker at manipulere med Python.

Du kan downloade eksempelprojektmapper fra Microsoft og andre vejledningswebsteder.

Selvom filen kan have flere ark og forskellig formatering, er det tilrådeligt at starte med et simpelt datasæt til den indledende indlæringsproces. Du kan tackle komplekse regneark, når du får mere erfaring og forståelse for de biblioteker, der bruges.

Sådan åbnes en Excel-fil i Python: Trin-for-trin

Sådan installerer du nødvendige biblioteker

For at arbejde med Excel-regneark i Python skal du installere de relevante biblioteker. Der er flere tilgængelige biblioteker til dette formål, men to af de mest populære er openPyXL og xlrd .

OpenPyXL er et Python-bibliotek, der gør det muligt at læse og skrive Excel-filer (specifikt xltm-, xlsm-, xltx- og xlsx-filer). Det kræver ikke, at Microsoft Excel er installeret og fungerer på alle platforme. For at installere OpenPyXL ved hjælp af pip skal du køre følgende kommando i din terminal:

pip install openpyxl

På den anden side er xlrd et andet meget brugt bibliotek til at læse data og formatere information fra Excel-filer. Det understøtter specifikt xls og xlsx filformater.

For at installere xlrd ved hjælp af pip skal du køre følgende kommando i din terminal:

pip install xlrd

Når det ønskede bibliotek er installeret, kan man fortsætte med at læse eller skrive Excel-filer i Python. Hvert bibliotek har sine unikke funktioner og syntaks, så det er vigtigt at vælge det, der passer bedst til dine behov.

2 måder, hvordan man åbner en Excel-fil i Python

I dette afsnit vil vi diskutere to populære metoder til at åbne et Excel-regneark. Vi vil undersøge, hvordan du kan gøre dette med både Pandas- og Openpyxl-bibliotekerne.

1.Brug af pandaer

Pandas er et kraftfuldt dataanalysebibliotek i Python, der giver praktiske funktioner til at læse, skrive og manipulere data fra forskellige formater, inklusive Excel- og CSV-filformater.

Du kan tjekke dens muligheder i denne video om, hvordan man gensampler tidsseriedata ved hjælp af pandaer til at forbedre analyse:

For at åbne et Excel-regneark ved hjælp af Pandas skal du følge instruktionerne nedenfor:

  1. Installer først Pandas-biblioteket, hvis du ikke allerede har gjort det. Du kan installere det ved hjælp af pip:

    pip install pandas
    Sådan åbnes en Excel-fil i Python: Trin-for-trin
  2. Importer derefter pandaer i dit Python-script og brug funktionen read_excel() til at indlæse filen:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Dette vil læse det angivne Excel-ark ind i en Pandas DataFrame, som derefter nemt kan manipuleres ved hjælp af forskellige indbyggede funktioner.

Bemærk: Hvis du ikke angiver et arknavn, vil pandas-biblioteket importere alle arkene og gemme dem i en ordbog. Du kan få adgang til disse ark ved at bruge arknavnet som en nøgle.

Hvis du for eksempel ønsker at hente et ark med navnet ' månedlig_rapport ', kan du bruge koden nedenfor:

print(df['monthly_report'])

2.Brug af openpyxl

Openpyxl er et andet populært bibliotek i Python til at arbejde specifikt med Excel-filer. For at åbne en Excel-projektmappe i Python ved hjælp af Openpyxl skal du følge instruktionerne nedenfor:

  1. Installer først openpyxl, hvis du ikke allerede har gjort det. Du kan installere det ved hjælp af pip:

    pip install openpyxl
  2. Importer derefter openpyxl i din Python IDE og brug funktionen l oad_workbook() til at indlæse din Excel-projektmappe:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Dette vil indlæse den angivne Excel-fil og give adgang til dens ark, rækker og individuelle celler, så du nemt kan arbejde med dens data.

Både Pandas og openpyxl er kraftfulde biblioteker, der giver dig mulighed for effektivt at åbne og manipulere Excel-filer i Python. Vælg den, der bedst passer til dine specifikke behov og krav.

Sådan læser du Excel-data i Python?

Læsning af Excel-data i Python kan nemt opnås ved hjælp af Pandas-biblioteket, som giver et kraftfuldt og brugervenligt sæt metoder til at arbejde med tabeldata. I dette afsnit lærer du, hvordan du læser Excel-data ved hjælp af pandaer, med fokus på at få adgang til specifikke ark og hente celleværdier.

Læs specifikt ark

For at læse et specifikt ark fra en Excel-fil ved hjælp af pandaer, skal du blot overføre arknavnet eller arkindekset som en parameter til read_excel-metoden. Her er et eksempel:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Dette kodestykke importerer Pandas-biblioteket og angiver navnet på Excel-regnearket og det ark, der skal læses. Den læser derefter det angivne ark ved hjælp af read_excel() -metoden og udskriver den resulterende DataFrame.

For at importere flere ark til datarammen skal du blot indstille parameteren arknavn til at være lig med Ingen. Dette vil importere alle arkene i projektmappen til din dataramme.

Læs celleværdier

Når du er færdig med at importere data til en pandas DataFrame, kan du få adgang til individuelle celleværdier ved hjælp af DataFrames iat[]- metode. Metoden tager række- og kolonneindekser som sine argumenter.

Her er et eksempel:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Dette kodestykke udtrækker celleværdien ved rækkeindeks 1 og kolonneindeks 2 (svarende til anden række og tredje kolonne) fra den tidligere indlæste DataFrame (df). Efter at have udtrukket celleværdien, udskriver den værdien.

I dette afsnit har du lært, hvordan du læser Excel-data i Python, med fokus på at læse specifikke ark og hente celleværdier ved hjælp af pandas-biblioteket. Denne viden vil gøre dig i stand til effektivt at arbejde med Excel-data i dine Python-projekter.

Sådan manipuleres Excel-data

I dette afsnit vil vi diskutere, hvordan man opdaterer celleværdier og tilføjer eller sletter rækker og kolonner i en Excel-fil ved hjælp af Python. Til disse eksempler vil vi bruge OpenPyXL, da det tilbyder flere metoder, du kan bruge til at ændre eller indsætte data i en Excel-projektmappe.

Opdater celleværdier

For at ændre Excel-celleværdier bruger vi openpyXL-biblioteket. Importer derefter det nødvendige modul og indlæs Excel-projektmappen:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Vælg det Excel-ark, du vil manipulere.

sheet = workbook.active

Den aktive metode vælger det første ark i projektmappen. Hvis du vil vælge et andet ark, skal du bruge projektmappen[< arknavn >]- formatet.

For at ændre en celleværdi skal du blot tildele en ny værdi til den ønskede celle:

sheet['A1'] = "New Value"

Gem endelig den ændrede projektmappe:

workbook.save('example_modified.xlsx')

Tilføj og slet rækker og kolonner

Tilføjelse og sletning af rækker eller kolonner kan nemt gøres med OpenPyXL. Sådan gør du:

Tilføj rækker: Brug funktionen insert_rows() for at indsætte rækker . Følgende eksempel tilføjer to rækker efter den første række:

sheet.insert_rows(2, 2)

Slet rækker: Brug delete_rows()- funktionen for at slette rækker. Følgende eksempel sletter to rækker fra række 3:

sheet.delete_rows(3, 2)

Tilføj kolonner: Brug funktionen insert_cols() for at indsætte kolonner . Følgende eksempel tilføjer to kolonner efter den første kolonne:

sheet.insert_cols(2, 2)

Slet kolonner: Brug delete_cols()- funktionen for at slette kolonner. Følgende eksempel sletter to kolonner fra kolonne 3:

sheet.delete_cols(3, 2)

Husk at gemme den opdaterede projektmappe:

workbook.save('example_modified.xlsx')

Sådan gemmer du en Excel-fil i Python

For at gemme en Excel-fil i Python kan du bruge biblioteker som Pandas eller openpyxl. Begge biblioteker tilbyder forskellige metoder til at skrive data til Excel-filer. I dette afsnit vil vi udforske hver tilgang og give eksempler på, hvordan man gemmer en Excel-fil ved hjælp af Python.

Brug af Pandas: Pandas er et populært bibliotek til datamanipulation og -analyse. Den har en indbygget metode kaldet to_excel() , som giver dig mulighed for at gemme en DataFrame som en Excel-fil:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

I dette eksempel opretter vi et eksempel på DataFrame og gemmer det som en Excel-fil med navnet "output.xlsx" ved hjælp af to_excel()- metoden. Du kan se det resulterende regneark nedenfor.

Sådan åbnes en Excel-fil i Python: Trin-for-trin

Brug af OpenPyXL: openpyxl er et andet kraftfuldt bibliotek, der er specielt designet til at arbejde med Microsoft Excel-filer. Her er et eksempel på, hvordan man gemmer data til en Excel-fil ved hjælp af OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

I dette eksempel opretter vi en ny projektmappe og tilføjer data til det aktive regneark ved hjælp af append()- metoden. Til sidst gemmer vi projektmappen som en Excel-fil med navnet " output_openpyxl.xlsx ".

Sådan åbnes en Excel-fil i Python: Trin-for-trin

Både Pandas og openpyxl giver robust funktionalitet til at gemme Excel-filer i Python. Så dit valg afhænger af kravene og kompleksiteten af ​​dine opgaver.

Tid til at afslutte tingene

I denne artikel udforskede vi forskellige biblioteker til at åbne og arbejde med Excel-filer i Python. Hvert af disse biblioteker har sine egne unikke funktioner og fordele, så du kan udføre opgaver såsom at læse og skrive data, få adgang til ark og manipulere celleværdier.

Ved at inkorporere de metoder, der er diskuteret i denne artikel, kan du effektivt arbejde med Excel-filer, udvide dine projekters muligheder og forbedre dine dataanalyse- og manipulationsevner.

Når du fortsætter med at bruge disse biblioteker og udforske deres funktionaliteter, bliver du dygtigere til at håndtere regneark med Python. Denne artikel har nu udstyret dig med de færdigheder, du skal bruge for at få arbejdet gjort. Det er tid til at teste dine nye færdigheder!


LuckyTemplates What-If-parameterfunktion

LuckyTemplates What-If-parameterfunktion

Denne blog introducerer den nye funktion i LuckyTemplates, What-If-analyseparameteren. Du vil se, hvordan det gør alt hurtigt og nemt til din scenarieanalyse.

Brug LuckyTemplates Mål forgrening for at kontrollere, om dine avancer udvides, efterhånden som omsætningen vokser

Brug LuckyTemplates Mål forgrening for at kontrollere, om dine avancer udvides, efterhånden som omsætningen vokser

Lær, hvordan du afgør, om din omsætningsvækst er god ved at kontrollere, om dine avancer er udvidet ved hjælp af LuckyTemplates, der måler forgrening.

LuckyTemplates-parametre via forespørgselseditor

LuckyTemplates-parametre via forespørgselseditor

Lær og forstå, hvordan du kan oprette og bruge LuckyTemplates Parameters, som er en kraftfuld funktion i Query Editor.

Rundt søjlediagram – en visualisering til dit dashboard

Rundt søjlediagram – en visualisering til dit dashboard

Denne vejledning vil diskutere om oprettelse af et rundt søjlediagram ved hjælp af Charticulator. Du lærer, hvordan du designer dem til din LuckyTemplates-rapport.

PowerApps funktioner og formler | En introduktion

PowerApps funktioner og formler | En introduktion

Lær, hvordan du bruger PowerApps-funktioner og -formler til at forbedre funktionaliteten og ændre adfærd i vores Power Apps-lærredsapp.

Pipe In R: Tilslutningsfunktioner med Dplyr

Pipe In R: Tilslutningsfunktioner med Dplyr

I denne øvelse lærer du, hvordan du kæder funktioner sammen ved hjælp af dplyr-røroperatoren i programmeringssproget R.

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX Deep Dive: A Lucky Templates DAX-funktion

RANKX fra LuckyTemplates giver dig mulighed for at returnere rangeringen af ​​et specifikt tal i hver tabelrække, der udgør en del af en liste over tal.

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Udpakning af LuckyTemplates-temaer og -billeder fra PBIX

Lær, hvordan du adskiller en PBIX-fil for at udtrække LuckyTemplates-temaer og -billeder fra baggrunden og bruge den til at oprette din rapport!

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

Excel Formler Snydeark: Mellemvejledning

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det

LuckyTemplates kalendertabel: Hvad er det, og hvordan man bruger det