Як відкрити файл Excel на Python: крок за кроком

Робота з файлами Excel є звичайним завданням у повсякденному житті багатьох професіоналів, деякі з нас люблять це, а інші ненавидять. Однак Python надає кілька бібліотек, щоб зробити цей процес простішим, оптимізованішим і ефективнішим.

І бібліотека Pandas, і openpyxl дозволяють користувачам відкривати файл excel на Python. Pandas має вбудований метод, який полегшує роботу, тоді як openpyxl чудово підходить, коли вам потрібно більше контролювати структуру та форматування файлу.

У цій статті ми розглянемо різні методи відкриття та роботи з електронними таблицями в Python за допомогою цих бібліотек. Володіючи цими знаннями, ви зможете ефективно обробляти й аналізувати дані Excel за допомогою потужних інструментів, наданих великою екосистемою Python!

Як відкрити файл Excel на Python: крок за кроком

Зміст

Які передумови?

Перш ніж заглибитися в процес відкриття файлу Excel у Python, потрібно виконати кілька попередніх умов. Перш за все, ви повинні мати базове розуміння програмування Python, включаючи змінні, функції та бібліотеки для імпорту.

Це допоможе вам легко зрозуміти та працювати з прикладами коду, наведеними в статті.

Окрім базових знань Python, важливо також встановити необхідні бібліотеки. Існує декілька бібліотек Python для роботи з файлами Excel, зокрема:

  • pandas: потужна бібліотека для обробки даних.

  • openpyxl: популярна бібліотека для читання та запису файлів Excel.

  • xlrd: бібліотека для читання даних і форматування інформації з файлів Excel.

  • xlwt: бібліотека для запису даних і форматування інформації у файли Excel.

  • xlutils: набір інструментів для роботи з книгами Excel, включаючи читання, запис і зміну даних.

Щоб установити будь-яку з наведених вище бібліотек за допомогою pip, відкрийте командний рядок або термінал і введіть таку команду, замінивши ` назва_бібліотеки` на потрібну бібліотеку:

pip install 

Ще одна важлива передумова — наявність електронної таблиці для роботи. Ви повинні підготувати робочу книгу Excel, що містить дані, якими ви хочете маніпулювати за допомогою Python.

Зразки робочих книг можна завантажити з Microsoft та інших навчальних сайтів.

Хоча файл може мати кілька аркушів і різне форматування, бажано почати з простого набору даних для початкового процесу навчання. Ви зможете працювати зі складними електронними таблицями, коли отримаєте більше досвіду та розуміння використовуваних бібліотек.

Як відкрити файл Excel на Python: крок за кроком

Як встановити необхідні бібліотеки

Для роботи з електронними таблицями Excel на Python необхідно встановити відповідні бібліотеки. Для цієї мети доступно кілька бібліотек, але двома найпопулярнішими є openPyXL і xlrd .

OpenPyXL — це бібліотека Python, яка дозволяє читати та записувати файли Excel (зокрема файли xltm, xlsm, xltx і xlsx). Він не потребує встановлення Microsoft Excel і працює на всіх платформах. Щоб інсталювати OpenPyXL за допомогою pip, виконайте таку команду у вашому терміналі:

pip install openpyxl

З іншого боку, xlrd — ще одна широко використовувана бібліотека для читання даних і форматування інформації з файлів Excel. Він зокрема підтримує формати файлів xls і xlsx.

Щоб установити xlrd за допомогою pip, виконайте таку команду у своєму терміналі:

pip install xlrd

Після встановлення потрібної бібліотеки можна продовжити читання або запис файлів Excel на Python. Кожна бібліотека має свої унікальні функції та синтаксис, тому важливо вибрати ту, яка найкраще відповідає вашим вимогам.

2 способи, як відкрити файл Excel на Python

У цьому розділі ми обговоримо два популярних способи відкриття електронної таблиці Excel. Ми досліджуватимемо, як це можна зробити за допомогою бібліотек Pandas і Openpyxl.

1. Використання Pandas

Pandas — це потужна бібліотека аналізу даних на Python, яка надає зручні функції для читання, запису та обробки даних у різних форматах, включаючи формати файлів Excel і CSV.

Ви можете ознайомитися з його можливостями в цьому відео про те, як змінити вибірку даних часових рядів за допомогою Pandas для покращення аналізу:

Щоб відкрити електронну таблицю Excel за допомогою Pandas, виконайте наведені нижче інструкції.

  1. Спочатку встановіть бібліотеку Pandas, якщо ви ще цього не зробили. Ви можете встановити його за допомогою pip:

    pip install pandas
    Як відкрити файл Excel на Python: крок за кроком
  2. Далі імпортуйте Pandas у свій скрипт Python і скористайтеся функцією read_excel(), щоб завантажити файл:

    #Read excel spreadsheets with pandas
    import pandas as pd
    
    file_name = "path/to/your/file.xlsx"  # Replace with your file path
    sheet = "Sheet1"  # Specify the sheet name or number
    df = pd.read_excel(io=file_name, sheet_name=sheet)
    
    print(df.head(5))  # Print first 5 rows of the dataframe
  3. Це зчитує вказаний аркуш Excel у Pandas DataFrame, яким потім можна буде легко керувати за допомогою різноманітних вбудованих функцій.

Примітка. Якщо ви не вкажете назву аркуша, бібліотека pandas імпортує всі аркуші та збереже їх у словнику. Ви можете отримати доступ до цих аркушів, використовуючи назву аркуша як ключ.

Наприклад, якщо ви хочете отримати аркуш під назвою « місячний_звіт », ви можете використати наведений нижче код:

print(df['monthly_report'])

2. Використання openpyxl

Openpyxl — ще одна популярна бібліотека на Python для роботи саме з файлами Excel. Щоб відкрити книгу Excel у Python за допомогою Openpyxl, виконайте наведені нижче інструкції.

  1. Спочатку встановіть openpyxl, якщо ви ще цього не зробили. Ви можете встановити його за допомогою pip:

    pip install openpyxl
  2. Далі імпортуйте openpyxl у вашу IDE Python і скористайтеся функцією l oad_workbook() , щоб завантажити робочу книгу Excel:

    from openpyxl import load_workbook file_name = "path/to/your/file.xlsx"  # Replace with your file path workbook = load_workbook(file_name) sheet = workbook.active  # Selects the first available sheet # Read data from the excel sheet for row in sheet.iter_rows():     print([cell.value for cell in row]) 

Це завантажить вказаний файл Excel і надасть доступ до його аркушів, рядків і окремих клітинок, що дозволить вам легко працювати з його даними.

І Pandas, і openpyxl є потужними бібліотеками, які дозволяють ефективно відкривати файли Excel і працювати з ними на Python. Виберіть той, який найкраще відповідає вашим потребам і вимогам.

Як читати дані Excel на Python?

Читати дані Excel у Python можна легко за допомогою бібліотеки Pandas, яка надає потужний і простий у використанні набір методів для роботи з табличними даними. У цьому розділі ви дізнаєтесь, як читати дані Excel за допомогою панд, зосереджуючись на доступі до певних аркушів і отриманні значень клітинок.

Прочитати конкретний аркуш

Щоб прочитати певний аркуш із файлу Excel за допомогою pandas, вам просто потрібно передати назву аркуша або індекс аркуша як параметр методу read_excel. Ось приклад:

import pandas as pd

file_name = 'example.xlsx'
sheet = 'Sheet1'

df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df)

Цей фрагмент коду імпортує бібліотеку Pandas і вказує назву електронної таблиці Excel і аркуша, який потрібно прочитати. Потім він читає вказаний аркуш за допомогою методу read_excel() і друкує отриманий DataFrame.

Щоб імпортувати декілька аркушів у фрейм даних, просто встановіть для параметра sheet_name значення None. Це імпортує всі аркуші в робочій книзі у ваш фрейм даних.

Прочитайте значення клітинок

Після завершення імпорту даних у DataFrame pandas ви зможете отримати доступ до окремих значень клітинок за допомогою методу iat[] DataFrame . Метод приймає індекси рядків і стовпців як аргументи.

Ось приклад:

cell_value = df.iat[1, 2]

print(f'The cell value at row 2, column 3 is: {cell_value}')

Цей фрагмент коду витягує значення комірки з індексом рядка 1 та індексом стовпця 2 (що відповідає другому рядку та третьому стовпцю) із попередньо завантаженого DataFrame (df). Після вилучення значення клітинки воно друкується.

У цьому розділі ви дізналися, як читати дані Excel у Python, зосереджуючись на читанні певних аркушів і отриманні значень клітинок за допомогою бібліотеки pandas. Ці знання дозволять вам ефективно працювати з даними Excel у ваших проектах Python.

Як маніпулювати даними Excel

У цьому розділі ми обговоримо, як оновити значення клітинок, а також додати або видалити рядки та стовпці у файлі Excel за допомогою Python. Для цих прикладів ми будемо використовувати OpenPyXL, оскільки він пропонує кілька методів, за допомогою яких можна змінити або вставити дані в книгу Excel.

Оновити значення клітинок

Щоб змінити значення клітинок Excel, ми скористаємося бібліотекою openpyXL. Далі імпортуйте необхідний модуль і завантажте книгу Excel:

#Reading excel files with openpyxl

from openpyxl import load_workbook
workbook = load_workbook('example.xlsx')

Виберіть аркуш Excel, яким ви хочете маніпулювати.

sheet = workbook.active

Активний метод вибирає перший аркуш у книзі. Якщо ви хочете вибрати інший аркуш, скористайтеся форматом робочої книги [< назва аркуша >] .

Щоб змінити значення клітинки, просто призначте нове значення для потрібної клітинки:

sheet['A1'] = "New Value"

Нарешті, збережіть змінену книгу:

workbook.save('example_modified.xlsx')

Додавання та видалення рядків і стовпців

Додавати та видаляти рядки чи стовпці можна легко за допомогою OpenPyXL. Ось як:

Додати рядки: щоб вставити рядки, використовуйте функцію insert_rows() . Наступний приклад додає два рядки після першого рядка:

sheet.insert_rows(2, 2)

Видалити рядки: щоб видалити рядки, використовуйте функцію delete_rows() . У наступному прикладі видаляються два рядки, починаючи з рядка 3:

sheet.delete_rows(3, 2)

Додати стовпці: щоб вставити стовпці, використовуйте функцію insert_cols() . У наступному прикладі до першого стовпця додається два стовпці:

sheet.insert_cols(2, 2)

Видалити стовпці: щоб видалити стовпці, скористайтеся функцією delete_cols() . У наступному прикладі видаляються два стовпці, починаючи зі стовпця 3:

sheet.delete_cols(3, 2)

Не забудьте зберегти оновлену книгу:

workbook.save('example_modified.xlsx')

Як зберегти файл Excel на Python

Щоб зберегти файл Excel у Python, ви можете використовувати такі бібліотеки, як Pandas або openpyxl. Обидві бібліотеки пропонують різні методи запису даних у файли Excel. У цьому розділі ми розглянемо кожен підхід і наведемо приклади того, як зберегти файл Excel за допомогою Python.

Використання Pandas: Pandas — це популярна бібліотека для обробки та аналізу даних. Він має вбудований метод to_excel() , який дозволяє зберегти DataFrame як файл Excel:


import pandas as pd

# Creating a sample DataFrame
data = {'Column1': [1, 2, 3],
        'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Saving the DataFrame to an Excel file
df.to_excel('output.xlsx', index=False)

У цьому прикладі ми створюємо зразок DataFrame і зберігаємо його як файл Excel під назвою «output.xlsx» за допомогою методу to_excel() . Отриману електронну таблицю можна побачити нижче.

Як відкрити файл Excel на Python: крок за кроком

Використання OpenPyXL: openpyxl — ще одна потужна бібліотека, спеціально розроблена для роботи з файлами Microsoft Excel. Ось приклад того, як зберегти дані у файл Excel за допомогою OpenPyXL:

from openpyxl import Workbook

# Creating a new workbook
wb = Workbook()

# Selecting the active worksheet
ws = wb.active

# Adding data to the worksheet
data = [
    (1, 'A'),
    (2, 'B'),
    (3, 'C'),
    (25, 'Y'),
    (26, 'Z')
]

for row in data:
    ws.append(row)

# Saving the workbook to an Excel file
wb.save('output_openpyxl.xlsx')

У цьому прикладі ми створюємо нову робочу книгу та додаємо дані до активного робочого аркуша за допомогою методу append() . Нарешті, ми зберігаємо книгу як файл Excel під назвою « output_openpyxl.xlsx ».

Як відкрити файл Excel на Python: крок за кроком

І Pandas, і openpyxl забезпечують надійну функціональність для збереження файлів Excel у Python. Отже, ваш вибір залежить від вимог і складності ваших завдань.

Час завершувати справи

У цій статті ми досліджували різні бібліотеки для відкриття та роботи з файлами Excel у Python. Кожна з цих бібліотек має свої унікальні функції та переваги, що дозволяє виконувати такі завдання, як читання та запис даних, доступ до аркушів і маніпулювання значеннями клітинок.

Використовуючи методи, розглянуті в цій статті, ви зможете ефективно працювати з файлами Excel, розширити можливості своїх проектів і вдосконалити навички аналізу даних і маніпулювання ними.

Продовжуючи використовувати ці бібліотеки та досліджуючи їхні функції, ви станете більш досвідченими в роботі з електронними таблицями за допомогою Python. Ця стаття надала вам навички, необхідні для виконання роботи. Настав час випробувати свої нові навички!


Відкрийте для себе унікальні ідеї за допомогою функції TOPN LuckyTemplates

Відкрийте для себе унікальні ідеї за допомогою функції TOPN LuckyTemplates

У цьому блозі представлено функцію LuckyTemplates TOPN DAX, яка дає вам змогу отримувати унікальну статистику з ваших даних, допомагаючи вам приймати кращі маркетингові рішення.

Моделювання даних у LuckyTemplates за допомогою допоміжних таблиць

Моделювання даних у LuckyTemplates за допомогою допоміжних таблиць

Дізнайтеся про деякі фантастичні аналітичні прийоми, які ми можемо використовувати для моделювання даних у LuckyTemplates за допомогою таблиць підтримки DAX.

Розширений DAX для LuckyTemplates: впровадження логіки ранжування в унікальній статистиці

Розширений DAX для LuckyTemplates: впровадження логіки ранжування в унікальній статистиці

Тут ми зануримося в LuckyTemplates Advanced DAX і запровадимо логіку ранжирування, щоб отримати дуже унікальну інформацію. У цьому прикладі я також демонструю розгалуження міри.

Функція параметра LuckyTemplates «Що, якщо».

Функція параметра LuckyTemplates «Що, якщо».

У цьому блозі представлено нову функцію в LuckyTemplates — параметр аналізу «Що, якщо». Ви побачите, як це робить усе швидким і легким для аналізу сценарію.

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Використовуйте розгалуження міри LuckyTemplates, щоб перевірити, чи зростає ваша маржа зі зростанням доходу

Дізнайтеся, як визначити, чи добре зростає ваш дохід, перевіривши, чи зросла ваша маржа за допомогою розгалуження міри LuckyTemplates.

Параметри LuckyTemplates через редактор запитів

Параметри LuckyTemplates через редактор запитів

Дізнайтеся та зрозумійте, як можна створювати та використовувати параметри LuckyTemplates, які є потужною функцією редактора запитів.

Кругла гістограма – візуалізація для вашої інформаційної панелі

Кругла гістограма – візуалізація для вашої інформаційної панелі

У цьому підручнику буде обговорено створення круглої гістограми за допомогою Charticulator. Ви дізнаєтеся, як створити їх для звіту LuckyTemplates.

Функції та формули PowerApps | Вступ

Функції та формули PowerApps | Вступ

Дізнайтеся, як використовувати функції та формули PowerApps, щоб покращити функціональність і змінити поведінку в нашій програмі Canvas Power Apps.

Труба в R: підключення функцій за допомогою Dplyr

Труба в R: підключення функцій за допомогою Dplyr

У цьому підручнику ви дізнаєтесь, як об’єднати функції разом за допомогою оператора каналу dplyr мовою програмування R.

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX Deep Dive: функція LuckyTemplates DAX

RANKX від LuckyTemplates дозволяє повернути рейтинг певного числа в кожному рядку таблиці, який є частиною списку чисел.