Cách đọc tệp excel (xlsx) trong python

How Read Excel File Python



Các .xlsx là phần mở rộng của tài liệu excel có thể lưu trữ một lượng lớn dữ liệu dưới dạng bảng, và nhiều kiểu tính toán số học và logic có thể được thực hiện dễ dàng trong một bảng tính excel. Đôi khi yêu cầu đọc dữ liệu từ tài liệu excel bằng tập lệnh Python cho mục đích lập trình. Nhiều mô-đun tồn tại trong Python để đọc tài liệu excel. Một số mô-đun hữu ích là xlrd , openpyxl , và gấu trúc . Các cách sử dụng các mô-đun này để đọc tệp excel bằng Python đã được trình bày trong hướng dẫn này.

Điều kiện tiên quyết:

Một tệp excel giả có phần mở rộng .xlsx sẽ được yêu cầu để kiểm tra các ví dụ của hướng dẫn này. Bạn có thể sử dụng bất kỳ tệp excel nào hiện có hoặc tạo một tệp mới. Đây, một tệp excel mới có tên sales.xlsx tệp đã được tạo với dữ liệu sau đây. Tệp này đã được sử dụng để đọc bằng cách sử dụng các mô-đun python khác nhau trong phần tiếp theo của hướng dẫn này.







sales.xlsx



Ngày bán hàng Nhân viên bán hàng Số lượng
05/12/18 Sila Ahmed 60000
12/06/19 Tôi Hossain 50.000
20/08/2016 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Ví dụ-1: Đọc tệp excel bằng xlrd

Mô-đun xlrd không được cài đặt bằng Python theo mặc định. Vì vậy, bạn phải cài đặt mô-đun trước khi sử dụng nó. Phiên bản mới nhất của mô-đun này không hỗ trợ tệp excel có phần mở rộng .xlsx. Vì vậy, bạn phải cài đặt phiên bản 1.2.0 của mô-đun này để đọc tệp xlsx. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt phiên bản yêu cầu của xlrd .



$pipTải về xlrd== 1.2.0

Sau khi hoàn tất quá trình cài đặt, hãy tạo một tệp python với tập lệnh sau để đọc sales.xlsx sử dụng tập tin xlrd mô-đun. open_workbook () hàm được sử dụng trong tập lệnh mở tệp xlsx để đọc. Tệp excel này chỉ chứa một trang tính. Nên workbook.sheet_by_index () hàm đã được sử dụng trong tập lệnh với giá trị đối số 0. Tiếp theo, 'vì' vòng lặp đã được sử dụng để đọc các giá trị ô của trang tính bằng cách sử dụng các giá trị hàng và cột. Hai hàm range () đã được sử dụng trong script để xác định kích thước hàng và cột dựa trên dữ liệu trang tính. Các cell_value () hàm đã được sử dụng để đọc giá trị ô cụ thể của trang tính trong mỗi lần lặp lại của vòng lặp. Mỗi trường trong đầu ra sẽ được phân tách bằng một dấu cách tab.





# Nhập mô-đun xlrd
nhập xlrd

# Mở Sổ làm việc
workbook = xlrd.open_workbook('sales.xlsx')

# Mở trang tính
worksheet = workbook.sheet_by_index(0)

# Lặp lại các hàng và cột
tôitrongphạm vi(0,5):
NStrongphạm vi(0,3):
# In các giá trị ô với không gian tab
in(worksheet.cell_value(tôi, j),kết thúc='NS')
in('')

Đầu ra:

Kết quả sau sẽ xuất hiện sau khi thực hiện tập lệnh trên.



Ví dụ-2: Đọc tệp excel bằng openpyxl

Các openpyxl là một mô-đun python khác để đọc tệp xlsx và nó cũng không được cài đặt với Python theo mặc định. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt mô-đun này trước khi sử dụng.

$pipTải vềopenpyxl

Sau khi hoàn tất quá trình cài đặt, hãy tạo một tệp python với tập lệnh sau để đọc sales.xlsx tập tin. Giống như mô-đun xlrd, openpyxl mô-đun có load_workbook () để mở tệp xlsx để đọc. Các sales.xlsx tệp được sử dụng làm giá trị đối số của hàm này. Đối tượng của wookbook.active đã được tạo trong tập lệnh để đọc các giá trị của max_rowmax_column tính chất. Các thuộc tính này đã được sử dụng trong các vòng lặp for lồng nhau để đọc nội dung của sales.xlsx tập tin. Hàm range () đã được sử dụng để đọc các hàng của trang tính và hàm iter_cols () đã được sử dụng để đọc các cột của trang tính. Mỗi trường trong đầu ra sẽ được phân tách bằng hai dấu cách tab.

# Nhập mô-đun openyxl
nhập openpyxl

# Xác định biến để tải wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Xác định biến để đọc trang tính hiện hoạt:
worksheet = wookbook.active

# Lặp lại vòng lặp để đọc các giá trị ô
tôitrongphạm vi(0, worksheet.max_row):
với trongworksheet.iter_cols(1, worksheet.max_column):
in(với[tôi].giá trị,kết thúc='NSNS')
in('')

Đầu ra:

Kết quả sau sẽ xuất hiện sau khi thực hiện tập lệnh trên.

Ví dụ-3: Đọc tệp excel bằng gấu trúc

Mô-đun gấu trúc không được cài đặt bằng python giống như mô-đun trước đó. Vì vậy, nếu bạn chưa cài đặt nó trước đây, thì bạn phải cài đặt nó. Chạy lệnh sau để cài đặt gấu trúc từ thiết bị đầu cuối.

$pipTải vềgấu trúc

Sau khi hoàn tất quá trình cài đặt, hãy tạo một tệp python với tập lệnh sau để đọc sales.xlsx tập tin. Các read_excel () hàm của gấu trúc được sử dụng để đọc tệp xlsx. Hàm này đã được sử dụng trong script để đọc sales.xlsx tập tin. Các Khung dữ liệu() hàm đã sử dụng ở đây để đọc nội dung của tệp xlsx trong khung dữ liệu và lưu trữ các giá trị trong biến có tên dữ liệu . Giá trị của dữ liệu đã được in sau đó.

# Nhập gấu trúc
nhập khẩu gấu trúcnhưpd

# Tải tệp xlsx
excel_data = pd.read_excel('sales.xlsx')
# Đọc các giá trị của tệp trong khung dữ liệu
data = pd.DataFrame(excel_data,cột=['Ngày bán hàng','Nhân viên bán hàng','Số lượng'])
# In nội dung
in('Nội dung của tệp là: ', dữ liệu)

Đầu ra:

Kết quả sau sẽ xuất hiện sau khi thực hiện tập lệnh trên. Đầu ra của tập lệnh này khác với hai ví dụ trước. Số hàng được in trong cột đầu tiên, nơi giá trị hàng đã được đếm từ 0. Giá trị ngày được căn giữa. Tên của các nhân viên bán hàng được căn chỉnh bên phải. Số tiền được căn trái.

Phần kết luận:

Người dùng python cần làm việc với các tệp xlsx cho các mục đích lập trình khác nhau. Ba cách khác nhau để đọc tệp xlsx đã được hiển thị trong hướng dẫn này bằng cách sử dụng ba mô-đun python. Mỗi mô-đun có các chức năng và thuộc tính khác nhau để đọc tệp xlsx. Hướng dẫn này sẽ giúp người dùng python đọc tệp xlsx dễ dàng bằng cách sử dụng tập lệnh python sau khi đọc hướng dẫn này.