相比於比較古老的xlrd、xlwt,oenpyxl(可讀寫excel表)專門處理Excel2007及以上版本產生的xlsx文件而不再支持Excel2003版本
解決方案:
openpyxl。這是一個非常簡單的庫,有幾分鍾就能上手了。安裝非常簡單,pip install openpyxl一步搞定,我就主要來說說對excel的操作。當然,前面廢話那么多,同學們差不多也能猜到了吧,openpyxl只能操作xlsx文件而不能操作xls文件。
1、基本概念
在openpyxl中,主要用到三個概念:Workbooks,Sheets,Cells。Workbook就是一個excel工作表;Sheet是工作表中的一張表頁;Cell就是簡單的一個格。openpyxl就是圍繞着這三個概念進行的,不管讀寫都是“三板斧”:打開Workbook,定位Sheet,操作Cell。下面分讀和寫分別介紹幾個常見的方法。
2、讀取xlsx
為了做實驗,我事先准備好了一個excel文檔,里面有Sheet1,Sheet2,Sheet3這三個頁,在Sheet3中填入了如下內容:

首先用
from openpyxl import load_workbook
引入庫。
wb = load_workbook("template.xlsx")
打開一個xlsx文件。
print(wb.sheetnames) # ['Sheet1', 'Sheet2', 'Sheet3']
可以看看打開的excel表里面有哪些sheet頁。
sheet = wb.get_sheet_by_name("Sheet3")
讀取到指定的Sheet頁,sheet就變得神奇了,想要的內容都在這里。比如:
print(sheet["C"]) # (<Cell Sheet3.C1>, <Cell Sheet3.C2>, <Cell Sheet3.C3>, <Cell Sheet3.C4>, <Cell Sheet3.C5>, <Cell Sheet3.C6>, <Cell Sheet3.C7>, <Cell Sheet3.C8>, <Cell Sheet3.C9>, <Cell Sheet3.C10>) <-第C列 print(sheet["4"]) # (<Cell Sheet3.A4>, <Cell Sheet3.B4>, <Cell Sheet3.C4>, <Cell Sheet3.D4>, <Cell Sheet3.E4>) <-第4行 print(sheet["C4"].value) #c4 <-第C4格的值
print(sheet.rows) #<generator object _cells_by_row at 0x0000000003A2EB40> 獲取表格所有行
print(sheet.columns) #<generator object _cells_by_col at 0x0000000003A2EB40> 獲取表格所有列
print(sheet.max_row) # 10 <-最大行數
print(sheet.max_column) # 5 <-最大列數
for i in sheet["C"]:
print(i.value, end=" ") # c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 <-C列中的所有值
3、寫入xlsx
首先用
from openpyxl import Workbook wb = Workbook()
創建一個工作表,然后
sheet = wb.active
找到活動的sheet頁。空的excel表默認的sheet頁就叫Sheet,如果想改名字,可以直接給title屬性賦值。
sheet.title = "New Shit"
這個屬性是可讀可寫的。當然,這個只針對當前活動頁,別的頁的話,可以用create_sheet和remove_sheet進行添加和刪除。
往sheet頁里面寫內容就比較簡單了,跟上面讀一樣,
sheet['C3'] = 'Hello world!' for i in range(10): sheet["A%d" % (i+1)].value = i + 1
我們還可以進行花式操作,比如寫寫公式:
sheet["E1"].value = "=SUM(A:A)"
最后記得保存
wb.save('保存一個新的excel.xlsx')
之后可以打開看看
