python 讀寫 excel有很多選擇,但是,方便操作的庫不多,在我嘗試了幾個庫之后,我覺得兩個比較方便的庫是xlrd/xlwt、openpyxl。
之所以推薦這兩個庫是因為這兩個庫分別操作的是不同版本的excel,xlrd操作的是xls/xlxs格式的excel,openpyxl只支持xlxs格式的excel,openpyxl使用起來更方便一些。
安裝
pip install openpyxl
如果excel里面有圖片(jpeg,png,bmp,......)需要安裝圖片處理模塊
pip install pillow
excel寫
from openpyxl import Workbook wb = Workbook()
創建一個新的工作簿
ws1 = wb.create_sheet("Mysheet") #默認最后一個
ws1.sheet_properties.tabColor="0000FF" #修改工作表標簽顏色
ws2 = wb.create_sheet("Mysheet", 0) #第一個
ws3 = wb.get_sheet_by_name('Sheet')
ws3.title = "Test"
拷貝模板做新表
ws3 = wb.copy_worksheet(wb['Sheet1'])
保存
wb.save('balances.xlsx')
修改工作簿的名稱
ws.title = "New Title"
獲取所有工作簿名稱
print(wb.sheetnames)
獲取其中一個工作簿名稱
for sheet in wb: print(sheet) wb["New Title"] #直接獲取名稱為New Title的工作薄
刪除工作表
wb.remove_sheet(wb.get_sheet_by_name(“中文表名”))
wb.remove_sheet(ws2)
excel寫數據
ws['A4']=4 #這將返回A4處的單元格,如果尚不存在,則創建一個單元格。值可以直接分配 ws.cell(row=4, column=2, value=10) # 也可以通過cell來進行寫入,通過行數和列數來找到單元格所在的位置,通過value來賦值
ws.cell(row=3, column=2).value = "AAAAA"
excel讀
from openpyxl import load_workbook #導入模塊 wb = load_workbook(filename = 'balances.xlsx') #打開文件,默認可讀寫,若有需要可以指定write_only和read_only為True sheet = wb['test2'] #找到工作表 print(sheet['B4'].value) #輸出內容 # B9處寫入平均值 sheet['B9'] = '=AVERAGE(B2:B8)'
附上load_workbook()6個參數: - filename: string類型,文件路徑 或路徑對象 - read_only:布爾型,超大型文件,為節省內存,建議開啟此參數 - keep_vba :布爾型,True則保留vba代碼 - guess_types:布爾型, 讀取單元格數據類型時,啟用或禁用類型推斷 - data_only:布爾型,True則包含公式的單元格,顯示最近計算結果 - keep_links:布爾型,True保留外部鏈接
但是如果是讀取的時候需要加上data_only-True這樣讀到的B9返回的就是數字,如果不加這個參數,返回的是公式本身‘-AVERRAGE(B2:B8)'
append函數
可以一次添加多行數據,從第一行空白開始寫入(下面都是空白行)
import openpyxl
wb = openpyxl.Workbook()
ws1 = wb.get_sheet_by_name('Sheet')
ws1.title = "Test"
DATA = [
['第一天', 123, 12, 123, 900, 231, 7],
['第二天', 13, 56, 3, 900, 231, 90],
['第三天', 216, 38, 37, 543, 55, 376],
['第四天', 89, 99, 88, 453, 87, 527]
]
for row in DATA:
ws1.append(row)
獲得最大行和最大列
print(sheet.max_row) print(sheet.max_column)
獲取行和列
sheet.rows為生成器,里面是每一行的數據,每一行又有一個tuple包裹。
sheet.columns類似,不過里邊的每個tuple是每一列單元格。
# 因為按行,所以返回A1, B1, C1這樣的順序 for row in sheet.rows: for cell in row: print(cell.value) # A1, A2, A3這樣的順序 for column in sheet.columns: for cell in column: print(cell.value)
上面的代碼就可以獲得所有所有單元格的數據。如果要獲得某行的數據呢?給其一個索引就行了,因為sheet.rows是生成器類型,不能使用索引,轉換成list后在使用,list(sheet.rows)[2]這樣就獲得第三行的tuplle對象。
for cell in list(sheet.rows)[2]: print(cell.value)
如何獲得任意區間的單元格?
可以使用range函數,下面的寫法,獲得了以A1為左上角,B3為右下角矩形區域的所有單元格,注意range是從1開始的,因為在openpyxl中為了和excel中的表達方式一致並不和編程語言的習慣以0表示第一個值。
還可以像使用切片那樣使用。sheet['A1':B3']返回一個tuple,該元組內部還是元組,由每行的單元格構成。
for row_cell in sheet_ranges['A1':'B3']: for cell in row_cell: print(cell)
設置單元格風格--Style
先導入需要的類
from openpyxl.styles import Font, colors, Alignment
分別可指定字體相關,顏色,對齊方式。
字體
bold_itatic_24_font = Font(name='等線', size=24, italic=True, color=colors.RED, bold=True) sheet['A1'].font = bold_itatic_24_font
對齊方式
也是直接使用cell的屬性aligment,這里指定垂直居中和水平居中。除了center,還可以使用right,left參數
# 設置B1中的數據垂直居中和水平居中 sheet['B1'].alignment = Alignment(horizontal='center', vertical='center')
設置行高和列寬
有時候數據太長顯示不完,就需要拉長拉高單元格。
# 第2行行高 sheet.row_dimensions[2].height = 40 # C列列寬 sheet.column_dimensions['C'].width = 30
合並和拆分單元格
所謂合並單元格,即以合並區域的左上角的那個單元格為基准,覆蓋其他單元格使之成為一個大的單元格,相反拆分單元格后將這個大單元格的值返回到原來的左上角位置。
# 合並單元格, 往左上角寫入數據即可 sheet.merge_cells('B1:G1') # 合並一行中的幾個單元格 sheet.merge_cells('A1:C3') # 合並一個矩形區域中的單元格
合並后只可以在左上角寫入數據,這就是區間中左邊的坐標。
如果這些要合並的單元格都有數據,只會保留左上角的數據,其他則丟棄。換句話說如果合並前不是在左上角寫入數據,合並后單元格不會有數據。
以下是拆分單元格的代碼。拆分后,值回到A1位置。
sheet.unmerge_cells('A1:C3')
工作表的標簽顏色修改
import openpyxl wb = openpyxl.Workbook() #ws1 = wb.active ws1 = wb.get_sheet_by_name('Sheet') ws1.title = "Test" ws2 = wb.create_sheet("ABC") wb.create_sheet(u"中文表名") ws1.sheet_properties.tabColor="0000FF" ws2.sheet_properties.tabColor="FF00FF" ws1['A1'] = "hehehe" ws1['B2'] = "hahaha" wb.save("test.xlsx")
遍歷方式向多個單元格中寫入值:
import openpyxl wb = openpyxl.Workbook() ws1 = wb.get_sheet_by_name('Sheet') ws1.title = "Test" i = 0 # 遍歷方式1: ws1['A1'] = "遍歷方式1" print("遍歷方式1") j = 1 for col in ws1.iter_cols(min_row=2, min_col=2, max_row=7, max_col=6): print("Cols No." + str(j) + ": ", end="") print(col) j = j + 1 for cell in col: cell.value = i i = i + 1 ws2 = wb.create_sheet("Test2") i = 0 # 遍歷方式2: ws2['A1'] = "遍歷方式2" print("遍歷方式2") j = 1 for row in ws2["B2:F7"]: print("Row No." + str(j) + ": ", end="") print(row) j = j + 1 for cell in row: cell.value = i i = i + 1 wb.save("test.xlsx")
#操作單列 print ws1["A"] for cell in ws1["A"]: print cell.value #操作多列,獲取每一個值 print ws1["A:C"] for column in ws1["A:C"]: for cell in column: print cell.value #操作多行 row_range = ws1[1:3] print row_range for row in row_range: for cell in row: print cell.value print "*"*50 for row in ws1.iter_rows(min_row=1, min_col=1, max_col=3, max_row=3): for cell in row: print cell.value #獲取所有行 print ws1.rows for row in ws1.rows: print row print "*"*50 #獲取所有列 print ws1.columns for col in ws1.columns: print col wb.save("e:\\sample.xlsx")
使用公式
import openpyxl wb = openpyxl.Workbook() ws1 = wb.get_sheet_by_name('Sheet') ws1.title = "Test" DATA = [ ['第一天', 123, 12, 123, 900, 231, 7], ['第二天', 13, 56, 3, 900, 231, 90], ['第三天', 216, 38, 37, 543, 55, 376], ['第四天', 89, 99, 88, 453, 87, 527] ] ws1['A1'] = '這是一個測試用表格' for row in DATA: ws1.append(row) ws1.append(['合計', '=sum(B2:B5)', '=sum(C2:C5)', '=sum(D2:D5)', '=sum(E2:E5)', '=sum(F2:F5)', '=sum(G2:G5)']) wb.save("test.xlsx")
單元格樣式設置
from openpyxl.styles import PatternFill, Font, Alignment, Border, Side
PatternFill 填充
Font 字體
Aignment 對齊
Border 邊框
Side 邊線
font = Font(size=14, bold=True, name='微軟雅黑', color="FF0000") # 字體
alignment = Alignment(horizontal="center", vertical="center", wrap_text=True)
thin = Side(border_style="thin", color="0000FF") # 邊框
border = Border(left=thin, right=thin, top=thin, bottom=thin)
ws1['A1'].alignment = alignment # 對齊方式
ws1['A1'].font = font # 可以一個單元格設置
for row in ws1['A2:G6']: # 可以指定區域設置
for cell in row:
cell.border = border
# 填充單元格樣式
fill = PatternFill(patternType="solid", start_color="33CCFF")
ws1['A1'].fill = fill
for row in ws1.iter_rows(min_row=ws1.max_row, max_col=ws1.max_column):
for cell in row:
cell.fill = PatternFill(patternType="solid", start_color="0066FF")
cell.font = Font(bold=True, color="FFFFFF")
cell.alignment = Alignment(horizontal="center")
wb.save("test.xlsx")