一、openpyxl的介紹和安裝
1.介紹
openpyxl是一個用來讀寫xlsx文件的Python庫,官方文檔https://openpyxl.readthedocs.io/en/stable/tutorial.html.
在使用openpyxl前先要掌握三個對象,即:Workbook(工作簿,一個包含多個Sheet的Excel文件)、Worksheet(工作表,一個Workbook有多個Worksheet,用表名識別,如“Sheet1”,“Sheet2”等)、Cell(單元格,存儲具體的數據對象)三個對象。
2.安裝
pip install openpyxl
二、工作薄基本操作
1.創建一個工作薄
from openpyxl import Workbook wb = Workbook() #創建一個工作簿,默認也至少創建了一個工作表 ws = wb.active #獲得正在運行的工作表,默認第0張;如果是已經存在的工作薄,獲得的是打開Excel顯示的工作表
2.打開已存在的工作簿
from openpyxl import load_workbook wb = load_workbook("文件名稱.xlsx") #打開一個已存在的工作薄
3.保存工作簿
wb.save("文件名稱.xlsx") #保存工作簿,不寫路徑保存在當前文件夾
三、工作表的基本操作
1.創建表
ws1 = wb.create_sheet() #創建一個工作表,默認位置是最后一個,默認名稱是Sheet1(如果前面只有一張工作表);返回工作表 ws2 = wb.create_sheet("test",0) #創建一個工作表,表名是test,位置是第一個 ws3 = wb.create_sheet(title="test2",-1) #創建工作表,表名是test2,位置是倒數第二位
2.選擇表
ws1 = wb["test"] #選擇表名是test的工作表 ws2 = wb.get_sheet_by_name("test") #選擇表名是test的工作表
3.表名
title = ws.title #獲取工作表的表名 ws.title = "newtitle" #修改工作表的表名是newtitle wb.sheetnames #獲取所有的工作表名稱,返回一個列表 wb.get_sheet_names() #獲取所有的工作表名稱,返回一個列表 for sheet in wb: #打印所有工作表名稱 print(sheet)
4.工作表的標簽顏色
ws.sheet_properties.tabColor = "B22222" #設置工作表標簽的背景顏色,使用RGB顏色16進制,RGB顏色參考https://tool.oschina.net/commons?type=3
5.刪除工作表
del wb["Sheet2"] #刪除title是Sheet的工作表 wb.remove(wb["Sheet2"]) #刪除title是Sheet2的工作表
6.復制工作表
ws = wb.copy_worksheet("wb["Sheet"]) #復制Sheet工作表,默認名稱是Sheet Copy ws.title = "Sheet的副本" #把復制的工作表重命名為Sheet的副本
四、單元格的基本操作
1.獲取單個單元格
#獲取單個單元格 cell = ws["A1"] #獲取A1單元格,返回單元格<Cell 'Sheet1'.A1> a = ws["A1"].value #獲取A1單元格的值 a = ws.cell(row=1,column=1).value #獲取A1單元格的值,也可以直接寫ws.cell(1,1)第一個參數是行數,第二個參數是列數
2.按行或是按列獲取單元格
#按行或是列獲取 cells = ws["B"] #獲取第二列的單元格,返回一個元組;有數據或是格式都會被獲取 for cell in cells: print(cell.value) #打印第二列單元格的值 cells = ws[2] #獲取第二行的單元格,返回一個元組 #打印奇數行第二列的單元格的數據 for i in range(1,20,2): print(ws.cell(i,2).value)
3.獲取所有單元格
#獲取所有單元格 cells = list(ws.values) #ws.values獲取所有的單元格數據,返回一個生成器,list生成一個列表;列表里面是元組,每行數據組成一個元組
#再對cells進行切片,可以按行獲取單元格
cells1 = list(ws.values)[1:3] #獲取第二行和第三行
#按行打印所有的單元格
for row in ws.rows: #ws.rows返回一個生成器,返回工作表的所有行,每一行單元格由一個元組包裹;ws.rows直接寫成ws也是一樣的效果
for cell in row:
print(cell.value)
#按列打印所有的單元格
for column in ws.columns: #ws.columns返回一個生成器,返回工作表的所有列,每列單元格由一個元組包裹
for cell in column:
print(cell.value)
4.獲取區域單元格
#獲取區域單元格 cells = ws["A1":"C5"] #獲取A1到C5區域,返回列表,列表里面是元組,每行單元格組成一個元組 for row in cells: for cell in row: print(cell.value) #按行打印 #按行 cells = ws[5:10] #獲取第5到10行單元格,返回列表,列表里面是元組,每行單元格組成一個元組 #按列 cells = ws["A:C"] #獲取第A列到第C列,返回列表,列表里面是元組,每列單元格組成一個元組 #按行 cells = ws.iter_rows(min_row=2,min_col=2,max_row=4,max_col=4) #按行獲取單元格,返回列表,列表里面是元組,每行單元格組成一個元組 #按列 cells = ws.iter_cols(min_row=2,min_col=2,max_row=4,max_col=4) #按列獲取單元格,返回列表,列表里面是元組,每列單元格組成一個元組
5.數字字母轉換
#Excel的列用字母表示,有時需要轉換字母和數字 #數字轉字母 a = openpyxl.utils.get_column_letter(23) print(a) #字母轉數字 b = openpyxl.utils.column_index_from_string("h") print(b)
6.獲取最大行和最大列
#獲取工作表的做大行最大列 max_row = ws.max_row #獲取工作表的最大行,返回數字 max_column = ws.max_column #獲取工作表的最大列,返回數字
#用最大行和最大列來按行獲取工作表數據
for row in range(1,max_row+1):
for col in range(1,max_col+1):
print(ws.cell(row,col).value)
7.寫入單元格
#寫入單元格 ws["A1"] = 1 #在A1位置寫入1 ws["A2"].value = 2 #在A2位置寫入2 ws.cell(3,1,value=3) #在第3行第1列(A3)寫入3 ws.append([1,2,3,4]) #在最后一行的下一行寫入,即在A4寫入1,B4寫入2...
8.插入或刪除
#插入行 ws.insert_rows(idx=2,amount=3) #在第2行前插入3行,也可以省略idx和amount #插入列 ws.insert_columns(2,3) #在第2列前插入3列 #刪除行 ws.delete_rows(2,3) #刪除第2行開始的3行 #刪除列 ws.delete_columns(2,3) #刪除第2列開始的3列
9.移動單元格
#移動單元格,rows是正數,向下移動,負數向上移動;cols是正數向右移動,負數向左移動 ws.move_ range("A1:B3",rows=10,cols=10) #把"A1:B3"單元格向下移10行,向右移10行;移動之前的位置變為空,移動之后的位置如果之前有數據,覆蓋原數據
10.凍結單元格
#凍結單元格,如果要凍結首行就寫"A2",如果要凍結上面2行和左邊2列,就寫"C3" ws.freeze_panes = "A2" #凍結首行
五、實例
1.將每張表中固定單元格的數據聚合
#求一月、二月、三月的D9單元格的和 from openpyxl import load_workbook wb = load_workbook("實例1.xlsx") list = [] for sheet in wb.worksheets: list.append(sheet["D9"].value) print(list) sum1 = sum(list) print(sum1) #列表推導式 sum2 = sum([sheet["D9"].value for sheet in wb.worksheets]) print(sum2)
2.按行或是按列聚合
#按行或是按列聚合,加入總分和平均分 from openpyxl import load_workbook wb = load_workbook("實例2.xlsx") ws = wb.active max_row = ws.max_row #獲取最大行號 max_col = ws.max_column #獲取最大列號 #在列后加入總分 ws.cell(1,column = max_col+1,value="總分") #在最大列后面寫入“總分” for row in ws.iter_rows(min_row=2,min_col=2,max_col=max_col): #選取分數的范圍 list = [] row_index = row[0].row #獲得行號,返回數字 for col in row: list.append(col.value) ws.cell(row_index,max_col+1,value=sum(list)) #在每一行的最后寫入總分 #在行后加入單科平均分 ws.cell(max_row+1,1,value="單科平均分") for col in ws.iter_cols(min_row=2,min_col=2,max_row=max_row): col_index = col[0].column #獲取列號,返回數字 list = [cell.value for cell in col] #列表推導式獲取范圍內每列的數字 ws.cell(max_row+1,col_index,value=round(sum(list)/len(list),2)) #寫入平均分,且保存2位小數;round(a,2)a保存2位小數 wb.save("實例2.xlsx")
3.篩選
#篩選 from openpyxl import load_workbook wb = load_workbook("實例2.xlsx") ws = wb["Sheet2"] for row in ws.iter_rows(min_row=2,min_col=2): for cell in row: print(cell.value) if cell.value == None: #如果單元格的值是空,寫入“缺考” cell.value = "缺考" elif cell.value < 60: #如果單元格的值小於60,加上“(不及格)” cell.value = str(cell.value) + "(不及格)" wb.save("實例2.xlsx")
#刪除低於總分低於250的行 from openpyxl import load_workbook wb = load_workbook("實例2.xlsx") ws = wb["Sheet3"] for row in range(ws.max_row,1,-1): #row表示行號,因為Excel刪除一行之后,下面的數據會上移,行號會變,所以要從下往上刪除 s = sum([cell.value for cell in ws[row][1:]]) #除去第一列,計算一行數據的和為總分 if s < 250: ws.delete_rows(row) wb.save("實例2.xlsx")
4.將單表拆成多表
#將表格按班級拆分 from openpyxl import load_workbook wb = load_workbook("實例3.xlsx") #打開工作薄 ws = wb.active #獲取工作表 dict = {} #字典記錄工作表數據 for row in ws.iter_rows(min_row=2): #獲取第二行開始的所有行數據 row_data = [cell.value for cell in row] #列表推導式獲得每行的數據 if row_data[1] in dict.keys(): #如果班級在字典的鍵里;row_data表示班級,以班級為鍵; dict[row_data[1]] += [row_data] #把行數據添加到鍵的值里面;需要把列表再用一層列表包裹,包裹之后會把列表整個添加;不然+會把列表里的值一個個添加 else: dict[row_data[1]] = [[cell.value for cell in ws[1]]] #如果班級不在鍵里,先加上表格第一行的表頭 dict[row_data[1]] += [row_data] #再添加行數據 for key,value in sorted(dict.items()): #把字典進行排序 ws = wb.create_sheet(key) #創建工作表,表名是鍵名 for data in value: #添加數據 ws.append(data) wb.save("實例3.xlsx")
六、單元格的其他操作
1.合並單元格和取消合並
ws.merge_cells("A1:C5") #合並A1到C5的單元格,如果都有數據,保留A1的數據 ws.merge_cells(start_row=1,end_row=5,start_column=1,end_column=3) #合並A1到C5的單元格 ws.unmerge_cells("A1:C5") #取消合並單元格
2.公式
打開工作薄用data_only=False(默認),寫入公式之后,保存文件;再用data_only=False打開,打印單元格的value是公式;用data_only=True打開,打印value是None。
要獲取單元格的value是數字,要手動打開Excel之后保存,再用data_only=True打開,打印單元格的value是數字,不能保存;用data_only=True打開之后保存,就只有數字沒有公式了。
from openpyxl import load_workbook wb = load_workbook("實例2.xlsx") ws = wb["Sheet4"] ws["D6"] = "=sum(D2:D5)" #使用excel公式 print(ws["D6"].value) #打印出來的值是公式=sum(D4+D5) wb.save("實例2.xlsx")
#如果要讀取出數據,需要手動打開Excel表保存,openpyxl打開Excel時使用data_only=True,不保存 wb = load_workbook("實例2.xlsx") print(wb["D6"]) #打印數字
3.分組
ws.column_dimensions.group("A","C") #按列分組,A到C列為一組 ws.row_dimensions.group(1,3,hidden=True) #按行分組,1到3行為一組,hidden=True表示隱藏分組的行
4.批注
#批注 c = openpyxl.comments.Comment("這是一個注釋","張三") #Comment(text, author, height=79, width=144) ws["K1"].comment = c #給單元格設置批注
5.字體
Font(name=None, sz=None, b=None, i=None, charset=None, u=None, strike=None, color=None, scheme=None, family=None, size=None, bold=None, italic=None, strikethrough=None, underline=None, vertAlign=None, outline=None, shadow=None, condense=None, extend=None)
- name:字體名稱,中文字體名稱前面要加u;例u"微軟雅黑"
- sz/size:字體大小,單位px
- b/bold:是否加粗;True加粗,False不加粗
- i/italic:是否傾斜;True傾斜,False不傾斜
- u/underline:下划線;single單下划線,double雙下划線,singleAccounting會計用單下划線,doubleAccounting會計用雙下划線
- strike/strikethrough:是否顯示刪除線,True顯示刪除線,False不顯示刪除線
- verAlign:superscript上標,subscript下標,baseline
- color:字體顏色,RGB顏色十六進制表示
#設置字體 f = openpyxl.styles.Font(name=u"微軟雅黑",sz=16,bold=True,vertAlign="baseline",color="DC143C") ws["A1"].font = f #只能設置單個單個單元格,如果需要設置區域,要循環設置 #獲取字體 f1 = ws["A1'].font
6.對齊
Alignment(horizontal=None, vertical=None, textRotation=0, wrapText=None, shrinkToFit=None, indent=0, relativeIndent=0, justifyLastLine=None, readingOrder=0, text_rotation=None, wrap_text=None, shrink_to_fit=None, mergeCell=None)
- horizontal:水平對其方式;"general"常規, "left"靠左, "center"居中, "right"靠右, "fill"填充, "justify"兩端對齊, "centerContinuous"跨列劇中, "distributed"分散對齊
- vertical:垂直對齊方式;"top"頂部, "center"居中, "bottom"底部, "justify"兩端對齊, "distributed"分散對齊
- textRotation/text_rotation:指定文本旋轉角度
- wrapText/wrap_text:是否自動換行
- shrinkToFit/shrink_to_fit:是否縮小字體填充
- indent:指定縮進
#設置對齊 a = openpyxl.styles.Alignment(horizontal = "center",vertical = "center") ws["c1"].alignment = a
7.邊框
Side(style=None, color=None, border_style=None)
- style:邊線樣式;'dashDot','dashDotDot', 'dashed','dotted', 'double','hair', 'medium', 'mediumDashDot', 'mediumDashDotDot','mediumDashed', 'slantDashDot', 'thick', 'thin'
- color:邊線顏色
Border(left=None, right=None, top=None, bottom=None, diagonal=None, diagonal_direction=None, vertical=None, horizontal=None, diagonalUp=False, diagonalDown=False, outline=True, start=None, end=None)
- left:左邊框
- right:左邊框
- top:上邊框
- bottom:下邊框
- diagonal:對角線
#邊框 s = openpyxl.styles.Side(style = "medium",color = "FF69B4") #設置邊線樣式 b = openpyxl.styles.Border(left = s, right = s, top = s, bottom = s) #設置邊框 ws["c2"].border = b
8.填充
PatternFill(patternType=None, fgColor=Color(), bgColor=Color(), fill_type=None, start_color=None, end_color=None)
- patternType/fill_type:填充樣式;'none'不填充,'solid'實心填充,'darkGray'75%灰色,'mediumGray'50%灰色,'lightGray'25%灰色
- fgColor/start_color:前景顏色
- bgColor/end_color:背景顏色
#填充 f = openpyxl.styles.PatternFill(fill_type = "mediumGray", end_color ="FF69B4") f1 = openpyxl.styles.PatternFill(fill_type = "mediumGray",start_color = "FF69B4") ws["C3"].fill = f ws["C4"].fill = f1
9.設置行高和列寬
Excel的默認行高是13.5,默認列寬是8.38;即使行高和列寬被設為0,行高最小也是13.5,列寬最小是8.38
#行高,行高的單位是磅,1個單位=0.3612毫米 ws.row_dimensions[3].height = 50 #設置工作表的第三行的高度是50個單位 #列寬,列寬的單位是0.1英寸,一個單位=2.2862毫米 ws.column_dimensions["C"].width = 50 #設置工作表的C列是50個單位
10.插入圖片
#插入圖片;必須安裝Pillow庫,不然會報錯"You must install Pillow to fetch image objects" img = openpyxl.drawing.image.Image("E:\\圖\\1\\1.jpg") #創建圖片對象 img.height = 100 #設置圖片的高,單位是px img.width = 100 #設置圖片的寬,單位是px ws.add_image(img,"A10") #在A10位置插入圖片
11.插入圖表
11.1 柱狀圖
#制作柱狀圖 from openpyxl import load_workbook from openpyxl import chart wb = load_workbook("實例3.xlsx") ws = wb["Sheet1"] #創建一個柱狀表對象 c = chart.BarChart() #設定數據范圍 data = chart.Reference(ws,min_row = 1, max_row = 4, min_col = 2, max_col = 4) #設置x軸的項目 x = chart.Reference(ws, min_row = 2, max_row = 4, min_col = 1) #柱狀圖添加數據 c.add_data(data,titles_from_data=True) #柱狀圖添加X軸 c.set_categories(x) #在工作表中添加柱狀圖 ws.add_chart(c,"F1") wb.save("實例3.xlsx")
11.2 折線圖
# 制作折線圖 from openpyxl import load_workbook from openpyxl import chart wb = load_workbook("實例4.xlsx") ws = wb.active #創建一個折線圖對象 c = chart.LineChart() #設定數據范圍 data = chart.Reference(ws, min_row=2, max_row=3, min_col=1, max_col=13) #設置x軸項目 x = chart.Reference(ws, min_row=1, min_col=2, max_col=13) c.add_data(data, from_rows=True, titles_from_data=True) #因為title在行首,from_rows=True c.set_categories(x) #在工作表的B5位置添加折線圖 ws.add_chart(c,"B5") wb.save("實例4.xlsx")
11.3 餅狀圖
#餅圖 from openpyxl import load_workbook from openpyxl import chart wb = load_workbook("實例4.xlsx") ws = wb["Sheet2"] pie = chart.PieChart() data = chart.Reference(ws, min_row=2, max_row=7, min_col=2) x = chart.Reference(ws, min_row=2, max_row=7, min_col=1) pie.add_data(data) pie.set_categories(x) pie.title = "餅狀圖" #設置餅狀圖的標題 ws.add_chart(pie,"D1") wb.save("實例4.xlsx")