python----openpyxl模塊


一、openpyxl的介紹和安裝

1.介紹

openpyxl是一個用來讀寫xlsx文件的Python庫,官方文檔https://openpyxl.readthedocs.io/en/stable/tutorial.html.

在使用openpyxl前先要掌握三個對象,即:Workbook(工作簿,一個包含多個Sheet的Excel文件)、Worksheet(工作表,一個Workbook有多個Worksheet,用表名識別,如“Sheet1”,“Sheet2”等)、Cell(單元格,存儲具體的數據對象)三個對象。

2.安裝

pip install openpyxl

二、工作薄基本操作

1.創建一個工作薄

from openpyxl import Workbook
wb = Workbook()  #創建一個工作簿,默認也至少創建了一個工作表
ws = wb.active   #獲得正在運行的工作表,默認第0張;如果是已經存在的工作薄,獲得的是打開Excel顯示的工作表

2.打開已存在的工作簿

from openpyxl import load_workbook
wb = load_workbook("文件名稱.xlsx")  #打開一個已存在的工作薄

3.保存工作簿

wb.save("文件名稱.xlsx")  #保存工作簿,不寫路徑保存在當前文件夾

三、工作表的基本操作

1.創建表

ws1 = wb.create_sheet()  #創建一個工作表,默認位置是最后一個,默認名稱是Sheet1(如果前面只有一張工作表);返回工作表
ws2 = wb.create_sheet("test",0) #創建一個工作表,表名是test,位置是第一個
ws3 = wb.create_sheet(title="test2",-1) #創建工作表,表名是test2,位置是倒數第二位

2.選擇表

ws1 = wb["test"]  #選擇表名是test的工作表
ws2 = wb.get_sheet_by_name("test")  #選擇表名是test的工作表

3.表名

title = ws.title  #獲取工作表的表名
ws.title = "newtitle"   #修改工作表的表名是newtitle
wb.sheetnames    #獲取所有的工作表名稱,返回一個列表
wb.get_sheet_names()   #獲取所有的工作表名稱,返回一個列表
for sheet in wb:   #打印所有工作表名稱
    print(sheet)

4.工作表的標簽顏色

ws.sheet_properties.tabColor = "B22222"  #設置工作表標簽的背景顏色,使用RGB顏色16進制,RGB顏色參考https://tool.oschina.net/commons?type=3

5.刪除工作表

del wb["Sheet2"]   #刪除title是Sheet的工作表
wb.remove(wb["Sheet2"])   #刪除title是Sheet2的工作表

6.復制工作表

ws = wb.copy_worksheet("wb["Sheet"])   #復制Sheet工作表,默認名稱是Sheet Copy
ws.title = "Sheet的副本"    #把復制的工作表重命名為Sheet的副本

四、單元格的基本操作

1.獲取單個單元格

#獲取單個單元格
cell = ws["A1"]  #獲取A1單元格,返回單元格<Cell 'Sheet1'.A1>
a = ws["A1"].value   #獲取A1單元格的值

a = ws.cell(row=1,column=1).value   #獲取A1單元格的值,也可以直接寫ws.cell(1,1)第一個參數是行數,第二個參數是列數

2.按行或是按列獲取單元格

#按行或是列獲取
cells = ws["B"]  #獲取第二列的單元格,返回一個元組;有數據或是格式都會被獲取
for cell in cells:
    print(cell.value)   #打印第二列單元格的值

cells = ws[2]  #獲取第二行的單元格,返回一個元組

#打印奇數行第二列的單元格的數據
for i in range(1,20,2):
    print(ws.cell(i,2).value)

3.獲取所有單元格

#獲取所有單元格
cells = list(ws.values)   #ws.values獲取所有的單元格數據,返回一個生成器,list生成一個列表;列表里面是元組,每行數據組成一個元組
#再對cells進行切片,可以按行獲取單元格
cells1 = list(ws.values)[1:3] #獲取第二行和第三行
#按行打印所有的單元格
for row in ws.rows: #ws.rows返回一個生成器,返回工作表的所有行,每一行單元格由一個元組包裹;ws.rows直接寫成ws也是一樣的效果
  for cell in row:
    print(cell.value)
#按列打印所有的單元格
for column in ws.columns: #ws.columns返回一個生成器,返回工作表的所有列,每列單元格由一個元組包裹
  for cell in column:
    print(cell.value)

4.獲取區域單元格

#獲取區域單元格
cells = ws["A1":"C5"]  #獲取A1到C5區域,返回列表,列表里面是元組,每行單元格組成一個元組
for row in cells:
    for cell in row:
        print(cell.value)  #按行打印
#按行
cells = ws[5:10]  #獲取第5到10行單元格,返回列表,列表里面是元組,每行單元格組成一個元組
#按列
cells = ws["A:C"]  #獲取第A列到第C列,返回列表,列表里面是元組,每列單元格組成一個元組

#按行
cells = ws.iter_rows(min_row=2,min_col=2,max_row=4,max_col=4)  #按行獲取單元格,返回列表,列表里面是元組,每行單元格組成一個元組
#按列
cells = ws.iter_cols(min_row=2,min_col=2,max_row=4,max_col=4)  #按列獲取單元格,返回列表,列表里面是元組,每列單元格組成一個元組

5.數字字母轉換

#Excel的列用字母表示,有時需要轉換字母和數字
#數字轉字母
a = openpyxl.utils.get_column_letter(23)
print(a)
#字母轉數字
b = openpyxl.utils.column_index_from_string("h")
print(b)

6.獲取最大行和最大列

#獲取工作表的做大行最大列
max_row = ws.max_row  #獲取工作表的最大行,返回數字
max_column = ws.max_column  #獲取工作表的最大列,返回數字
#用最大行和最大列來按行獲取工作表數據
for row in range(1,max_row+1):
  for col in range(1,max_col+1):
    print(ws.cell(row,col).value)

7.寫入單元格

#寫入單元格
ws["A1"] = 1  #在A1位置寫入1
ws["A2"].value = 2  #在A2位置寫入2
ws.cell(3,1,value=3)  #在第3行第1列(A3)寫入3
ws.append([1,2,3,4])  #在最后一行的下一行寫入,即在A4寫入1,B4寫入2...

8.插入或刪除

#插入行
ws.insert_rows(idx=2,amount=3)  #在第2行前插入3行,也可以省略idx和amount
#插入列
ws.insert_columns(2,3)   #在第2列前插入3列
#刪除行
ws.delete_rows(2,3)    #刪除第2行開始的3行
#刪除列
ws.delete_columns(2,3)   #刪除第2列開始的3列

9.移動單元格

#移動單元格,rows是正數,向下移動,負數向上移動;cols是正數向右移動,負數向左移動
ws.move_ range("A1:B3",rows=10,cols=10)  #把"A1:B3"單元格向下移10行,向右移10行;移動之前的位置變為空,移動之后的位置如果之前有數據,覆蓋原數據

10.凍結單元格

#凍結單元格,如果要凍結首行就寫"A2",如果要凍結上面2行和左邊2列,就寫"C3"
ws.freeze_panes = "A2"   #凍結首行

五、實例

1.將每張表中固定單元格的數據聚合

#求一月、二月、三月的D9單元格的和
from openpyxl import load_workbook

wb = load_workbook("實例1.xlsx")
list = []
for sheet in wb.worksheets:
    list.append(sheet["D9"].value)
print(list)
sum1 = sum(list)
print(sum1)

#列表推導式
sum2 = sum([sheet["D9"].value for sheet in wb.worksheets])
print(sum2)

2.按行或是按列聚合

      

#按行或是按列聚合,加入總分和平均分
from openpyxl import load_workbook

wb = load_workbook("實例2.xlsx")
ws = wb.active
max_row = ws.max_row  #獲取最大行號
max_col = ws.max_column  #獲取最大列號
#在列后加入總分
ws.cell(1,column = max_col+1,value="總分")   #在最大列后面寫入“總分”
for row in ws.iter_rows(min_row=2,min_col=2,max_col=max_col):   #選取分數的范圍
    list = []
    row_index = row[0].row  #獲得行號,返回數字
    for col in row:
        list.append(col.value)
    ws.cell(row_index,max_col+1,value=sum(list)) #在每一行的最后寫入總分

#在行后加入單科平均分
ws.cell(max_row+1,1,value="單科平均分")
for col in ws.iter_cols(min_row=2,min_col=2,max_row=max_row):
    col_index = col[0].column  #獲取列號,返回數字
    list = [cell.value for cell in col]  #列表推導式獲取范圍內每列的數字
    ws.cell(max_row+1,col_index,value=round(sum(list)/len(list),2))  #寫入平均分,且保存2位小數;round(a,2)a保存2位小數
wb.save("實例2.xlsx")

3.篩選

     

#篩選
from openpyxl import load_workbook

wb = load_workbook("實例2.xlsx")
ws = wb["Sheet2"]
for row in ws.iter_rows(min_row=2,min_col=2):
    for cell in row:
        print(cell.value)
        if cell.value == None:   #如果單元格的值是空,寫入“缺考”
            cell.value = "缺考" 
        elif cell.value < 60:   #如果單元格的值小於60,加上“(不及格)”
            cell.value = str(cell.value) + "(不及格)"              
wb.save("實例2.xlsx")
#刪除低於總分低於250的行
from openpyxl import load_workbook

wb = load_workbook("實例2.xlsx")
ws = wb["Sheet3"]
for row in range(ws.max_row,1,-1):  #row表示行號,因為Excel刪除一行之后,下面的數據會上移,行號會變,所以要從下往上刪除
    s = sum([cell.value for cell in ws[row][1:]])  #除去第一列,計算一行數據的和為總分
    if s < 250:
        ws.delete_rows(row)
wb.save("實例2.xlsx")

4.將單表拆成多表

    

#將表格按班級拆分
from openpyxl import load_workbook

wb = load_workbook("實例3.xlsx")   #打開工作薄
ws = wb.active  #獲取工作表
dict = {}  #字典記錄工作表數據
for row in ws.iter_rows(min_row=2):  #獲取第二行開始的所有行數據
    row_data = [cell.value for cell in row]  #列表推導式獲得每行的數據
    if row_data[1] in dict.keys():   #如果班級在字典的鍵里;row_data表示班級,以班級為鍵;
        dict[row_data[1]] += [row_data]   #把行數據添加到鍵的值里面;需要把列表再用一層列表包裹,包裹之后會把列表整個添加;不然+會把列表里的值一個個添加
    else:
        dict[row_data[1]] = [[cell.value for cell in ws[1]]]   #如果班級不在鍵里,先加上表格第一行的表頭
        dict[row_data[1]] += [row_data]  #再添加行數據
for key,value in sorted(dict.items()):  #把字典進行排序
    ws = wb.create_sheet(key)  #創建工作表,表名是鍵名
    for data in value:  #添加數據
        ws.append(data)
wb.save("實例3.xlsx")

六、單元格的其他操作

1.合並單元格和取消合並

ws.merge_cells("A1:C5")  #合並A1到C5的單元格,如果都有數據,保留A1的數據
ws.merge_cells(start_row=1,end_row=5,start_column=1,end_column=3)  #合並A1到C5的單元格
ws.unmerge_cells("A1:C5")  #取消合並單元格

2.公式

打開工作薄用data_only=False(默認),寫入公式之后,保存文件;再用data_only=False打開,打印單元格的value是公式;用data_only=True打開,打印value是None。

要獲取單元格的value是數字,要手動打開Excel之后保存,再用data_only=True打開,打印單元格的value是數字,不能保存;用data_only=True打開之后保存,就只有數字沒有公式了。

from openpyxl import load_workbook

wb = load_workbook("實例2.xlsx")
ws = wb["Sheet4"]
ws["D6"] = "=sum(D2:D5)"  #使用excel公式
print(ws["D6"].value)   #打印出來的值是公式=sum(D4+D5)
wb.save("實例2.xlsx")
#如果要讀取出數據,需要手動打開Excel表保存,openpyxl打開Excel時使用data_only=True,不保存
wb = load_workbook("實例2.xlsx")
print(wb["D6"])   #打印數字

3.分組

ws.column_dimensions.group("A","C")  #按列分組,A到C列為一組
ws.row_dimensions.group(1,3,hidden=True)  #按行分組,1到3行為一組,hidden=True表示隱藏分組的行

 4.批注

#批注
c = openpyxl.comments.Comment("這是一個注釋","張三")  #Comment(text, author, height=79, width=144)   
ws["K1"].comment = c  #給單元格設置批注

5.字體

Font(name=None, sz=None, b=None, i=None, charset=None, u=None, strike=None, color=None, scheme=None, family=None, size=None, bold=None, italic=None, strikethrough=None, underline=None, vertAlign=None, outline=None, shadow=None, condense=None, extend=None)

  •  name:字體名稱,中文字體名稱前面要加u;例u"微軟雅黑"
  • sz/size:字體大小,單位px
  • b/bold:是否加粗;True加粗,False不加粗
  • i/italic:是否傾斜;True傾斜,False不傾斜
  • u/underline:下划線;single單下划線,double雙下划線,singleAccounting會計用單下划線,doubleAccounting會計用雙下划線
  • strike/strikethrough:是否顯示刪除線,True顯示刪除線,False不顯示刪除線
  • verAlign:superscript上標,subscript下標,baseline
  • color:字體顏色,RGB顏色十六進制表示
#設置字體
f = openpyxl.styles.Font(name=u"微軟雅黑",sz=16,bold=True,vertAlign="baseline",color="DC143C")
ws["A1"].font = f  #只能設置單個單個單元格,如果需要設置區域,要循環設置 #獲取字體
f1 = ws["A1'].font

6.對齊

Alignment(horizontal=None, vertical=None, textRotation=0, wrapText=None, shrinkToFit=None, indent=0, relativeIndent=0, justifyLastLine=None, readingOrder=0, text_rotation=None, wrap_text=None, shrink_to_fit=None, mergeCell=None)

  • horizontal:水平對其方式;"general"常規, "left"靠左, "center"居中, "right"靠右, "fill"填充, "justify"兩端對齊, "centerContinuous"跨列劇中, "distributed"分散對齊
  • vertical:垂直對齊方式;"top"頂部, "center"居中, "bottom"底部, "justify"兩端對齊, "distributed"分散對齊
  • textRotation/text_rotation:指定文本旋轉角度
  • wrapText/wrap_text:是否自動換行
  • shrinkToFit/shrink_to_fit:是否縮小字體填充
  • indent:指定縮進
#設置對齊
a = openpyxl.styles.Alignment(horizontal = "center",vertical = "center")
ws["c1"].alignment = a

7.邊框

Side(style=None, color=None, border_style=None)

  • style:邊線樣式;'dashDot','dashDotDot', 'dashed','dotted', 'double','hair', 'medium', 'mediumDashDot', 'mediumDashDotDot','mediumDashed', 'slantDashDot', 'thick', 'thin'
  • color:邊線顏色

Border(left=None, right=None, top=None, bottom=None, diagonal=None, diagonal_direction=None, vertical=None, horizontal=None, diagonalUp=False, diagonalDown=False, outline=True, start=None, end=None)

  • left:左邊框
  • right:左邊框
  • top:上邊框
  • bottom:下邊框
  • diagonal:對角線
#邊框
s = openpyxl.styles.Side(style = "medium",color = "FF69B4")  #設置邊線樣式
b = openpyxl.styles.Border(left = s, right = s, top = s, bottom = s)  #設置邊框
ws["c2"].border = b

8.填充

PatternFill(patternType=None, fgColor=Color(), bgColor=Color(), fill_type=None, start_color=None, end_color=None)

  • patternType/fill_type:填充樣式;'none'不填充,'solid'實心填充,'darkGray'75%灰色,'mediumGray'50%灰色,'lightGray'25%灰色
  • fgColor/start_color:前景顏色
  • bgColor/end_color:背景顏色
#填充
f = openpyxl.styles.PatternFill(fill_type = "mediumGray", end_color ="FF69B4")
f1 = openpyxl.styles.PatternFill(fill_type = "mediumGray",start_color = "FF69B4")
ws["C3"].fill = f
ws["C4"].fill = f1

9.設置行高和列寬

Excel的默認行高是13.5,默認列寬是8.38;即使行高和列寬被設為0,行高最小也是13.5,列寬最小是8.38

#行高,行高的單位是磅,1個單位=0.3612毫米
ws.row_dimensions[3].height = 50  #設置工作表的第三行的高度是50個單位
#列寬,列寬的單位是0.1英寸,一個單位=2.2862毫米
ws.column_dimensions["C"].width = 50   #設置工作表的C列是50個單位

10.插入圖片

#插入圖片;必須安裝Pillow庫,不然會報錯"You must install Pillow to fetch image objects"
img = openpyxl.drawing.image.Image("E:\\圖\\1\\1.jpg")  #創建圖片對象
img.height = 100  #設置圖片的高,單位是px
img.width = 100  #設置圖片的寬,單位是px
ws.add_image(img,"A10")  #在A10位置插入圖片

11.插入圖表

11.1 柱狀圖

#制作柱狀圖
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("實例3.xlsx")
ws = wb["Sheet1"]

#創建一個柱狀表對象
c = chart.BarChart()
#設定數據范圍
data = chart.Reference(ws,min_row = 1, max_row = 4, min_col = 2, max_col = 4)
#設置x軸的項目
x = chart.Reference(ws, min_row = 2, max_row = 4, min_col = 1)
#柱狀圖添加數據
c.add_data(data,titles_from_data=True)
#柱狀圖添加X軸
c.set_categories(x)
#在工作表中添加柱狀圖
ws.add_chart(c,"F1")

wb.save("實例3.xlsx")

11.2 折線圖

# 制作折線圖
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("實例4.xlsx")
ws = wb.active
#創建一個折線圖對象
c = chart.LineChart()
#設定數據范圍
data = chart.Reference(ws, min_row=2, max_row=3, min_col=1, max_col=13)
#設置x軸項目
x = chart.Reference(ws, min_row=1, min_col=2, max_col=13)
c.add_data(data, from_rows=True, titles_from_data=True)  #因為title在行首,from_rows=True
c.set_categories(x)
#在工作表的B5位置添加折線圖
ws.add_chart(c,"B5")
wb.save("實例4.xlsx")

11.3 餅狀圖

#餅圖
from openpyxl import load_workbook
from openpyxl import chart

wb = load_workbook("實例4.xlsx")
ws = wb["Sheet2"]
pie = chart.PieChart()
data = chart.Reference(ws, min_row=2, max_row=7, min_col=2)
x = chart.Reference(ws, min_row=2, max_row=7, min_col=1)
pie.add_data(data)
pie.set_categories(x)
pie.title = "餅狀圖"   #設置餅狀圖的標題
ws.add_chart(pie,"D1")
wb.save("實例4.xlsx")

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM