Python中用OpenPyXL處理Excel表格


新建Excel表格

新建Excel表格,默認有一個名為 Sheet 的表格,如下:

1
2
3
4
5
6
from openpyxl import Workbook

wb = Workbook() #創建文件對象
ws = wb.active #獲取默認sheet

wb.save("sample.xlsx")

 

打開已有的Excel表格

對已有的Excel表格進行操作,如下:

1
2
3
4
5
from openpyxl import Workbook, load_workbook

wb = load_workbook('sample.xlsx')

wb.save("sample.xlsx")

 

新建/獲取Sheet表格

使用 Workbook.create_sheet() 方法新建Sheet表格。第一個參數是sheet名稱,若不填,則默認以 Sheet1 Sheet2 Sheet3 …方式命名;第二個參數是插入Sheet表格的位置,以 0 為第一個位置,若不填,則置於最后。如下:

1
2
3
4
5
ws1 = wb.create_sheet("Mysheet") #默認在最后插入

ws2 = wb.create_sheet("Mysheet", 0) #在第一個位置插入

wb.remove(ws1) #刪除sheet

 

也可以后期隨時修改sheet的名字,如下:

1
ws.title = "New Title"

 

修改sheet標簽顏色,如下:

1
ws.sheet_properties.tabColor = "1072BA"

 

若知道sheet的名字,可以用如下方式獲取sheet :

1
2
3
4
ws = wb.get_sheet_by_name("New Title")


ws = wb["New Title"]

 

也可獲取全部sheet的名字,遍歷sheet名字,如下:

1
2
3
4
5
6
7
8
9
10
 sheets = wb.sheetnames
for sheet in sheets:
print(sheets)


for sheet in wb:
print sheet.title


['Sheet1', 'New Title', 'Sheet2']

 

也可以定位到相應sheet頁,[0]為sheet頁索引,如下:

1
2
sheet_names = wb.sheetnames  # 獲取所有sheet頁名字
ws = wb[sheet_names[0]]

 

復制Sheet表格

僅能復制 單元格的值 樣式 超鏈接 注釋塊 等,而 圖片表格 等是無法復制的,如下:

1
2
source = wb.active
target = wb.copy_worksheet(source)

 

操作單元格

worksheet 獲取單元格,或直接給單元格賦值,如下:

1
2
3
4
5
6
cell = ws['A4'] #獲取第4行第A列的單元格

ws['A4'] = 4 #給第4行第A列的單元格賦值為4

ws.cell(row=4, column=2, value=10) #給第4行第2列的單元格賦值為10
ws.cell(4, 2, 10) #同上

 

獲取區域內的單元格,如下:

1
2
3
4
5
6
cell_range = ws['A1':'C2']  #獲取A1-C2內的區域

colC = ws['C'] #獲取第C列
col_range = ws['C:D'] #獲取第C-D列
row10 = ws[10] #獲取第10列
row_range = ws[5:10] #獲取第5-10列

 

如果得到單元格,可以賦值,如下:

1
2
3
cell.value = 'hello, world'

cell = ws.cell(row=i, column=j, value="金額")

 

獲取單元格的值,如下:

1
cellValue = ws.cell(row=i, column=j).value

 

獲取行列數,如下:

1
2
row = ws.max_row #最大行數
column = ws.max_column #最大列數

 

一行行的獲取數據,如下:

1
2
3
4
5
6
7
8
9
10
>>> for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
... for cell in row:
... print(cell)

<Cell Sheet1.A1>
<Cell Sheet1.B1>
<Cell Sheet1.C1>
<Cell Sheet1.A2>
<Cell Sheet1.B2>
<Cell Sheet1.C2>

 

一列列的獲取數據,如下:

1
2
3
4
5
6
7
8
9
>>> for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):
... for cell in col:
... print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.A2>
<Cell Sheet1.B1>
<Cell Sheet1.B2>
<Cell Sheet1.C1>
<Cell Sheet1.C2>

 

因為性能的原因, Worksheet.iter_cols() 方法不能在只讀模式下使用。

獲取所有的列或行,如下:

1
2
3
rows = ws.rows

columns = ws.columns

 

因為性能的原因, Worksheet.columns 方法不能在只讀模式下使用。

如果只想從worksheet中獲取值,可以使用 Worksheet.values 屬性,如下:

1
2
3
for row in ws.values:
for value in row:
print(value)

 

Worksheet.iter_rows()Worksheet.iter_cols() 方法都可以添加 values_only 參數來達到僅獲取值的目的,如下:

1
2
for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True):
print(row)

 

保存文件

使用 Workbook.save() 方法保存workbook,這個方法會不加提示的覆蓋原文件,如下:

1
2
wb = Workbook()
wb.save('balances.xlsx')

 

獲取單元格類型

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
from openpyxl import Workbook, load_workbook
import datetime

wb = load_workbook('sample.xlsx')

ws=wb.active
wb.guess_types = True #開啟獲取單元格類型

ws["A1"]=datetime.datetime(2010, 7, 21)
print ws["A1"].number_format

ws["A2"]="12%"
print ws["A2"].number_format

ws["A3"]= 1.1
print ws["A4"].number_format

ws["A4"]= "中國"
print ws["A5"].number_format

wb.save("sample.xlsx")

# 執行結果:
# yyyy-mm-dd h:mm:ss
# 0%
# General
# General
# 如果是常規,顯示general,如果是數字,顯示'0.00_ ',如果是百分數顯示0%
# 數字需要在Excel中設置數字類型,直接寫入的數字是常規類型

使用公式

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from openpyxl import Workbook, load_workbook

wb = load_workbook('sample.xlsx')
ws1=wb.active

ws1["A1"]=1
ws1["A2"]=2
ws1["A3"]=3

ws1["A4"] = "=SUM(1, 1)"
ws1["A5"] = "=SUM(A1:A3)"

print ws1["A4"].value #打印的是公式內容,不是公式計算后的值,程序無法取到計算后的值
print ws1["A5"].value #打印的是公式內容,不是公式計算后的值,程序無法取到計算后的值

wb.save("sample.xlsx")

合並單元格

1
2
3
4
5
6
7
8
9
10
11
12
13
from openpyxl import Workbook, load_workbook

wb = load_workbook('sample.xlsx')
ws1=wb.active

ws.merge_cells('A2:D2')
ws.unmerge_cells('A2:D2') #合並后的單元格,腳本單獨執行拆分操作會報錯,需要重新執行合並操作再拆分

# or equivalently
ws.merge_cells(start_row=2,start_column=1,end_row=2,end_column=4)
ws.unmerge_cells(start_row=2,start_column=1,end_row=2,end_column=4)

wb.save("sample.xlsx")

插入一個圖片

需要 pillow 庫,安裝如下:

1
pip install pillow

 

1
2
3
4
5
6
7
8
9
10
from openpyxl import load_workbook
from openpyxl.drawing.image import Image

wb = load_workbook('sample.xlsx')
ws1=wb.active

img = Image('1.png')
ws1.add_image(img, 'A1')

wb.save("sample.xlsx")

隱藏單元格

1
2
3
4
5
6
7
8
9
10
11
12
from openpyxl import load_workbook

wb = load_workbook('sample.xlsx')
ws = wb.active

ws.column_dimensions.group('A', 'D', hidden=True) # 隱藏A到D列

ws.row_dimensions.group(1, 10, hidden=True) # 隱藏1到10行

ws.row_dimensions[2].hidden # 獲取第二行是否隱藏了

wb.save("sample.xlsx")

優化模式

在處理非常大的 XLSX 文件時,openpyxl 的常規模式無法處理這種負載。幸運的是,有兩種模式可以在(幾乎)恆定內存消耗的情況下讀寫無限量的數據。

只讀模式

1
2
3
4
5
6
7
from openpyxl import load_workbook
wb = load_workbook(filename='large_file.xlsx', read_only=True)
ws = wb['big_data']

for row in ws.rows:
for cell in row:
print(cell.value)

只寫模式

1
2
3
4
5
6
7
8
9
10
from openpyxl import Workbook
wb = Workbook(write_only=True)
ws = wb.create_sheet()

# now we'll fill it with 100 rows x 200 columns

for irow in range(100):
... ws.append(['%d' % i for i in range(200)])
# save the file
wb.save('new_big_file.xlsx') # doctest: +SKIP
  • 與普通工作簿不同,新創建的只寫工作簿不包含任何工作表;必須使用 create_sheet() 方法專門創建工作表。
  • 在只寫的工作簿中,只能使用 append() 添加行。使用 cell()iter_rows() 在任意位置寫(或讀)單元格是不可能的。
  • 它能夠導出無限數量的數據(甚至比Excel實際能夠處理的更多),同時將內存使用量保持在10Mb以下。

插入/刪除行/列,移動區域單元格

插入行/列

在第7行之上插入一行,如下:

1
ws.insert_rows(7)

 

在第7列的左邊插入一列,如下:

1
ws.insert_cols(7)

 

刪除行/列

從第6列開始,刪除3列,即刪除6、7、8列,如下:

1
ws.delete_cols(6, 3)

 

移動區域單元格

D4:F10 區域向上移動一行向右移動2列,如下:

1
ws.move_range("D4:F10", rows=-1, cols=2)

 

如果區域內包含 公式 ,則如下方法可以連同公式一起挪動:

1
ws.move_range("G4:H10", rows=1, cols=1, translate=True)

 

使用 Pandas 和 NumPy

詳情請移步 Working with Pandas and NumPy

圖表

圖表由至少一個系列的一個或多個單元格區域數據點組成。更多內容請移步 圖表介紹

注釋

openpyxl 可讀/寫注釋,但格式信息會被丟失。在 只讀模式 下不支持操作注釋。注釋必須包括 內容作者

讀注釋,如下:

1
2
3
comment = ws["A1"].comment
comment.text # 注釋內容
comment.author # 注釋作者

 

寫注釋,如下:

1
2
3
4
5
comment = Comment("Text", "Author")
comment.width = 300 # 設置寬度
comment.height = 50 # 設置高度
ws["A1"].comment = comment
ws["B2"].comment = comment

 

表格樣式

字體樣式

字體名稱、字體大小、字體顏色、加粗、斜體、縱向對齊方式(有三種:baselinesuperscriptsubscript)、下划線、刪除線,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
from openpyxl.styles import Font

font = Font(name='Calibri',
size=11,
color='FF000000',
bold=False,
italic=False,
vertAlign=None,
underline='none',
strike=False)

ws['A1'].font = font

cell2.font = Font(name=cell1.font.name, sz=cell1.font.sz, b=cell1.font.b, i=cell1.font.i)

 

字體顏色可以用 RGBaRGB ,如下:

1
2
3
font = Font(color="FFBB00")

font = Font(color="FFFFBB00")

 

繼承並重寫樣式,如下:

1
2
3
ft1 = Font(name='Arial', size=14)
ft2 = copy(ft1)
ft2.name = "Tahoma"

 

填充樣式

詳情請移步 填充樣式

1
2
3
4
from openpyxl.styles import PatternFill

# fill_type 的樣式為 None 或 solid
cell2.fill = PatternFill(fill_type=cell1.fill.fill_type, fgColor=cell1.fill.fgColor)

 

邊框樣式

詳情請移步 邊框樣式

1
2
3
4
5
6
7
8
9
10
11
12
from openpyxl.styles import Border, Side

border = Border(left=Side(border_style=None, color='FF000000'),
right=Side(border_style=None, color='FF000000'),
top=Side(border_style=None, color='FF000000'),
bottom=Side(border_style=None, color='FF000000'),
diagonal=Side(border_style=None, color='FF000000'),
diagonal_direction=0,
outline=Side(border_style=None, color='FF000000'),
vertical=Side(border_style=None, color='FF000000'),
horizontal=Side(border_style=None, color='FF000000')
)

 

對齊樣式

horizontal 的值有:distributed, justify, center, left, fill, centerContinuous, right, general
vertical 的值有:bottom, distributed, justify, center, top

1
2
3
4
5
6
7
8
from openpyxl.styles import Alignment

alignment=Alignment(horizontal='general',
vertical='bottom',
text_rotation=0,
wrap_text=False,
shrink_to_fit=False,
indent=0)

 

保護樣式

鎖定、隱藏

1
2
3
from openpyxl.styles import Protection

protection = Protection(locked=True, hidden=False)

 

整行或整列應用樣式

1
2
3
4
col = ws.column_dimensions['A']
col.font = Font(bold=True)
row = ws.row_dimensions[1]
row.font = Font(underline="single")

更改合並的單元格樣式

合並的單元格可以想想成為左上角的那個單元格來操作。

篩選和排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
from openpyxl import Workbook

wb = Workbook()
ws = wb.active

data = [
["Fruit", "Quantity"],
["Kiwi", 3],
["Grape", 15],
["Apple", 3],
["Peach", 3],
["Pomegranate", 3],
["Pear", 3],
["Tangerine", 3],
["Blueberry", 3],
["Mango", 3],
["Watermelon", 3],
["Blackberry", 3],
["Orange", 3],
["Raspberry", 3],
["Banana", 3]
]

for r in data:
ws.append(r)

ws.auto_filter.ref = "A1:B15"
ws.auto_filter.add_filter_column(0, ["Kiwi", "Apple", "Mango"])
ws.auto_filter.add_sort_condition("B2:B15")

wb.save("filtered.xlsx")

生成的Excel表格,有篩選排序的操作,但是沒有實際表現出效果,如下圖:

image

需要手動點擊 重寫應用 才能顯示出效果,如下圖:

image

image

密碼保護

該功能僅能提供一個很基礎的密碼保護,沒有進行加密處理,網上普通的破解軟件都可以破解密碼。不過,日常使用還是可以的。

該功能僅可用於新建excel表格,不能用於已存在的excel表格。

workbook工作薄保護

防止查看隱藏sheet,避免增加、移動、刪除、隱藏或重命名sheet等操作,可以保護workbook的結構,如下:

1
2
wb.security.workbookPassword = '...'
wb.security.lockStructure = True

 

worksheet保護

worksheet保護不需要密碼,如下:

1
2
ws = wb.active
wb.protection.sheet = True


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM