Python讀寫excel
對於python 處理excel 表格,這個日常工作的需求還是不少,於是查查資料,自己寫寫,總結一下,記錄一下,下次遇到直接拿過來用,方便自己,方便大家。
好在python有讀寫excel package很方便。
- xlrd:用於讀Excel文件
- xlwt:寫Excel包,文件后綴名為.xls,最多只能存65536行數據(2的16次方)
- xlsxwriter:也是寫Excel包,文件后綴名.xlsx,最大支持1048576(2的20次方)行數據,16384(2的14次方)列數據
- openpyxl:既能讀也能寫,非常厲害,還能插入刪除一行一列,后綴名是.xlsx
一,xlrd,xlwt 使用
## 1,導入模塊
import xlrd
## 2, 打開Excel文件讀取數據
data = xlrd.open_workbook('excel.xls')
##3,獲取一個工作表
table = data.sheets()[0] #通過索引順序獲取
table = data.sheet_by_index(0) #通過索引順序獲取
table = data.sheet_by_name(u'Sheet1')#通過名稱獲取
## 4,獲取整行和整列的值(返回數組)
table.row_values(i)
table.col_values(i)
## 5,獲取行數和列數
table.nrows
table.ncols
## 6,獲取單元格
table.cell(0,0).value
table.cell(2,3).value
就我自己使用的時候覺得還是獲取cell最有用,這就相當於是給了你一個二維數組,余下你就可以想怎么干就怎么干了。得益於這個十分好用的庫代碼很是簡潔。但是還是有若干坑的存在導致話了一定時間探索。現在列出來:
1、首先就是我的統計是根據姓名統計各個表中的信息的,但是調試發現不同的表中各個名字貌似不能夠匹配,開始懷疑過編碼問題,不過后來發現是因為空格。因為在excel中輸入的時候很可能會順手在一些名字后面加上幾個空格或是tab鍵,這樣看起來沒什么差別,但是程序處理的時候這就是兩個完全不同的串了。我的解決方法是給每個獲取的字符串都加上strip()處理一下。效果良好
2、還是字符串的匹配,在判斷某個單元格中的字符串(中文)是否等於我所給出的的時候發現無法匹配,並且各種unicode也不太奏效,百度過一些解決方案,但是都比較復雜或是沒用。最后我采用了一個比較變通的方式:直接從excel中獲取我想要的值再進行比較,效果是不錯就是通用行不太好,不過問題還沒解決。
#導入xlwt模塊
import xlwt
# 創建一個Workbook對象,這就相當於創建了一個Excel文件
book = xlwt.Workbook(encoding='utf-8', style_compression=0)
'''
Workbook類初始化時有encoding和style_compression參數
encoding:設置字符編碼,一般要這樣設置:w = Workbook(encoding='utf-8'),就可以在excel中輸出中文了。
默認是ascii。當然要記得在文件頭部添加:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
style_compression:表示是否壓縮,不常用。
'''
#創建一個sheet對象,一個sheet對象對應Excel文件中的一張表格。
# 在電腦桌面右鍵新建一個Excel文件,其中就包含sheet1,sheet2,sheet3三張表
sheet = book.add_sheet('test', cell_overwrite_ok=True)
# 其中的test是這張表的名字,cell_overwrite_ok,表示是否可以覆蓋單元格,其實是Worksheet實例化的一個參數,默認值是False
# 向表test中添加數據
sheet.write(0, 0, 'EnglishName') # 其中的'0-行, 0-列'指定表中的單元,'EnglishName'是向該單元寫入的內容
sheet.write(1, 0, 'Marcovaldo')
txt1 = '中文名字'
sheet.write(0, 1, txt1.decode('utf-8')) # 此處需要將中文字符串解碼成unicode碼,否則會報錯
txt2 = '馬可瓦多'
sheet.write(1, 1, txt2.decode('utf-8'))
# 最后,將以上操作保存到指定的Excel文件中
book.save(r'e:\test1.xls') # 在字符串前加r,聲明為raw字符串,這樣就不會處理其中的轉義了。否則,可能會報錯
建議還是用ascii編碼,不然可能會有一些詭異的現象。
二,xlsxwriter使用
#coding:utf-8
import xlsxwriter
workbook=xlsxwriter.Workbook('demo1.xlsx')#創建一個excel文件
worksheet=workbook.add_worksheet(u'sheet1')#在文件中創建一個名為TEST的sheet,不加名字默認為sheet1
worksheet.set_column('A:A',20)#設置第一列寬度為20像素
bold=workbook.add_format({'bold':True})#設置一個加粗的格式對象
worksheet.write('A1','HELLO')#在A1單元格寫上HELLO
worksheet.write('A2','WORLD',bold)#在A2上寫上WORLD,並且設置為加粗
worksheet.write('B2',U'中文測試',bold)#在B2上寫上中文加粗
worksheet.write(2,0,32)#使用行列的方式寫上數字32,35,5
worksheet.write(3,0,35.5)#使用行列的時候第一行起始為0,所以2,0代表着第三行的第一列,等價於A4
worksheet.write(4,0,'=SUM(A3:A4)')#寫上excel公式
workbook.close()
三,用openpyxl向Excel插入一行或一列
功能非常強大,文檔主頁點這里
- 插入列用insert_cols
- 插入行用insert_rows
讀並加一列示例:
import openpyxl
wb = openpyxl.load_workbook('0.xlsx')
ws = wb.worksheets[0]
# 在第3列之前插入數據,這里序號是從1開始的
ws.insert_cols(3)
# 插入數據
for index, row in enumerate(ws.rows):#按行讀取
if index == 0:
row[2].value = '新字段'
else:
row[2].value = index
wb.save('0_new.xlsx')
寫示例:
import openpyxl
wb = openpyxl.Workbook()#創建一個表
sheet = wb.active#找到活動sheet頁,
sheet.title = 'New Sheet'
sheet['C3'] = 'hello world'#這里讀取是一樣的,按cell讀
for i in range(10):
sheet["A%d" % (i+1)].value = i + 1
sheet["E1"].value = "=SUM(A:A)"#還可以寫公式
wb.save('新的excel.xlsx')