在進行爬蟲實踐時,我已經爬取到了我需要的信息,那么最后一個問題就是如何把我所爬到的數據存儲到Excel中去,這是我沒有學習過的知識。
如何解決這個問題,我選擇先百度查找如何解決這個問題。
百度查到的方法千萬種,我先選擇看得懂的文章下手,不斷嘗試,最后解決了問題
那么到底如何解決這個問題呢?
解決這個問題要用到三個模塊分別是xlwt、xlrd和xlutils
在使用這兩個模塊時要先下載安裝它們,我用的是pycharm編寫程序,我用到的安裝方法是:
#在文件中導入xlwt、xlrd 和xlutils
import xlwt
import xlrd
import xlutils
再寫入它們之后,會報錯,把鼠標分別移到xlwt上點擊一下,
它的頭上會有一個紅色的小燈泡,點擊燈泡再點擊install and import package "xlwt"
xlrd和xlutils同理
這樣這三個模塊就安裝好了
模塊安裝好了,下一步就是要學會如何使用這三個模塊了
xlwt模塊:
1 import xlwt 2 3 file_name = r'C:\Users\櫻花雨\Desktop\test.xls'#這是你要保存文件的文件路徑和文件名 4 workbook = xlwt.Workbook()#表示新建xls工作簿 5 sheet1 = workbook.add_sheet('worksheet')#新建xls表,表的名字是worksheet 6 for a in range(1,16): 7 # 把數據寫入xls中,行,列,值 8 sheet1.write(0, 0, 'I') 9 sheet1.write(0, 1, 'love') 10 sheet1.write(0.2, 'python') 11 # 保存xls到file_name的路徑下和文件名 12 workbook.save(file_name)
xlrd和xlutils模塊:(xlrd參考鏈接:xlrd)
1 import xlrd 2 from xlutils.copy import copy 3 4 xlsfile = r'C:\Users\櫻花雨\Desktop\test.xls' 5 #打開xsl文件 6 book = xlrd.open_workbook(xlsfile) 7 #獲取表格的名字 8 sheet_name = book.sheet_names() 9 print(sheet_name) 10 #獲取工作表 11 #(1)通過索引順序獲取 12 #sheet = bool.sheets()[0] 13 #(2)通過名稱獲取 14 #sheet = book.sheet_by_name(r'worksheet') 15 #(3)通過索引順序獲取 16 sheet = book.sheet_by_index(0) 17 #獲取表中的行數 18 nrows = sheet.nrows 19 #獲取表中的列數 20 ncols = sheet.ncols 21 print(nrows) 22 print(ncols) 23 #獲取表中整行的內容 24 row_data = sheet.row_values(0) 25 #獲取表中列內容 26 col_data = sheet.col_values(0) 27 print(row_data) 28 print(col_data) 29 #獲取表中單元格的內容 30 cell_value = sheet.cell_value(3,0) 31 print(cell_value) 32 #獲取表中單元格的內容 33 cell_value2 = sheet.cell(3,0) 34 print(cell_value2) 35 #修改或添加單元格內容 36 #ctype:0 empty ;1,string;2 number;3 date;4 boolean;5 error 37 #value:寫入單元格中的內容 38 #xf:0 39 #sheet.put_cell(row,col,ctype,value,xf) 40 sheet.put_cell(1,2,1,"test",0) 41 cell_value2 = sheet.cell(1,1) 42 print(cell_value2) 43 #保存xlsfile 44 wb = copy(book) 45 wb.save(xlsfile)