爬蟲實踐——數據存儲到Excel中


在進行爬蟲實踐時,我已經爬取到了我需要的信息,那么最后一個問題就是如何把我所爬到的數據存儲到Excel中去,這是我沒有學習過的知識。

如何解決這個問題,我選擇先百度查找如何解決這個問題。

百度查到的方法千萬種,我先選擇看得懂的文章下手,不斷嘗試,最后解決了問題

那么到底如何解決這個問題呢?

解決這個問題要用到三個模塊分別是xlwt、xlrd和xlutils

在使用這兩個模塊時要先下載安裝它們,我用的是pycharm編寫程序,我用到的安裝方法是:

#在文件中導入xlwt、xlrd 和xlutils

 import  xlwt

import xlrd

import xlutils

再寫入它們之后,會報錯,把鼠標分別移到xlwt上點擊一下,

它的頭上會有一個紅色的小燈泡,點擊燈泡再點擊install and import package "xlwt"

xlrd和xlutils同理

這樣這三個模塊就安裝好了

模塊安裝好了,下一步就是要學會如何使用這三個模塊了

xlwt模塊:

 1 import xlwt
 2 
 3 file_name = r'C:\Users\櫻花雨\Desktop\test.xls'#這是你要保存文件的文件路徑和文件名
 4 workbook = xlwt.Workbook()#表示新建xls工作簿
 5 sheet1 = workbook.add_sheet('worksheet')#新建xls表,表的名字是worksheet
 6 for a in range(1,16):
 7     # 把數據寫入xls中,行,列,值
 8     sheet1.write(0, 0, 'I')
 9     sheet1.write(0, 1, 'love')
10     sheet1.write(0.2, 'python')
11     # 保存xls到file_name的路徑下和文件名
12     workbook.save(file_name)

xlrd和xlutils模塊:(xlrd參考鏈接:xlrd)

 1 import xlrd
 2 from xlutils.copy import copy
 3 
 4 xlsfile = r'C:\Users\櫻花雨\Desktop\test.xls'
 5 #打開xsl文件
 6 book = xlrd.open_workbook(xlsfile)
 7 #獲取表格的名字
 8 sheet_name = book.sheet_names()
 9 print(sheet_name)
10 #獲取工作表
11 #(1)通過索引順序獲取
12 #sheet = bool.sheets()[0]
13 #(2)通過名稱獲取
14 #sheet = book.sheet_by_name(r'worksheet')
15 #(3)通過索引順序獲取
16 sheet = book.sheet_by_index(0)
17 #獲取表中的行數
18 nrows = sheet.nrows
19 #獲取表中的列數
20 ncols = sheet.ncols
21 print(nrows)
22 print(ncols)
23 #獲取表中整行的內容
24 row_data = sheet.row_values(0)
25 #獲取表中列內容
26 col_data = sheet.col_values(0)
27 print(row_data)
28 print(col_data)
29 #獲取表中單元格的內容
30 cell_value = sheet.cell_value(3,0)
31 print(cell_value)
32 #獲取表中單元格的內容
33 cell_value2 = sheet.cell(3,0)
34 print(cell_value2)
35 #修改或添加單元格內容
36 #ctype:0 empty ;1,string;2 number;3 date;4 boolean;5 error
37 #value:寫入單元格中的內容
38 #xf:0
39 #sheet.put_cell(row,col,ctype,value,xf)
40 sheet.put_cell(1,2,1,"test",0)
41 cell_value2 = sheet.cell(1,1)
42 print(cell_value2)
43 #保存xlsfile
44 wb = copy(book)
45 wb.save(xlsfile)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM