python讀取表格鏈接批量下載Html文件

本文轉載自查看原文 2020-08-21 23:09 767 Python

#導入庫
import urllib.request

#獲取單個html文件內容
def getHtml(url):
    html=urllib.request.urlopen(url).read()
    return html

#將html文件重新命名，保存到指定位置
def saveHtml(file_name,file_content):
    #注意Windows文件命名的禁用符，比如/
    with open(file_name.replace('/','_')+".html","wb") as f:
        f.write(file_content)
        #寫文件用bytes而不是str，所以要轉碼


#讀取csv格式的文件，只讀
f = open("commed.csv","r")
count=1

#讀取每一行的數據，每一行的數據逐一處理
for line in f:
    count=count+1
    a=[]
    a.append(line.strip().split(","))
    site=a[0][0]
    if len(site) > 10:

　　　　 #滿足條件后，將讀取的每一個網址信息，進行訪問保存，重新命名保存到本地
        title="commed\\"+str(count)+"行"+a[0][1]
        html=getHtml(site)
        saveHtml(title,html)

　　　　 #打印輸出確認是否保存成功，顯示當前處理數據的行數
        print("下載成功"+"===第"+str(count)+"行")

#關閉文件讀取函數
f.close()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 批量下載Excel中的鏈接中的文件鏈接批量下載文件 python基礎之文件表格讀取 python讀取Excel表格文件 python 生成html文件（表格） Python 批量文件下載 python批量讀取文本文件合並寫入到一個html，方便全文搜索 python3讀取html文件 python讀取xml、html文件 python讀取Excel表格文件的方法