Python爬蟲——解決urlretrieve下載不完整問題且避免用時過長

本文轉載自查看原文 2018-08-08 20:47 2131

https://blog.csdn.net/jclian91/article/details/77513289

但是經筆者測試，下載文件出現urllib.ContentTooShortError且重新下載文件會存在用時過長的問題，而且往往會嘗試好幾次，甚至十幾次，偶爾會陷入死循環，這種情況是非常不理想的。為此，筆者利用socket模塊，使得每次重新下載的時間變短，且避免陷入死循環，從而提高運行效率。
　　以下為代碼：

import socket
import urllib.request
#設置超時時間為30s socket.setdefaulttimeout(30) #解決下載不完全問題且避免陷入死循環 try: urllib.request.urlretrieve(url,image_name) except socket.timeout: count = 1 while count <= 5: try: urllib.request.urlretrieve(url,image_name) break except socket.timeout: err_info = 'Reloading for %d time'%count if count == 1 else 'Reloading for %d times'%count print(err_info) count += 1 if count > 5: print("downloading picture fialed!")

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 idea中maven下載jar包不完整問題 ps 命令顯示不完整的問題解決PHP使用POST提交數據不完整,數據不全的問題 html2canvas 截圖不完整圖片缺失問題 ubuntu安裝界面顯示不完整的解決方法 layui table表格字段過長，展示不完整時，鼠標放到上面展示完整信息 urlretrieve下載圖片--爬蟲程序中使用7z.exe解壓不完整的問題在vue項目中用html2canvas遇到因為有滾動條截圖不完整問題的解決方法(設置height和windowHeight) input屬性placeholder在iOS中顯示不完整的解決方法