python爬取12306及各參數的使用。完整代碼

本文轉載自查看原文 2018-12-23 16:22 603 python

import requests
from retrying import retry
reuquests和retrying的下載及安裝可以通過命令行pip install 口令實現

# 調用重連裝飾器固定格式，最大重試3次
@retry(stop_max_attempt_number=3)
def get12306():
    print("123")
    # 此時的123,代碼報錯打印3次，成功爬取只打印1次
    url = "https://www.12306.cn/mormhweb/"
    # 最多響應3秒,verify=false是ssl證書錯誤添加的參數
    response = requests.get(url,timeout=3)
    print(response.content.decode())
    # content為二進制字節類型，使用decode函數解碼
if __name__ == '__main__':
    try:
        get12306()
    except:
        # 捕獲異常，3次鏈接錯誤報1次此代碼
        print("finish")

網絡爬蟲（又被稱為網頁蜘蛛，網絡機器人）就是模擬客戶端(主要指瀏覽器)發送網絡請求，接收請求響應，按照一定的規則，自動地抓取互聯網信息的程序。

原則上,只要是客戶端(主要指瀏覽器)能做的事情，爬蟲都能夠做。爬蟲的主要用途：網絡信息的采集，12306搶票，網絡上的投票，相較之前的人工采集數據節省了大量的人力與物力。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【Python】requests庫爬蟲實戰之爬取音樂（保姆級圖文+詳細代碼注釋+完整項目代碼） Java爬取12306余票 python爬取12306網站獲取火車票信息用Python編寫爬取股票信息的代碼使用 Scrapy 爬取股票代碼 Python制作一個12306查票程序腳本（附完整代碼，僅供學習參考）使用Python進行疫情數據爬取 Python使用BeautifulSoup爬取網頁信息 16行python代碼爬取王者榮耀全皮膚 python 爬取王者榮耀英雄皮膚代碼