人生苦短之爬蟲爬取網頁的通用代碼框架


我們首先打開IDLE選擇File->new window命令(或者可以直接按鍵Ctrl+N鍵,在很多地方這個按鍵是新建文件的意思)

在這里還是要推薦下我自己建的Python開發學習群:725479218,群里都是學Python開發的,如果你正在學習Python ,小編歡迎你加入,大家都是軟件開發黨,不定期分享干貨(只有Python軟件開發相關的),包括我自己整理的一份2018最新的Python進階資料和高級開發教程,歡迎進階中和進想深入Python的小伙伴

我們填入代碼:

保存文件是按鍵快捷鍵Ctrl+S,將源代碼保存為hello.py的文件

按鍵F5運行走起(同時我們可以選擇Run->Run Module命令)

IDLE中顯示出現錯誤

原因是name‘name’未定義

注意:這里需要一個長的下划線,才能使其正確,以用來區分python本身的語法

改正過后我們再次運行:

我們看到出現了和之前一樣的結果

我們將網頁連接修改一下看看會出現什么結果:

結果是“產生異常”

解釋一下通用代碼框架:get方法請求一個鏈接,r.raise_for_status用來判斷請求是否正常(也就是200),否則就產生異常。r.encoding = r.apparent_encoding這一句是能夠是我們請求返回網頁解碼是正確的,最后return返回網頁的內容。

此框架用來解決我們訪問網頁的問題。

今天的內容就是這樣,每天一點點,重在堅持。加油!!!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM