python中使用requests庫獲取網頁內容


requests是python中的一個第三方庫,可以獲取網頁內容

安裝指令:pip install requests 如果是python3.0版本以上則是:pip3 install requests 命令行下輸入 import requests 回車,不報錯則安裝成功

import requests 導入模塊,注意py文件命名不能和模塊名重復

網頁有很多種打開方式,最常見的是get方式(直接輸入網址訪問)和post方式(從另一個頁面單擊鏈接進入)

get方式獲取網頁內容:requests.get('url').content.decode()

先得到一個Response響應對象,用content方法轉變為二進制字節數據類型對象bytes(中文在bytes中無法顯示),用decode方法轉變為字符串型的源代碼

注意 .content 是用於顯示有圖片,音頻,視頻等內容的網頁,需要decode解碼

.text 是用於顯示只是字符的網頁

上面方法的參數可以省略,默認使用utf-8編碼格式,如果網頁不是這種編碼格式,需要在括號里寫明目標編碼格式的名字


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM