MacOS下安裝Requests庫及使用


大概框架

Request庫的安裝


  • 爬取網頁最好用的第三方庫
  • 直接安裝即可(用於OS X)
    pip3 install requests
  • request庫的常用方法:

  • request庫一共有七個常用方法。一個基本方法是request方法,其他的方法都是調用request方法實現的。

get方法

  • 獲取網頁最簡單的方法就是get方法
    r = requests.get(url)
  • 通過get方法+url獲得一個向服務器請求資源的Request對象。注意python是嚴格區分大小寫的,這個Request和我們說的request是不同的。
  • request.get()返回一個Response對象,就是我們的變量r。

Response對象

看一段代碼:

Response對象包含了服務器返回的所有信息。

  • Response對象的屬性:

  • 一般的解析流程:

一個例子

  • 狀態編碼為200,說明返回信息成功。
  • 但是我們查看r的text屬性時,卻發現了亂碼,於是我們去檢查r的編碼方式:

  • 用r.apparent_encoding的utf-8編碼替換r.encoding的ISO編碼方式可以正常顯示中文信息。這是為什么呢?

  • r.encoding是從header中提取charset字段的編碼方式,但是並非所有網站都有charset字段,如果沒有charset字段時默認返回ISO-8859-1類型,而這個類型是不能解析中文的。
  • r.apparent_encoding是根據http的內容部分實實在在分析內容的可能編碼類型,更加准確!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM