Python爬蟲教程-17-ajax爬取實例(豆瓣電影)


Python爬蟲教程-17-ajax爬取實例(豆瓣電影)

ajax: 簡單的說,就是一段js代碼,通過這段代碼,可以讓頁面發送異步的請求,或者向服務器發送一個東西,即和服務器進行交互

對於ajax:
  • 1.一定會有 url,請求方法(get, post),可能有數據
  • 2.一般使用 json 格式

爬取豆瓣電影

# 爬取豆瓣電影數據
# 了解ajax的爬取方式
# https://movie.douban.com/

from urllib import request
import json

# url信息:interval_id表示排名段(可自行修改),limit限制20個
url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=20&limit=20"

rsp = request.urlopen(url)
data = rsp.read().decode()

data = json.loads(data)

print(data)

運行結果

可以看到結果在一行顯示
這里寫圖片描述

修改輸出格式

# 爬取豆瓣電影數據
# 了解ajax的爬取方式
# https://movie.douban.com/

from urllib import request
import json

# url信息:interval_id表示排名段(可自行修改),limit限制20個
url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=20&limit=20"

rsp = request.urlopen(url)
data = rsp.read().decode()

data = json.loads(data)

# 遍歷輸出每個'k'和'v'的值
for item in data:
      print("排名:", item['rank'], "\n",
            "名稱:", item['title'], "\n",
            "類型:", item['types'], "\n",
            "主演:", item['actors'], "\n",
            "分數:", item['score'],"\n-------------",)

運行結果

這里寫圖片描述
這里結果就比較順眼了,如果需要更改排名段,因為是get請求,修改需要在url參數即可

更多文章鏈接:Python 爬蟲隨筆

  • 本筆記不允許任何個人和組織轉載


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM