http協議請求實戰——get請求示例之抓取百度搜索關鍵詞對應網頁信息

本文轉載自查看原文 2017-07-20 21:39 1182

1通過分析搜索關鍵詞對應的網址發現字段名和內容均在網址中網址可簡化為www.baidu.com/s?wd=搜索的關鍵詞

根據分析出的規律可通過構造get請求用爬蟲實現在百度上自動查詢某個關鍵詞

代碼如下：

import urllib.request   導入urllib.request
keywd = '高同同'         指定關鍵詞
keywd_cod = urllib.request.quote(keywd)將關鍵詞進行編碼
url = 'https://www.baidu.com/s?wd='輸入網址
url_all = url +keywd_cod構造出最終抓取網址
req =urllib.request.Request(url)使用urllib.request.Request構造一個Request對象並賦給變量req


data = urllib.request.urlopen(req).read()通過url.request.urlopen()打開對應的Request對象
fandle = open('D:/siq/part4/10.html','wb')
fandle.write(data)
將爬去的內容寫到一個html文件中
fandle.close()結束



思路總結：
1構建對應的url地址，該url包含get請求的字段名稱及字段內容等信息並且url地址滿足get請求格式“http://網址？字段名1=字段內容1&字段名2=字段內容2”
2以對應的url為參數，構建request對象
3通過urlopen()打開構建的request對象
4讀取內容並保存

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 php獲取從百度搜索進入網站的關鍵詞 python requests庫網頁爬取小實例：百度/360搜索關鍵詞提交一個完整推薦系統的設計實現-以百度關鍵詞搜索推薦為例 python+selenium實現百度關鍵詞搜索自動化操作 Python實現百度搜索並保存到本地示例，Python實現百度搜索百度搜索結果HTML分析 Alfred添加百度搜索自己常用百度搜索指令采集百度搜索的方法百度搜索屏蔽csdn