實用爬蟲-01-檢測爬蟲的 IP
- 本篇介紹一個識別爬蟲 ip 的小實例(教你一招識破無效的 ip 代理)
【注意事項】:
- 1.url 可能會失效(個人感覺,因為它帶了一個2018,下面附上鏈接獲取方法)
- 2.當然使用的時候,只需兩步:
- (1)把你的爬蟲的 url 換成下面的 url,目前是:http://2018.ip138.com/ic.asp
- (2)把 decode() 方法的參數要設置成 'GBK' (默認的 'utf-8' 是不行的)
- 代碼 ipQuery.py 文件:https://xpwi.github.io/py/spider/ipQuery.py
# coding: utf-8
# 測爬蟲 ip 工具
from urllib import request,error
if __name__ == '__main__':
# 該地址可能會失效,如果失效,請參照:https://www.cnblogs.com/xpwi/p/9610887.html
url = "http://2018.ip138.com/ic.asp"
rsp = request.urlopen(url)
html = rsp.read().decode('GBK')
print(html)
運行結果
下面介紹怎么獲取查詢 ip 的地址
- 在百度搜索關鍵字:ip,點擊 IP地址查詢
- 或者直接訪問:http://www.ip138.com/
- 操作截圖:
- 右鍵,點擊【查看頁面源代碼】
- 【搜索】關鍵字:【地理位置】
- 下面是一個 iframe 標簽,地址就在那
更多文章鏈接:實用爬蟲
- 本筆記不允許任何個人和組織轉載