實用爬蟲-01-檢測爬蟲的 IP


實用爬蟲-01-檢測爬蟲的 IP

  • 本篇介紹一個識別爬蟲 ip 的小實例(教你一招識破無效的 ip 代理)

【注意事項】:

  • 1.url 可能會失效(個人感覺,因為它帶了一個2018,下面附上鏈接獲取方法)
  • 2.當然使用的時候,只需兩步:
    • (1)把你的爬蟲的 url 換成下面的 url,目前是:http://2018.ip138.com/ic.asp
    • (2)把 decode() 方法的參數要設置成 'GBK' (默認的 'utf-8' 是不行的)
  • 代碼 ipQuery.py 文件:https://xpwi.github.io/py/spider/ipQuery.py
# coding: utf-8
# 測爬蟲 ip 工具
from urllib import request,error

if __name__ == '__main__':
    # 該地址可能會失效,如果失效,請參照:https://www.cnblogs.com/xpwi/p/9610887.html
    url = "http://2018.ip138.com/ic.asp"
    rsp = request.urlopen(url)
    html = rsp.read().decode('GBK')
    print(html)

運行結果

下面介紹怎么獲取查詢 ip 的地址

  • 在百度搜索關鍵字:ip,點擊 IP地址查詢
  • 或者直接訪問:http://www.ip138.com/
  • 操作截圖:
  • 右鍵,點擊【查看頁面源代碼】
  • 【搜索】關鍵字:【地理位置】
  • 下面是一個 iframe 標簽,地址就在那

更多文章鏈接:實用爬蟲


- 本筆記不允許任何個人和組織轉載


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM