使用Python正則表達式自己實現解析URL各參數


不使用庫,自己可以利用正則表達式實現解析域名各部分參數:協議、域名、端口、路徑、載荷等。

使用的正則表達式如下:

r'''(?x)\A
([a-z][a-z0-9+\-.]*)://             # Scheme
([a-z0-9\-._~%]+                 # IPv4 host
|\[[a-z0-9\-._~%!$&'()*+,;=:]+\])       # IPv6 host
(:[0-9]+)?                     # Port number
([a-zA-Z0-9\-\/._~%!$&'()*+]+)?        # path
(\?[a-zA-Z0-9&=]+)?                # query
'''               

  例如,對於"https://www.baidu.com/xxx/xxx?s=xxx"網址,解析出來各部分為:

('https', 'www.baidu.com', None, '/xxx/xxx', '?s=xxx')

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM