用python正則表達式提取網頁的url

本文轉載自查看原文 2013-07-28 12:32 3248 python_html

 1 import re
 2 import urllib
 3 url="http://www.itokit.com"
 4 s=urllib.urlopen(url).read()
 5 ss=s.replace(" ","")
 6 urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
 7 for i in urls:
 8 print i
 9 else:
10 print 'this is over'

挺好用的，記錄下

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python的url正則表達式 python的url正則表達式正則表達式提取url中的ip地址 Go語言正則表達式提取網頁文本 python正則表達式提取中文 python 正則表達式提取返回內容二、文本提取——正則表達式正則表達式提取中文正則表達式-郵箱提取正則表達式之提取中文