用python正则表达式提取网页的url

本文转载自查看原文 2013-07-28 12:32 3248 python_html

 1 import re
 2 import urllib
 3 url="http://www.itokit.com"
 4 s=urllib.urlopen(url).read()
 5 ss=s.replace(" ","")
 6 urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
 7 for i in urls:
 8 print i
 9 else:
10 print 'this is over'

挺好用的，记录下

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python的url正则表达式正则表达式提取url中的ip地址 Go语言正则表达式提取网页文本 python 正则表达式提取返回内容 Python 使用正则表达式匹配URL网址匹配url的正则表达式使用正则表达式提取background:url()中的内容正则表达式查找网页源代码提取指定内容 java 使用正则表达式从网页上提取网站标题 C#正则表达式通过HTML提取网页中的图片src