1 import re 2 import urllib 3 url="http://www.itokit.com" 4 s=urllib.urlopen(url).read() 5 ss=s.replace(" ","") 6 urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I) 7 for i in urls: 8 print i 9 else: 10 print 'this is over'
挺好用的,記錄下
1 import re 2 import urllib 3 url="http://www.itokit.com" 4 s=urllib.urlopen(url).read() 5 ss=s.replace(" ","") 6 urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I) 7 for i in urls: 8 print i 9 else: 10 print 'this is over'
挺好用的,記錄下
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。