微軟面試題:正則表達式提取鏈接地址


寫出正則表達式,從一個字符串中提取鏈接地址。比如下面字符串中
"IT面試題博客中包含很多  <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
則需要提取的地址為 " http://hi.baidu.com/mianshiti/blog/category/微軟面試題 "

在python中:
import re
p = re.compile('<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>')
content = "IT面試題博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
p.search(content).groups()
這段代碼對於給出的例子是足夠了,但實際情況中還需要考慮鏈接地址兩邊的單引號或者雙引號,href的大小寫,情況會稍微復雜些。
另外,如果面試者對正則表達式完全沒有概念,可以和面試官申請換一道題,一般不會有太大影響。
參考資料:
http://wiki.ubuntu.org.cn/Python正則表達式操作指南


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM