寫出正則表達式,從一個字符串中提取鏈接地址。比如下面字符串中
"IT面試題博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
則需要提取的地址為 " http://hi.baidu.com/mianshiti/blog/category/微軟面試題 "
在python中:
import re
p = re.compile('<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>')
content = "IT面試題博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微軟面試題> 微軟面試題 </a> "
p.search(content).groups()
這段代碼對於給出的例子是足夠了,但實際情況中還需要考慮鏈接地址兩邊的單引號或者雙引號,href的大小寫,情況會稍微復雜些。
另外,如果面試者對正則表達式完全沒有概念,可以和面試官申請換一道題,一般不會有太大影響。
參考資料:
http://wiki.ubuntu.org.cn/Python正則表達式操作指南