什么是貪婪模式
- 正則在進行匹配時,從開始位置查找最遠的結束位置,這種模式稱之為貪婪模式。
- 在進行HTML標簽類似內容獲取時,貪婪模式會導致整個內容的返回,需要使用非貪婪模式。
- 固定的書寫規則 :
.*?
這種方式就是非貪婪模式,或者說是惰性模式 - Python中默認使用貪婪模式
例子
>>> import re
>>> str = '<div>---hello---</div><div>---world---</div>'
>>> print(re.findall(r'<div>(.*?)</div>', str)) #非貪婪模式
['---hello---', '---world---']
>>> print re.findall(r'<div>(.*)</div>', str) #貪婪模式
['---hello---</div><div>---world---']