Python3中正則的貪婪匹配模式


什么是貪婪模式

  • 正則在進行匹配時,從開始位置查找最遠的結束位置,這種模式稱之為貪婪模式。
  • 在進行HTML標簽類似內容獲取時,貪婪模式會導致整個內容的返回,需要使用非貪婪模式。
  • 固定的書寫規則 : .*? 這種方式就是非貪婪模式,或者說是惰性模式
  • Python中默認使用貪婪模式

例子

>>> import re
>>> str = '<div>---hello---</div><div>---world---</div>'

>>> print(re.findall(r'<div>(.*?)</div>', str))  #非貪婪模式
['---hello---', '---world---']

>>> print re.findall(r'<div>(.*)</div>', str)   #貪婪模式
['---hello---</div><div>---world---']


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM