python爬蟲(二十二) 正則表達式匹配多個字符


一、1、* :匹配0個或者任意多個字符

text="1234"
ret=re.match('\d*',text)
print(ret.group())
>>1234

2、+:匹配一個或多個字符

 

text="abcd"
ret=re.match('\w+',text)
print(ret.group())
>>abcd

 

3、?:匹配0個或者1個字符

text="abcd"
ret=re.match('\w?',text)
print(ret.group())
>>a

4、{m}:匹配m個字符

text="abcd"
ret=re.match('\w{2}',text)
print(ret.group())
>>ab

5、{m,n}:匹配m到n個字符

text="abcd"
ret=re.match('\w{1,5}',text)  //匹配一個、兩個、三個到五個都行
print(ret.group())
>>abcd

二、驗證手機號

text="180123456789"
ret=re.match('1[34578]\d{9}',text)
print(ret.group())
>>180123456789

三、驗證郵箱

text="2605072149@qq.com"
ret=re.match('\w+@[a-z0-9]+\.[a-z]+',text)
print(ret.group())
>>2605072149@qq.com

四、驗證url

text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
ret=re.match('(http|https|ftp)://[^\s]+',text)
print(ret.group())

 

 五、驗證身份證

text="311111222222111445"
ret=re.match('\d{17}[\dxX]',text)
print(ret.group())

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM