python爬虫(二十二) 正则表达式匹配多个字符


一、1、* :匹配0个或者任意多个字符

text="1234"
ret=re.match('\d*',text)
print(ret.group())
>>1234

2、+:匹配一个或多个字符

 

text="abcd"
ret=re.match('\w+',text)
print(ret.group())
>>abcd

 

3、?:匹配0个或者1个字符

text="abcd"
ret=re.match('\w?',text)
print(ret.group())
>>a

4、{m}:匹配m个字符

text="abcd"
ret=re.match('\w{2}',text)
print(ret.group())
>>ab

5、{m,n}:匹配m到n个字符

text="abcd"
ret=re.match('\w{1,5}',text)  //匹配一个、两个、三个到五个都行
print(ret.group())
>>abcd

二、验证手机号

text="180123456789"
ret=re.match('1[34578]\d{9}',text)
print(ret.group())
>>180123456789

三、验证邮箱

text="2605072149@qq.com"
ret=re.match('\w+@[a-z0-9]+\.[a-z]+',text)
print(ret.group())
>>2605072149@qq.com

四、验证url

text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
ret=re.match('(http|https|ftp)://[^\s]+',text)
print(ret.group())

 

 五、验证身份证

text="311111222222111445"
ret=re.match('\d{17}[\dxX]',text)
print(ret.group())

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM