python 正則表達式規則收集


python正則表達式基本元字符 

  1. .   通配符,匹配所有字符

  2. ^abc  匹配以abc開始的字符串

  3. abc$  匹配以abc結尾的字符串

  4. [abc]  匹配字符集合

  5. [A-Z0-9] 匹配字符范圍

  6. ed|ing|s 匹配指定的字符串,諸如ed或者ing或者s

  7. *   前面項目0個或者多個,如a*/[a-z]* (也叫Kleene閉包)

  8. +   前面項目1個或者多個,如a+、[a-z]+

  9. ?   前面項目0個或者1個,如a?、[a-z]?

  10. {n}   重復n次

  11. {n,}  至少重復n次

  12. {,n}  重復不多於n次

  13. {m,n}  至少重復m次不多於n次

  14. a(b|c)+  括號表示操作符的范圍

  15. 正則表達式符號:

  16. \b 詞邊界

  17. \d 任何數字等於[0-9]

  18. \D 任何非數字等於[^0-9]

  19. \s 任何空白字符[\t\n\r\f\v]

  20. \S 任何非空白字符[^\t\n\r\f\v]

  21. \w 任何字母[A-Za-z0-9]

  22. \W 任何非字母[^A-Za-z0-9]

  23. \t 制表符

  24. \n 換行符

 

 

相關正則知識:

  1. \d  匹配一個數字

  2. \w 匹配一個字母或者數字

  3. *  任意個字符(包括0個),

  4. +  至少一個字符

  5. ?  0個或1個字符

  6. {n} n個字符

  7. {n,m} n-m個字符

  8. \s 匹配一個空格

  9. \s+ 至少有一個空格

  10. \d{3,8} 表示3-8個數字,例如'1234567'

  11. \d{3}\s+\d{3,8}

  12. [0-9a-zA-Z\_] 匹配一個數字、字母或者下划線

  13. [0-9a-zA-Z\_]+ 匹配至少由一個數字、字母或者下划線組成的字符串,

  14. 比如'a100','0_Z','Py3000'等等;

  15. [a-zA-Z\_][0-9a-zA-Z\_]*可以匹配由字母或下划線開頭,后接任意個由一個數字、字母或者下划線組成的字符串,也就是Python合法的變量

  16. [a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精確地限制了變量的長度是1-20個字符(前面1個字符+后面最多19個字符)

  17. A|B可以匹配A或B,所以(P|p)ython可以匹配'Python'或者'python'

  18. ^表示行的開頭,^\d表示必須以數字開頭

  19. \d

  1. 表示必須以數字結束

參考自:微信公眾號,數據挖掘入門與實戰


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM