正則表達式中原子的5種類型


原子是正則表達式的最基本的組成單位,而且在每個模式中最少包含一個原子。原子是由所有那些未顯示指定為元字符的打印和非打印字符組成,所以在這里將其詳細划分為五類進行介紹。

   ①普通字符作為原子
  普通字符是編寫正則表達式時最常見的原子了,包括所有的大寫和小寫字母字符、所有數字等。例如,a——z、A——Z、0——9。
  ’/5/’        –用於匹配字符串中是否有5這個字符出現
  ’/php/’      –用於匹配字符串中是否有PHP字符串出現
   ②一些特殊字符和元字符作為原子
  任何一個符號都可以作為原子使用,但如果這個符號在正則表達式中有一些特殊意義,我們就必須使用轉義字符“\”取消它的特殊意義,將其變成一個普通的原子。例如,所有標點符號以及一些其他符號,雙引號“””、單引號“’”、“*”、“+”、“.”等,如果當原子就必須像\”、\’、\+和\.這樣使用。
  ‘/\./’           –用於匹配字符串中是否有英文的“.”出現
  ’/\<br\/\>/’     –用於匹配字符串中是否有HTML的<br/>標記字符串出現
   ③一些非打印字符作為原子
  所謂的非打印字符,是一些在字符串中的格式控制符號,例如空格、回車及制表符號等。例如下表所示列出了正則表達式中常用的非打印字符及其含義。
正則表達式中常用的非打印字符
   ④使用“通用字符類型”作為原子
  前面介紹的不管是打印字符還是非打印字符作為原子,都是一個原子只能匹配一個字符。而有時我們需要一個原子可以匹配一類字符,例如,匹配所有數字不是一個數字,匹配所有字母而不是一個字母,這時就要使用“通用字符類型”了。例如下表所示列出了正則表達式中常用“通用字符類型”及其含義。
正則表達式中常用的“通用字符類型”
   ⑤自定義原子表([])作為原子
  雖然前面介紹過“類原子”,可以代表一組原子中的一個,但系統只給我們提供了上表中介紹的6個“類原子”。因為代表某一類的原子太多了,系統不能全都給提供出來,例如數字中的奇數(1、3、5、7、9、)、字母中的元音字母(a、e、i、o、u)等。所以就需要我們可以自己定義出特定的“類原子”,使用原子表“[]”就可以定義一組彼此地位平等的原子,且從原子表中僅選擇一個原子進行匹配。如下所示: 正則表達式自定義原子表
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM