java---正則表達式的字符串簡單實用及擴展鏈接

本文轉載自查看原文 2017-02-18 16:09 4807 知識復習

一：什么是正則表達式

1.定義：正則表達式是一種可以用於模式匹配和替換的規范，一個正則表達式就是由普通的字符（例如字符a到z）以及特殊字符（元字符）組成的文字模式，它用以描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板，將某個字符模式與所搜索的字符串進行匹配。

2.用途：

字符串匹配(字符匹配)
字符串查找
字符串替換
字符串分割
這里---正則表達式中每一種標記符都代表一種特殊作用及意義，在表達式中把它們連起來讀就知道它們所表達的意思啦
正則表達式：A.match(B),即是字符串A與正則表達式B（這是因為正則表達式B的每種符號代表一種意義）進行匹配，如果正確則返回true，否則false
- - 1、字母：匹配單個字母
    
    （1）A：表示匹配字母A； "A".match("^A$")返回為true，等於"A".match(^.$)，因為.能夠代表任意字符，所以這種關系是正確的
    
    （2）\\：匹配轉義字符“\”；
    
    （3）\\t：匹配轉義字符“\t”；
    
    （4）\\n：匹配轉義字符“\n”；
    
    2、一組字符：任意匹配里面的一個單個字符：
    
    （1）[abc]：表示可能是字母a，可能是字母b或者是字母c；"a".match("^[abc]$")返回true，但是"d".match("^[abc]$")則返回false
    
    （2）[^abc]：表示不是字母a，字母b，字母c的任意一個；
    
    （3）[a-zA-Z]：表示全部字母中的任意一個；
    
    （4）[0-9]：表示全部數字的任意一個；
    
    3、邊界匹配：在以后編寫JavaScript的時候使用正則中要使用到：
    
           （1）^：表示一組正則的開始；有的正則表達式中常常省略了^
    
           （2）$：表示一組正則的結束；
    
    4、簡寫表達式：每一位出現的簡寫標記也只表示一位：
    
           （1）· ：表示任意的一位字符；
    
           （2）\d ：表示任意的一位數字，等價於“[0-9]”；
    
           （3）\D ：表示任意的一位非數字，等價於“[~0-9]”；
    
           （4）\w ：表示任意的一位字母、數字、_，等價於“[a-zA-Z0-9_]”；
    
           （5）\w ：表示任意的一位非字母、數字、_，等價於“[^a-zA-Z0-9_]”；
    
           （6）\s ：表示任意的一位空格，例如：\n、\t等；
    
           （7）\S ：表示任意的一位非空格；
    
    5、數量表示：之前所有的正則（就是）都只是表示一位，如果要表示多位，則就需要數量表示。
    
    （1）正則表達式？：此正則出現0次或1次；
    
    （2）正則表達式*：此正則出現0次、1次或多次；即該*前面的元素出來的次數，*只是表示出現的次數
    
    （3）正則表達式+：次正則出現1次或多次；
    
    （4）正則表達式{n}：此正則出現正好n次；
    
    （5）正則表達式{n,}：此正則出現n次以上；
    
    （6）正則表達式{n,m}：此正則出現n – m次。
    
    6、邏輯表示：與、或、非
    
           （1）正則表達式A正則表達式B：表達式A之后緊跟着表達式B；
    
           （2）正則表達式A|正則表達式B：表示表達式A或者表達式B，二者任選一個出現；
    
           （3）（正則表達式）：將多個子表達式合成一個表示，作為一組出現。

例如：

 
                 import java.util.Scanner;   
                
                 public class regexTest {  // 新建類  
                
                   public static void main(String[] args){  // 主方法  
                
                     Scanner sc = new Scanner(System.in); // new Scanner類對象  
                
                     System.out.println("Please Enter Email:");  
                
                     String email = sc.nextLine();  
                
                     System.out.println("Please Enter Mobile:");  
                
                     String mobile = sc.nextLine();  
                
                     String Email_regex= "\\w+@\\w+\\.\\w{2,3}";   
                
                     String Mobile_regex= "^((13[0-9])|(15[0-9])|(18[0-9]))\\d{8}";//設定手機號碼正則表達式規則 13*,15*,18*  
                
                     if(email.matches(Email_regex)){  
                
                        System.out.println(email + "是個合法的Email Address!");  
                
                     }  
                
                     else{  
                
                        System.out.println(email + "是個非法的Email Address!");  
                
                      }  
                
                     if(mobile.matches(Mobile_regex)){  
                
                      System.out.println(mobile + "是個合法的手機號碼");  
                
                     }  
                
                     else{  
                
                       System.out.println(mobile + "是個非法的手機號碼");  
                
                     }  
                
                    }  
                
                  }

在程序開發中，難免會遇到需要匹配、查找、替換、判斷字符串的情況發生，而這些情況有時又比較復雜，如果用純編碼方式解決，往往會浪費程序員的時間及精力。因此，學習及使用正則表達式，便成了解決這一矛盾的主要手段。大家都知道，正則表達式是一種可以用於模式匹配和替換的規范，一個正則表達式就是由普通的字符（例如字符a到z）以及特殊字符（元字符）組成的文字模式，它用以描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板，將某個字符模式與所搜索的字符串進行匹配。

自從jdk1.4推出java.util.regex包，就為我們提供了很好的JAVA正則表達式應用平台。

常見的正則表達式規則

 
                 匹配特定數字：  
                
                 ^[1-9]d*$　 　 //匹配正整數  
                
                 ^-[1-9]d*$ 　 //匹配負整數  
                
                 ^-?[1-9]d*$　　 //匹配整數  
                
                 ^[1-9]d*|0$　 //匹配非負整數（正整數 + 0）  
                
                 ^-[1-9]d*|0$　　 //匹配非正整數（負整數 + 0）  
                
                 ^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮點數  
                
                 ^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配負浮點數  
                
                 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮點數  
                
                 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）  
                
                 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮點數（負浮點數 + 0）  
                
                 評注：處理大量數據時有用，具體應用時注意修正  
                
                 匹配特定字符串：  
                
                 ^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串  
                
                 ^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串  
                
                 ^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串  
                
                 ^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串  
                
                 ^w+$　　//匹配由數字、26個英文字母或者下划線組成的字符串  
                
                 在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下:  
                
                 只能輸入數字：“^[0-9]*$”  
                
                 只能輸入n位的數字：“^d{n}$”  
                
                 只能輸入至少n位數字：“^d{n,}$”  
                
                 只能輸入m-n位的數字：“^d{m,n}$”  
                
                 只能輸入零和非零開頭的數字：“^(0|[1-9][0-9]*)$”  
                
                 只能輸入有兩位小數的正實數：“^[0-9]+(.[0-9]{2})?$”  
                
                 只能輸入有1-3位小數的正實數：“^[0-9]+(.[0-9]{1,3})?$”  
                
                 只能輸入非零的正整數：“^+?[1-9][0-9]*$”  
                
                 只能輸入非零的負整數：“^-[1-9][0-9]*$”  
                
                 只能輸入長度為3的字符：“^.{3}$”  
                
                 只能輸入由26個英文字母組成的字符串：“^[A-Za-z]+$”  
                
                 只能輸入由26個大寫英文字母組成的字符串：“^[A-Z]+$”  
                
                 只能輸入由26個小寫英文字母組成的字符串：“^[a-z]+$”  
                
                 只能輸入由數字和26個英文字母組成的字符串：“^[A-Za-z0-9]+$”  
                
                 只能輸入由數字、26個英文字母或者下划線組成的字符串：“^w+$”  
                
                 驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為：以字母開頭，長度在6-18之間，  
                
                 只能包含字符、數字和下划線。  
                
                 驗證是否含有^%&',;=?$”等字符：“[^%&',;=?$x22]+”  
                
                 只能輸入漢字：“^[u4e00-u9fa5],{0,}$”  
                
                 驗證Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”  
                
                 驗證InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”  
                
                 驗證電話號碼：“^((d{3,4})|d{3,4}-)?d{7,8}$”  
                
                 正確格式為：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，  
                
                 “XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。  
                
                 驗證身份證號（15位或18位數字）：“^d{15}|d{}18$”  
                
                 驗證一年的12個月：“^(0?[1-9]|1[0-2])$”正確格式為：“01”-“09”和“1”“12”  
                
                 驗證一個月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$”  
                
                 正確格式為：“01”“09”和“1”“31”。  
                
                 匹配中文字符的正則表達式： [u4e00-u9fa5]  
                
                 匹配雙字節字符(包括漢字在內)：[^x00-xff]  
                
                 匹配空行的正則表達式：n[s| ]*r  
                
                 匹配HTML標記的正則表達式：/< (.*)>.*|< (.*) />/  
                
                 匹配首尾空格的正則表達式：(^s*)|(s*$)  
                
                 匹配Email地址的正則表達式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*  
                
                 匹配網址URL的正則表達式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

從網頁中揪出email地址
IP地址是否正確
從網頁中揪出鏈接

3.java中處理正則表達式的類：

java.lang.String
java.util.regex.Pattern：模式類：字符串要被匹配的這么一個模式，該模式本身已經被編譯過，使用的話效率要高很多。
java.util.regex.Matcher：匹配類：這個模式匹配某個字符串所產生的結果，這個結果可能會有很多個。

4：下面通過一個小程序簡單介紹一下正則表達式

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {

    public static void main(String[] args) {
        //matches()判斷字符串是否匹配某個表達式，"."表示任何一個字符
        p("abc".matches("..."));
        //將字符串"a2389a"中的數字用*替換，\d 表示“0--9”數字
        p("a2389a".replaceAll("\\d", "*"));
        //將任何是a--z的字符串長度為3的字符串進行編譯，這樣可以加快匹配速度
        Pattern p = Pattern.compile("[a-z]{3}");
        //進行匹配，並將匹配結果放在Matcher對象中
        Matcher m = p.matcher("abc");
        p(m.matches());
        //上面的三行代碼可以用下面一行代碼代替
        p("abc".matches("[a-z]{3}"));
    }
    
    public static void p(Object o){
        System.out.println(o);
    }
}

下面是打印結果

true
a****a
true
true

現在通過一些實驗來說明正則表達式的匹配規則,這兒是Greedy方式

. 任何字符

a? a一次或一次也沒有

a* a零次或多次

a+ a一次或多次

a{n}? a恰好 n 次

a{n,}? a至少n次

a{n,m}? a至少n次，但是不超過m次

        //初步認識. * + ?
        p("a".matches("."));//true
        p("aa".matches("aa"));//true
        p("aaaa".matches("a*"));//true
        p("aaaa".matches("a+"));//true
        p("".matches("a*"));//true
        p("aaaa".matches("a?"));//false
        p("".matches("a?"));//true
        p("a".matches("a?"));//true
        p("1232435463685899".matches("\\d{3,100}"));//true
        p("192.168.0.aaa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));//false
        p("192".matches("[0-2][0-9][0-9]"));//true

[abc] a、b 或 c（簡單類）

[^abc] 任何字符，除了 a、b 或 c（否定）

[a-zA-Z] a 到 z 或 A 到 Z，兩頭的字母包括在內（范圍）

[a-d[m-p]] a 到 d 或 m 到 p：[a-dm-p]（並集）

[a-z&&[def]] d、e 或 f（交集）

[a-z&&[^bc]] a 到 z，除了 b 和 c：[ad-z]（減去）

[a-z&&[^m-p]] a 到 z，而非 m 到 p：[a-lq-z]（減去）

        //范圍
        p("a".matches("[abc]"));//true
        p("a".matches("[^abc]"));//false
        p("A".matches("[a-zA-Z]"));//true
        p("A".matches("[a-z]|[A-Z]"));//true
        p("A".matches("[a-z[A-Z]]"));//true
        p("R".matches("[A-Z&&[RFG]]"));//true

\d 數字：[0-9]

\D 非數字： [^0-9]

\s 空白字符：[ \t\n\x0B\f\r]

\S 非空白字符：[^\s]

\w 單詞字符：[a-zA-Z_0-9]

\W 非單詞字符：[^\w]

         //認識\s \w \d \
        p("\n\r\t".matches("\\s(4)"));//false
        p(" ".matches("\\S"));//false
        p("a_8 ".matches("\\w(3)"));//false
        p("abc888&^%".matches("[a-z]{1,3}\\d+[&^#%]+"));//true
        p("\\".matches("\\\\"));//true

邊界匹配器

^ 行的開頭

$ 行的結尾

\b 單詞邊界

\B 非單詞邊界

\A 輸入的開頭

\G 上一個匹配的結尾

\Z 輸入的結尾，僅用於最后的結束符（如果有的話）

\z 輸入的結尾

        //邊界匹配
        p("hello sir".matches("^h.*"));//true
        p("hello sir".matches(".*ir$"));//true
        p("hello sir".matches("^h[a-z]{1,3}o\\b.*"));//true
        p("hellosir".matches("^h[a-z]{1,3}o\\b.*"));//false
        //空白行:一個或多個(空白並且非換行符)開頭，並以換行符結尾
        p(" \n".matches("^[\\s&&[^\\n]]*\\n$"));//true

方法解析

matches():匹配整個字符串

find():匹配子字符串

lookingAt():永遠從整個字符串的開頭開始匹配

//email
        p("asdsfdfagf@adsdsfd.com".matches("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"));//true
        
        //matches() find() lookingAt()
        Pattern p = Pattern.compile("\\d{3,5}");
        Matcher m = p.matcher("123-34345-234-00");
        
        //將整個"123-34345-234-00"用正則表達式引擎查找匹配，當到第一個"-"不匹配了，就停止，
        //但不會將不匹配的"-"吐出來
        p(m.matches());
        //將不匹配的"-"吐出來
        m.reset();
        
        //1:當前面有p(m.matches());查找子字符串從"...34345-234-00"開始
        //將會是第1,2兩個查到"34345"和"234" 后面2個查不到為false
        //2:當前面有p(m.matches());和m.reset();查找子字符串從"123-34345-234-00"開始
        //將為true,true,true,false
        p(m.find());
        p(m.start()+"---"+m.end());
        p(m.find());
        p(m.start()+"---"+m.end());
        p(m.find());
        p(m.start()+"---"+m.end());
        p(m.find());
        //要是沒找到就會報異常java.lang.IllegalStateException
        //p(m.start()+"---"+m.end());
        
        p(m.lookingAt());
        p(m.lookingAt());
        p(m.lookingAt());
        p(m.lookingAt());

字符串替換：下面這種方法對於字符串替換非常靈活

        //字符串替換
        //Pattern.CASE_INSENSITIVE大小寫不敏感
        Pattern p = Pattern.compile("java",Pattern.CASE_INSENSITIVE);
        Matcher m = p.matcher("java Java jAva ILoveJavA youHateJAVA adsdsfd");
        //存放字符串
        StringBuffer  buf = new StringBuffer();
        //計數奇偶數
        int i  = 0;
        while(m.find()){
            i++;
            if(i%2 == 0){
                m.appendReplacement(buf, "java");
            }else{
                m.appendReplacement(buf, "JAVA");
            }
        }
        //不加這句話，字符串adsdsfd將會被遺棄
        m.appendTail(buf);
        p(buf);

結果打印：

JAVA java JAVA ILovejava youHateJAVA adsdsfd

分組

        //group分組,用()分組
        Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})");
        String s = "123aa-34345bb-234cc-00";
        Matcher m = p.matcher(s);
        p(m.groupCount());//2組
        while(m.find()){
            p(m.group());//數字字母都有
            //p(m.group(1));//只有數字
            //p(m.group(2));//只有字母
        }

二、正則表達式簡單使用

java正則表達式應用

三、其他網上資料

深入淺出之正則表達式（一）

深入淺出之正則表達式（二）

正則表達式30分鍾入門教程

JQuery 正則表達式實例

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 java 字符串與正則表達式 Java--正則表達式-簡單的在字符串中找數字正則表達式獲取字符串中的img標簽中的url鏈接 shell- 字符串處理、擴展的腳本技巧、正則表達式正則表達式匹配並替換字符串正則表達式 & 字符串處理 js字符串和正則表達式 python_字符串&正則表達式正則表達式匹配不包含某些字符串正則表達式排除特定字符串