java中正則表達式基本用法(轉)


https://www.cnblogs.com/xhj123/p/6032683.html

正則表達式是一種可以用於模式匹配和替換的規范,一個正則表達式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)組成的文字模式,它 用以描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。

眾所周知,在程序開發中,難免會遇到需要匹配、查找、替換、判斷字符串的情況發生,而這些情況有時又比較復雜,如果用純編碼方式解決,往往會浪費程序員的時間及精力。因此,學習及使用正則表達式,便成了解決這一矛盾的主要手段。

大家都知道,正則表達式是一種可以用於模式匹配和替換的規范,一個正則表達式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)組成的文字模式,它 用以描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。

  自從jdk1.4推出java.util.regex包,就為我們提供了很好的JAVA正則表達式應用平台。

 因為正則表達式是一個很龐雜的體系,所以我僅例舉些入門的概念,更多的請參閱相關書籍及自行摸索。

*下面是java中正則表達式常用的語法:

邏輯表達式
XY: 表示X后面跟着Y,這里X和Y分別是正則表達式的一部分
X|Y:表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f
(X):子表達式,將X看做是一個整體

字符的取值范圍
[abc] : 表示可能是a,可能是b,也可能是c。
[^abc]: 表示不是a,b,c中的任意一個
[a-zA-Z]: 表示是英文字母
[0-9]:表示是數字

簡潔的字符表示
.:匹配任意的字符
\d:表示數字
\D:表示非數字
\s:表示由空字符組成,[ \t\n\r\x\f]
\S:表示由非空字符組成,[^\s]
\w:表示字母、數字、下划線,[a-zA-Z0-9_]
\W:表示不是由字母、數字、下划線組成

數量表達式
?: 表示出現0次或1次
+: 表示出現1次或多次
*: 表示出現0次、1次或多次
{n}:表示出現n次
{n,m}:表示出現n~m次
{n,}:表示出現n次或n次以上


java中提供了兩個類來支持正則表達式的操作
分別是java.util.regex下的Pattern類和Matcher類
使用Pattern類進行字符串的拆分,使用的方法是String[] split(CharSequence input)
使用Matcher類進行字符串的驗證和替換,
匹配使用的方法是boolean matches()
替換使用的方法是 String replaceAll(String replacement)

Pattern類的構造方法是私有的
所以我們使用Pattern p = Pattern.compile("a*b");進行實例化
Matcher類的實例化依賴Pattern類的對象Matcher m = p.matcher("aaaaab");

在實際的開發中,為了方便我們很少直接使用Pattern類或Matcher類,而是使用String類下的方法
驗證:boolean matches(String regex)
拆分: String[] split(String regex)
替換: String replaceAll(String regex, String replacement)

下面是正則表達式的簡單使用:
1、Test01.java :使用正則表達式使代碼變得非常簡潔。

復制代碼
 1 package test_regex;
 2 public class Test01 {
 3     public static void main(String[] args){
 4         String str = "1234567";
 5 //        char[] c = str.toCharArray();
 6 //        boolean b = true;
 7 //        for(char c1:c){
 8 //            if(!(c1>='0'&&c1<='9')){
 9 //                b = false;
10 //                break;
11 //            }
12 //        }
13 //        System.out.println(b);
14 
15         String regex = "\\d+";
16         System.out.println(str.matches(regex));
17     }
18 }
復制代碼

2、TestMatcher01.java(Matcher類的使用,用於字符串的驗證)

復制代碼
 1 package test_regex;
 2 import java.util.regex.Pattern;
 3 import java.util.regex.Matcher;
 4 public class TestMatcher01 {
 5     public static void main(String[] args){
 6         String str = "1234567abc";
 7         String regex = "\\w{10,}";
 8 //        Pattern pat = Pattern.compile(regex);
 9 //        Matcher mat = pat.matcher(str);
10 //        System.out.println(mat.matches());
11         System.out.println(str.matches(regex));
12     }
13 }
復制代碼

3、TestMatcher02.java(Matcher類的使用,用於字符串的替換)

復制代碼
 1 package test_regex;
 2 import java.util.regex.Pattern;
 3 import java.util.regex.Matcher;
 4 public class TestMatcher02 {
 5     public static void main(String[] args){
 6         String str = "12Y34h56dAd7";
 7         String regex = "[a-zA-Z]+";
 8 //        Pattern pat = Pattern.compile(regex);
 9 //        Matcher mat = pat.matcher(str);
10 //        System.out.println(mat.replaceAll(":"));
11         System.out.println(str.replaceAll(regex,"-"));
12     }
13 }
復制代碼

4、TestPattern01.java(Pattern類的使用,用於字符串的拆分)

復制代碼
 1 package test_regex;
 2 import java.util.regex.Pattern;
 3 public class TestPattern01 {
 4     public static void main(String[] args){
 5         String str = "Tom:30|Jerry:20|Bob:25";
 6         String regex = "\\|";
 7 //        Pattern pat = Pattern.compile(regex);
 8 //        String[] arr = pat.split(str);
 9         String[] arr = str.split(regex);
10         for(String s:arr){
11             System.out.println(s);
12         }
13     }
14 }
復制代碼

5、TestRegex01.java(大概判斷一個郵箱地址是否合法)

復制代碼
 1 package test_regex;
 2 public class TestRegex01 {
 3     //判斷一個郵箱地址是否合法
 4     public static void main(String[] args){
 5         //這里默認郵箱的后綴是.com或.net.cn
 6         String str = "aa@aa.net.cn";
 7         String regex = "\\w+@\\w+\\.(com|net.cn)";
 8         System.out.println(str.matches(regex));
 9     }
10 }

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM