[原]Java 正則多子串匹配替換

本文轉載自查看原文 2013-02-20 17:59 24672 正則多子串替換

正則表達式異常強大，一直理解不深，用的也不深，這次項目中嘗試，體會到了它的強大之處。字符串查找，匹配，替換，正則無不能做，特別是靈活的運用子串匹配得到的變量值$1,$2，再進行二次處理能夠達到很巧妙的效果。

Java中使用也比較簡單：

1. 編譯正則表達式的字面值得到對應的模式Pattern對象；

2. 創建匹配給定輸入與此模式的匹配器Matcher；

3. 通過匹配器對象執行操作，匹配器對象的方法很豐富，方法之間組合使用更加強大。

直接代碼吧

public static void main(String[] args) {
	//被替換關鍵字的的數據源
	Map<String,String> tokens = new HashMap<String,String>();
	tokens.put("cat", "Garfield");
	tokens.put("beverage", "coffee");

	//匹配類似velocity規則的字符串
	String template = "${cat} really needs some ${beverage}.";
	//生成匹配模式的正則表達式
	String patternString = "\\$\\{(" + StringUtils.join(tokens.keySet(), "|") + ")\\}";

	Pattern pattern = Pattern.compile(patternString);
	Matcher matcher = pattern.matcher(template);

	//兩個方法：appendReplacement, appendTail
	StringBuffer sb = new StringBuffer();
	while(matcher.find()) {
	    matcher.appendReplacement(sb, tokens.get(matcher.group(1)));
	}
	matcher.appendTail(sb);

	//out: Garfield really needs some coffee.
	System.out.println(sb.toString());

	//對於特殊含義字符"\","$"，使用Matcher.quoteReplacement消除特殊意義
	matcher.reset();
	//out: cat really needs some beverage.
	System.out.println(matcher.replaceAll("$1"));
	//out: $1 really needs some $1.
	System.out.println(matcher.replaceAll(Matcher.quoteReplacement("$1")));

	//到得郵箱的前綴名。插一句，其實驗證郵箱的正則多種多樣，根據自己的需求寫對應的正則才是王道
	String emailPattern = "^([a-z0-9_\\.\\-\\+]+)@([\\da-z\\.\\-]+)\\.([a-z\\.]{2,6})$";
	pattern = Pattern.compile(emailPattern);
	matcher = pattern.matcher("test@qq.com");
	//驗證是否郵箱
	System.out.println(matcher.find());
	//得到@符號前的郵箱名  out: test
	System.out.println(matcher.replaceAll("$1"));

	//獲得匹配值
	String temp = "<meta-data android:name=\"appid\" android:value=\"joy\"></meta-data>";
	pattern = Pattern.compile("android:(name|value)=\"(.+?)\"");
	matcher = pattern.matcher(temp);
	while(matcher.find()) {
		//out: appid, joy
		System.out.println(matcher.group(2));
	}
}

一些老是忘基礎

[...] 位於括號之內的任意字符

[^...] 不在括號之中的任意字符

. 除了換行符之外的任意字符,等價於[^\n]

\w 任何單字字符, 等價於[a-zA-Z0-9]

\W 任何非單字字符,等價於[^a-zA-Z0-9]

\s 任何空白符,等價於[\ t \ n \ r \ f \ v]

\S 任何非空白符,等價於[^\ t \ n \ r \ f \ v]

\d 任何數字,等價於[0-9]

\D 除了數字之外的任何字符,等價於[^0-9]

[\b] 一個退格直接量(特例)

{n, m} 匹配前一項至少n次,但是不能超過m次

{n, } 匹配前一項n次,或者多次

{n} 匹配前一項恰好n次

? 匹配前一項0次或1次,也就是說前一項是可選的. 等價於 {0, 1}

+ 匹配前一項1次或多次,等價於{1,}

* 匹配前一項0次或多次.等價於{0,}

| 選擇.匹配的要么是該符號左邊的子表達式,要么它右邊的子表達式

(...) 分組.將幾個項目分為一個單元.這個單元可由 *、+、？和|等符號使用,而且還可以記住和這個組匹配的字符以供此后引用使用

\n 和第n個分組所匹配的字符相匹配.分組是括號中的子表達式(可能是嵌套的).分組號是從左到右計數的左括號數

^ 匹配的是字符的開頭,在多行檢索中,匹配的是一行的開頭

$ 匹配的是字符的結尾,在多行檢索中,匹配的是一行的結尾

\b 匹配的是一個詞語的邊界.簡而言之就是位於字符\w 和 \w之間的位置(注意:[\b]匹配的是退格符)

\B 匹配的是非詞語的邊界的字符

題外話

郵箱驗證，以前驗證郵箱，網上搜個正則裝在自己程序里面就用，其實這是不對的，不同的公司對郵箱的驗證格式是不一樣的，比方說163和qq郵箱注冊，他們要求的格式都不一樣，所以搜一個正則表達式就去套所有的郵箱格式也是不對的，符合自己的需求的正則才是正確的。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java之正則替換/分割/匹配 tcl 正則匹配與替換 java 正則表達式匹配指定變量並替換 idea java 正則表達式匹配替換正則匹配與替換 regexp & regsub editplus正則匹配查找替換 Java正則多次匹配和多次組匹配字符串正則匹配替換 PHP正則匹配與替換的簡單例子正則表達式之匹配替換