Java如何判斷字符串中包含有全角,半角符號

本文轉載自查看原文 2017-02-07 13:51 19472 全角/ 半角/ java

首先介紹下全角跟半角之間的區別:

在計算機屏幕上，一個漢字要占兩個英文字符的位置，人們把一個英文字符所占的位置稱為"半角"，相對地把一個漢字所占的位置稱為"全角"。在漢字輸入時，系統提供"半角"和"全角"兩種不同的輸入狀態，但是對於英文字母、符號和數字這些通用字符就不同於漢字，在半角狀態它們被作為英文字符處理；而在全角狀態，它們又可作為中文字符處理。半角和全角切換方法：單擊輸入法工具條上的按鈕或按鍵盤上的Shift+Space鍵來切換。

1、全角：指一個字符占用兩個標准字符位置。

漢字字符和規定了全角的英文字符及國標GB2312-80中的圖形符號和特殊字符都是全角字符。一般的系統命令是不用全角字符的，只是在作文字處理時才會使用全角字符。

2、半角：指一字符占用一個標准的字符位置。

通常的英文字母、數字鍵、符號鍵都是半角的，半角的顯示內碼都是一個字節。在系統內部，以上三種字符是作為基本代碼處理的，所以用戶輸入命令和參數時一般都使用半角。

3、全角與半角各在什么情況下使用？

全角占兩個字節，半角占一個字節。

半角全角主要是針對標點符號來說的，全角標點占兩個字節，半角占一個字節，而不管是半角還是全角，漢字都還是要占兩個字節。

在編程序的源代碼中只能使用半角標點（不包括字符串內部的數據）

在不支持漢字等語言的計算機上只能使用半角標點（其實這種情況根本就不存在半角全角的概念）

對於大多數字體來說，全角看起來比半角大，當然這不是本質區別了。

4、全角和半角的區別

全角就是字母和數字等與漢字占等寬位置的字。半角就是ASCII方式的字符，在沒有漢字輸入法起做用的時候輸入的字母數字和字符都是半角的。

在漢字輸入法出現的時候，輸入的字母數字默認為半角，但是標點則是默認為全角，可以通過鼠標點擊輸入法工具條上的相應按鈕來改變。

5、關於“全角”和“半角”：

全角：是指中GB2312-80（《信息交換用漢字編碼字符集·基本集》）中的各種符號。

半角：是指英文件ASCII碼中的各種符號。

全角狀態下字母、數字符號等都會占兩個字節的位置，也就是一個漢字那么寬，半角狀態下，字母數字符號一般會占一個字節，也就是半個漢字的位置，全角半角對漢字沒有影響。

說了那么多,我們就看下在java編程語言中如何來判斷字符串中的全角半角符號。

有兩種方式可以判斷:

1:通過正則表達式來進行判斷 [^\\x00-\\xff]

2: 通過字符編碼的范圍進行判斷.

有關字符編碼的范圍介紹如下:

               我們可以編寫一個測試用例輸出所有的字符編碼。
     public static void main(String[] args) {
                   for (int i = Character.MIN_VALUE; i <= Character.MAX_VALUE; ++i) {
              System.out.println(i + "    " + (char)i);
          }
       }

測試結果如下:(截取部分圖)

經過測試發現:

1.半角字符是從33開始到126結束
2.與半角字符對應的全角字符是從65281開始到65374結束
3.其中半角的空格是32.對應的全角空格是12288
半角和全角的關系很明顯,除空格外的字符偏移量是65248(65281-33 = 65248)

// 測試用例1----------使用正則表達式
       // 純半角，包含有數字，字母，特殊符號，空格，漢字
       String test1 = "0123456789abcde!@#$%^& 幽雨";
       char[] chars_test1 = test1.toCharArray();
      for (int i = 0; i < chars_test1.length; i++) {
           String temp = String.valueOf(chars_test1[i]);
           // 判斷是全角字符
           if (temp.matches("[^\\x00-\\xff]")) {
               System.out.println("全角   " + temp);
           }
           // 判斷是半角字符
           else {
               System.out.println("半角    " + temp);
           }
       }

測試結果如下:

// 測試用例2----------使用正則表達式
       // 純全角，包含有數字，字母，特殊符號，空格，漢字
       String test2 = "０１２３４５６７８９ａｂｃｄｅ！＠＃＄％＾＆　幽雨";
       char[] chars_test2 = test2.toCharArray();
      for (int i = 0; i < chars_test2.length; i++) {
           String temp = String.valueOf(chars_test2[i]);
           // 判斷是全角字符
           if (temp.matches("[^\\x00-\\xff]")) {
               System.out.println("全角   " + temp);
           }
           // 判斷是半角字符
           else {
               System.out.println("半角    " + temp);
           }
       }

測試結果如下:

// 測試用例3----------使用正則表達式
       // 混合，包含有數字，字母，特殊符號，空格，漢字
       String test3 = "0123456789abcde!@#$%^& 幽雨０１２３４５６７８９ａｂｃｄｅ！＠＃＄％＾＆　幽雨";
       char[] chars_test3 = test3.toCharArray();
      for (int i = 0; i < chars_test3.length; i++) {
           String temp = String.valueOf(chars_test3[i]);
           // 判斷是全角字符
           if (temp.matches("[^\\x00-\\xff]")) {
               System.out.println("全角   " + temp);
           }
           // 判斷是半角字符
           else {
               System.out.println("半角    " + temp);
           }
       }

測試結果如下:

這里介紹下如果不想要字符串中的漢字的話,可以使用正則表達式將之去除: [\u4e00-\u9fa5]

測試用例4：

去除字符串中漢字

String ss = "waeaeaea我們ｗｏｍｅｎ在這里";
System.out.println(ss.replaceAll("[\u4e00-\u9fa5]", ""));

測試結果如下：不管是全角還是半角下的漢字

或者是截取出字符串中的漢字

String ss = "waeaeaea我們ｗｏｍｅｎ在這里";

char[] chars_ss = ss.toCharArray();

String test = "";
for (int i = 0; i < chars_ss.length; i++) {
           String temp = String.valueOf(chars_ss[i]);
           // 判斷是漢字
           if (temp.matches("[\u4e00-\u9fa5]")) {
               test += temp;
           }
    }
System.out.println(test);

測試結果如下：

測試用例5--------使用字符的unicode碼進行判斷

// 純半角，包含有數字，字母，特殊符號，空格，漢字
String test1 = "0123456789abcde!@#$%^& 幽雨";

// 首先將漢字用空格替換掉
test1 = test1.replaceAll("[\u4e00-\u9fa5]", "");

        char[] chars_test1 = test1.toCharArray();
       for (int i = 0; i < chars_test1.length; i++) {
           int charValue = (int) chars_test1[i];
           // 判斷是全角字符
           if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
               System.out.println("全角 " + (char) charValue);
           }
           // 判斷是半角字符
           else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
               System.out.println("半角 " + (char) charValue);
           }
       }

測試結果如下：

測試用例6--------使用字符的unicode碼進行判斷

// 純全角，包含有數字，字母，特殊符號，空格，漢字
String test2 = "０１２３４５６７８９ａｂｃｄｅ！＠＃＄％＾＆　幽雨";

// 首先將漢字用空格替換掉
test2 = test2.replaceAll("[\u4e00-\u9fa5]", "");

        char[] chars_test2 = test2.toCharArray();
       for (int i = 0; i < chars_test2.length; i++) {
           int charValue = (int) chars_test2[i];
           // 判斷是全角字符
           if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
               System.out.println("全角 " + (char) charValue);
           }
           // 判斷是半角字符
           else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
               System.out.println("半角 " + (char) charValue);
           }
       }

測試結果如下:

測試用例7--------使用字符的unicode碼進行判斷

// 混合，包含有數字，字母，特殊符號，空格，漢字
String test3 = "0123456789abcde!@#$%^& 幽雨０１２３４５６７８９ａｂｃｄｅ！＠＃＄％＾＆　幽雨";

// 首先將漢字用空格替換掉
test3 = test3.replaceAll("[\u4e00-\u9fa5]", "");

        char[] chars_test3 = test3.toCharArray();
       for (int i = 0; i < chars_test3.length; i++) {
           int charValue = (int) chars_test3[i];
           // 判斷是全角字符
           if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) {
               System.out.println("全角 " + (char) charValue);
           }
           // 判斷是半角字符
           else if (charValue >= 33 && charValue <= 126 || charValue == 32) {
               System.out.println("半角 " + (char) charValue);
           }
       }

測試結果如下:

參考鏈接是:

1.http://blog.csdn.net/liming0931/article/details/22384559/

2.http://www.jb51.net/article/43718.htm

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [js][字符串]給字符串去空格（全角和半角） Java判斷字符串中是否含有英文 java判斷字符串中是否含有漢字 java判斷字符串中是否含有中文判斷java或js中的某個字符串中是否包含有某個字符或是字符串 php字符串處理之全角半角轉換 java判斷A字符串中是否包含B字符 JS/Java中，判斷字符串是否包含中文 java中判斷字符串是否為只包含數字 java判斷字符串中包含中文