在計算機屏幕上,一個漢字要占兩個英文字符的位置,人們把一個英文字符所占的位置稱為"半角",相對地把一個漢字所占的位置稱為"全角"。在漢字輸入時,系統提供"半角"和"全角"兩種不同的輸入狀態,但是對於英文字母、符號和數字這些通用字符就不同於漢字,在半角狀態它們被作為英文字符處理;而在全角狀態,它們又可作為中文字符處理。半角和全角切換方法:單擊輸入法工具條上的按鈕或按鍵盤上的Shift+Space鍵來切換。
1、全角:指一個字符占用兩個標准字符位置。
漢字字符和規定了全角的英文字符及國標GB2312-80中的圖形符號和特殊字符都是全角字符。一般的系統命令是不用全角字符的,只是在作文字處理時才會使用全角字符。
2、半角:指一字符占用一個標准的字符位置。
通常的英文字母、數字鍵、符號鍵都是半角的,半角的顯示內碼都是一個字節。在系統內部,以上三種字符是作為基本代碼處理的,所以用戶輸入命令和參數時一般都使用半角。
3、全角與半角各在什么情況下使用?
全角占兩個字節,半角占一個字節。
半角全角主要是針對標點符號來說的,全角標點占兩個字節,半角占一個字節,而不管是半角還是全角,漢字都還是要占兩個字節。
在編程序的源代碼中只能使用半角標點(不包括字符串內部的數據)
在不支持漢字等語言的計算機上只能使用半角標點(其實這種情況根本就不存在半角全角的概念)
對於大多數字體來說,全角看起來比半角大,當然這不是本質區別了。
4、全角和半角的區別
全角就是字母和數字等與漢字占等寬位置的字。半角就是ASCII方式的字符,在沒有漢字輸入法起做用的時候輸入的字母數字和字符都是半角的。
在漢字輸入法出現的時候,輸入的字母數字默認為半角,但是標點則是默認為全角,可以通過鼠標點擊輸入法工具條上的相應按鈕來改變。
全角狀態下字母、數字符號等都會占兩個字節的位置,也就是一個漢字那么寬,半角狀態下,字母數字符號一般會占一個字節,也就是半個漢字的位置,全角半角對漢字沒有影響。
半角字符是從33開始到126結束
全角字符是從65281開始到65374結束
其中半角的空格是32.對應的全角空格是12288
半角和全角的關系很明顯,除空格外的字符偏移量是65248(65281-33 = 65248)
1、使用正則表達式判斷全角還是半角
String test1 = "0123456789abcde!@#$%^& 幽雨"; char[] chars_test1 = test1.toCharArray(); for (int i = 0; i < chars_test1.length; i++) { String temp = String.valueOf(chars_test1[i]); // 判斷是全角字符 if (temp.matches("[^\\x00-\\xff]")) { System.out.println("全角 " + temp); } // 判斷是半角字符 else { System.out.println("半角 " + temp); } } }
2、如果不想要字符串中的漢字的話,可以使用正則表達式將之去除: [\u4e00-\u9fa5]
String ss = "waeaeaea我們women在這里";
System.out.println(ss.replaceAll("[\u4e00-\u9fa5]", ""));
3、使用字符的unicode碼進行判斷
String str="abcx除夕放假通知xyxccc"; char[] charArr=str.toCharArray(); for(int i=0;i<charArr.length;i++){ int charValue=charArr[i]; // 判斷是全角字符 if (charValue >= 65281 && charValue <= 65374 || charValue == 12288) { System.out.println("全角 " + (char) charValue); } // 判斷是半角字符 else if (charValue >= 33 && charValue <= 126 || charValue == 32) { System.out.println("半角 " + (char) charValue); } }
全角、半角轉換工具類:
package com.idea.utils; /** * <PRE> * 提供對字符串的全角->半角,半角->全角轉換 * </PRE> */ public class HalfWidth2fullWidthConversion { /** * ASCII表中可見字符從!開始,偏移位值為33(Decimal) */ static final char DBC_CHAR_START = 33; // 半角! /** * ASCII表中可見字符到~結束,偏移位值為126(Decimal) */ static final char DBC_CHAR_END = 126; // 半角~ /** * 全角對應於ASCII表的可見字符從!開始,偏移值為65281 */ static final char SBC_CHAR_START = 65281; // 全角! /** * 全角對應於ASCII表的可見字符到~結束,偏移值為65374 */ static final char SBC_CHAR_END = 65374; // 全角~ /** * ASCII表中除空格外的可見字符與對應的全角字符的相對偏移 */ static final int CONVERT_STEP = 65248; // 全角半角轉換間隔 /** * 全角空格的值,它沒有遵從與ASCII的相對偏移,必須單獨處理 */ static final char SBC_SPACE = 12288; // 全角空格 12288 /** * 半角空格的值,在ASCII中為32(Decimal) */ static final char DBC_SPACE = ' '; // 半角空格 /** * <PRE> * 半角字符->全角字符轉換 * 只處理空格,!到˜之間的字符,忽略其他 * </PRE> */ public static String bj2qj(String src) { if (src == null) { return src; } StringBuilder buf = new StringBuilder(src.length()); char[] ca = src.toCharArray(); for (int i = 0; i < ca.length; i++) { if (ca[i] == DBC_SPACE) { // 如果是半角空格,直接用全角空格替代 buf.append(SBC_SPACE); } else if ((ca[i] >= DBC_CHAR_START) && (ca[i] <= DBC_CHAR_END)) { // 字符是!到~之間的可見字符 buf.append((char) (ca[i] + CONVERT_STEP)); } else { // 不對空格以及ascii表中其他可見字符之外的字符做任何處理 buf.append(ca[i]); } } return buf.toString(); } /** * <PRE> * 全角字符->半角字符轉換 * 只處理全角的空格,全角!到全角~之間的字符,忽略其他 * </PRE> */ public static String qj2bj(String src) { if (src == null) { return src; } StringBuilder buf = new StringBuilder(src.length()); char[] ca = src.toCharArray(); for (int i = 0; i < src.length(); i++) { if (ca[i] >= SBC_CHAR_START && ca[i] <= SBC_CHAR_END) { // 如果位於全角!到全角~區間內 buf.append((char) (ca[i] - CONVERT_STEP)); } else if (ca[i] == SBC_SPACE) { // 如果是全角空格 buf.append(DBC_SPACE); } else { // 不處理全角空格,全角!到全角~區間外的字符 buf.append(ca[i]); } } return buf.toString(); } }
注意事項:1、StringUtils.trim() 不能對全角空格進行去重(不起作用)
2、str="abc ";與str1="abc "; 字符串長度相同