java 中文及特殊字符校驗


java 中文及特殊字符校驗

CreateTime--2017年8月25日16:54:50

Author:Marydon

一、參考鏈接

  http://blog.csdn.net/imduan/article/details/54907998

二、具體實現

  1.關於Character.UnicodeBlock的介紹

  CJK的意思是“Chinese,Japanese,Korea”的簡寫 ,實際上就是指中日韓三國的象形文字的Unicode編碼

  Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS : 4E00-9FBF:Unicode 編碼為 U+4E00~U+9FFF 的 CJK 統一文字 
  Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS :F900-FAFF:CJK 兼容象形文字

  Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A :3400-4DBF:CJK 統一表意符號擴展 A 
  Character.UnicodeBlock.GENERAL_PUNCTUATION :2000-206F:常用標點

  Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION :3000-303F:CJK 符號和標點                                   

  Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS :FF00-FFEF:半角及全角形式

  2.封裝

/**
 * 校驗一個字符是否是漢字
 * 
 * @param c
 *            被校驗的字符
 * @return true代表是漢字
 */
public static boolean isChineseChar(char c) {
    try {
        return String.valueOf(c).getBytes("UTF-8").length > 1;
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
        return false;
    }
}

/**
 * 驗證字符串內容是否包含下列非法字符<br>
 * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
 * 
 * @param content
 *            字符串內容
 * @return 't'代表不包含非法字符,otherwise代表包含非法字符。
 */
public static char validateLegalString(String content) {
    String illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
    char isLegalChar = 't';
    L1: for (int i = 0; i < content.length(); i++) {
        for (int j = 0; j < illegal.length(); j++) {
            if (content.charAt(i) == illegal.charAt(j)) {
                isLegalChar = content.charAt(i);
                break L1;
            }
        }
    }
    return isLegalChar;
}

/**
 * 驗證是否是漢字或者0-9、a-z、A-Z
 * 
 * @param c
 *            被驗證的char
 * @return true代表符合條件
 */
public static boolean isRightChar(char c) {
    return isChinese(c) || isWord(c);
}

/**
 * 校驗某個字符是否是a-z、A-Z、_、0-9
 * 
 * @param c
 *            被校驗的字符
 * @return true代表符合條件
 */
public static boolean isWord(char c) {
    String regEx = "[\\w]";
    Pattern p = Pattern.compile(regEx);
    Matcher m = p.matcher("" + c);
    return m.matches();
}

/**
 * 判定輸入的是否是漢字
 * 
 * @param c
 *            被校驗的字符
 * @return true代表是漢字
 */
public static boolean isChinese(char c) {
    Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
    if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
            || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
            || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
            || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
        return true;
    }
    return false;
}

/**
 * 校驗String是否全是中文
 * 
 * @param name
 *            被校驗的字符串
 * @return true代表全是漢字
 */
public static boolean checkNameChese(String name) {
    boolean res = true;
    char[] cTemp = name.toCharArray();
    for (int i = 0; i < name.length(); i++) {
        if (!isChinese(cTemp[i])) {
            res = false;
            break;
        }
    }
    return res;
}

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM