java判斷字符串中是否包含中文 過濾中文


package com.test;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {
    @org.junit.Test
    public void test(){
        String fileName = "test,中文";
        System.out.println(filterChinese(fileName));
    }

    /**
     * 判斷字符串中是否包含中文
     * @param str
     * 待校驗字符串
     * @return 是否為中文
     * @warn 不能校驗是否為中文標點符號
     */
    public static boolean isContainChinese(String str) {
        Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
        Matcher m = p.matcher(str);
        if (m.find()) {
            return true;
        }
        return false;
    }

    /**
     * 過濾掉中文
     * @param str 待過濾中文的字符串
     * @return 過濾掉中文后字符串
     */
    public static String filterChinese(String str) {
        // 用於返回結果
        String result = str;
        boolean flag = isContainChinese(str);
        if (flag) {// 包含中文
            // 用於拼接過濾中文后的字符
            StringBuffer sb = new StringBuffer();
            // 用於校驗是否為中文
            boolean flag2 = false;
            // 用於臨時存儲單字符
            char chinese = 0;
            // 5.去除掉文件名中的中文
            // 將字符串轉換成char[]
            char[] charArray = str.toCharArray();
            // 過濾到中文及中文字符
            for (int i = 0; i < charArray.length; i++) {
                chinese = charArray[i];
                flag2 = isChinese(chinese);
                if (!flag2) {// 不是中日韓文字及標點符號
                    sb.append(chinese);
                }
            }
            result = sb.toString();
        }
        return result;
    }


    /**
     * 校驗一個字符是否是漢字
     *
     * @param c
     *  被校驗的字符
     * @return true代表是漢字
     */
    public static boolean isChineseChar(char c) {
        try {
            return String.valueOf(c).getBytes("UTF-8").length > 1;
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }
    }

    /**
     * 驗證字符串內容是否包含下列非法字符<br>
     * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
     *
     * @param content
     *  字符串內容
     * @return 't'代表不包含非法字符,otherwise代表包含非法字符。
     */
    public static char validateLegalString(String content) {
        String illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
        char isLegalChar = 't';
        L1: for (int i = 0; i < content.length(); i++) {
            for (int j = 0; j < illegal.length(); j++) {
                if (content.charAt(i) == illegal.charAt(j)) {
                    isLegalChar = content.charAt(i);
                    break L1;
                }
            }
        }
        return isLegalChar;
    }

    /**
     * 驗證是否是漢字或者0-9、a-z、A-Z
     *
     * @param c
     *  被驗證的char
     * @return true代表符合條件
     */
    public static boolean isRightChar(char c) {
        return isChinese(c) || isWord(c);
    }

    /**
     * 校驗某個字符是否是a-z、A-Z、_、0-9
     *
     * @param c
     *  被校驗的字符
     * @return true代表符合條件
     */
    public static boolean isWord(char c) {
        String regEx = "[\\w]";
        Pattern p = Pattern.compile(regEx);
        Matcher m = p.matcher("" + c);
        return m.matches();
    }

    /**
     * 判定輸入的是否是漢字
     *
     * @param c
     *  被校驗的字符
     * @return true代表是漢字
     */
    public static boolean isChinese(char c) {
        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
        if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
                || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
                || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
                || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
                || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
                || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
            return true;
        }
        return false;
    }

    /**
     * 校驗String是否全是中文
     *
     * @param name
     *  被校驗的字符串
     * @return true代表全是漢字
     */
    public static boolean checkNameChese(String name) {
        boolean res = true;
        char[] cTemp = name.toCharArray();
        for (int i = 0; i < name.length(); i++) {
            if (!isChinese(cTemp[i])) {
                res = false;
                break;
            }
        }
        return res;
    }
}

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM