java判斷字符串是否中文、日文

本文轉載自查看原文 2019-08-13 17:57 1100 編解碼

　　直接上代碼：

import java.io.UnsupportedEncodingException;

public class StringUtil {

    /**
     * 去掉字符串中的標點符號、空格和數字
     *
     * @param input
     * @return
     */
    public static String removePunctuation(String input) {
        return input.replaceAll(" +", "").replaceAll("[\\pP\\p{Punct}]", "").replaceAll("\\d+", "");
    }

    /**
     * 判斷字符串是否為中文
     *
     * @param input
     * @return
     */
    public static boolean isChinese(String input) {
        return input.matches("^[\u4e00-\u9fa5]+$");
    }

    /**
     * 判斷字符串是否為日文
     *
     * @param input
     * @return
     */
    public static boolean isJapanese(String input) {
        try {
            return input.getBytes("shift-jis").length >= (2 * input.length());
        } catch (UnsupportedEncodingException e) {
            return false;
        }
    }

    /**
     * 將字符串轉字碼點
     *
     * @param input
     * @return
     */
    public static String stringToUnicode(String input) throws UnsupportedEncodingException {
        StringBuffer out = new StringBuffer();
        byte[] bytes = input.getBytes("unicode");

        //將其byte轉換成對應的16進制表示
        for (int i = 0; i < bytes.length - 1; i += 2) {
            out.append("\\u");
            String str = Integer.toHexString(bytes[i + 1] & 0xff);
            for (int j = str.length(); j < 2; j++) {
                out.append("0");
            }
            String str1 = Integer.toHexString(bytes[i] & 0xff);
            out.append(str1);
            out.append(str);
        }
        return out.toString();
    }

    /**
     * 字碼點轉字符串
     *
     * @param unicode
     * @return
     */
    public static String unicodeToString(String unicode) {
        StringBuffer sb = new StringBuffer();
        String[] hex = unicode.split("\\\\u");
        for (int i = 1; i < hex.length; i++) {
            int index = Integer.parseInt(hex[i], 16);
            sb.append((char) index);
        }
        return sb.toString();
    }

    public static void main(String[] args) throws UnsupportedEncodingException {
        String ss = "中華人民共和國";
        String ss1 = "おはよう";
        System.out.println(ss + " shift-jis編碼字符數：" + ss.getBytes("shift-jis").length);
        System.out.println(ss + " 2倍字符數：" + ss.length() * 2);
        System.out.println(ss1 + "shift-jis編碼字符數：" + ss1.getBytes("shift-jis").length);
        System.out.println(ss1 + " 2倍字符數：" + ss1.length() * 2);
        System.out.println(ss + " 字碼點：" + stringToUnicode(ss));
        System.out.println(ss1 + " 字碼點：" + stringToUnicode(ss1));
        System.out.println("\\u4e00 -\\u9fa5" + "對應的中文是：" + unicodeToString("\\u4e00") + " - " + unicodeToString("\\u9fa5"));

        String s = "中華人民共和國，成立了~~~";
        String s1 = "1個和尚挑水喝， 2個和尚抬水喝， 3個和尚沒呀沒水喝";
        String s2 = "あなたのお父さんとお母さんは大阪に行って、あなたのおじいさんとお婆さんはみんな東京に行って、あなたの弟の妹は北海道に行きました。";
        String s3 = "1お、 2は、 3よ、 4う,呵呵";
        System.out.println("開始測試：");
        System.out.println(s + (isChinese(removePunctuation(s)) ? "是" : "不是") + "中文");
        System.out.println(s1 + (isChinese(removePunctuation(s1)) ? "是" : "不是") + "中文");
        System.out.println(s2 + (isJapanese(removePunctuation(s2)) ? "是" : "不是") + "日文");
        System.out.println(s3 + (isJapanese(removePunctuation(s3)) ? "是" : "不是") + "日文");
    }
}

　　輸出：

中華人民共和國 shift-jis編碼字符數：13
中華人民共和國 2倍字符數：14
おはようshift-jis編碼字符數：8
おはよう 2倍字符數：8
中華人民共和國 字碼點：\ufeff\u4e2d\u534e\u4eba\u6c11\u5171\u548c\u56fd
おはよう 字碼點：\ufeff\u304a\u306f\u3088\u3046
\u4e00 -\u9fa5對應的中文是：一 - 龥
開始測試：
中華人民共和國，成立了~~~是中文
1個和尚挑水喝， 2個和尚抬水喝， 3個和尚沒呀沒水喝是中文
あなたのお父さんとお母さんは大阪に行って、あなたのおじいさんとお婆さんはみんな東京に行って、あなたの弟の妹は北海道に行きました。是日文
1お、 2は、 3よ、 4う,呵呵是日文

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SQL SERVER 判斷字符串包含中文或日文 JS/Java中，判斷字符串是否包含中文 java判斷字符串是否為數字或中文或字母 java判斷字符串中是否含有中文 Java 判斷字符串中文是否為亂碼 java判斷字符串是否為數字或中文或字母 java判斷字符串String中是否存在中文 Android中判斷字符是否為中文、韓文、日文 java判斷字符串是否為數字 Java判斷字符串是否是數值