在開發中我們難免會遇到需要提出漢字中的拼音的首字母、提出漢字的拼音,接着便介紹一個工具類 pinyin4j.jar,首先需要下載 jar 包。
Pinyin4j是一個功能強悍的漢語拼音工具包,是sourceforge.net上的一個開源項目。
主要的功能有:
- 支持同一漢字有多個發音
- 支持拼音的格式化輸出,比如第幾聲之類的
- 支持簡體中文、繁體中文轉換為拼音
末尾有一個 cleanChar() 方法,目的是為了清除字符串中所有的特殊字符,避免字符的出現會中斷拼音的輸出導致報錯,簡而言之,清楚漢字和英文以外的所有字符(當然沒有寫完所有的字符,只是寫了部分常用的,歡迎各位提出以更簡潔的方法替換這些字符)
具體方法如下:
1 package com.jd.ddkdy.util; 2 3 import java.util.regex.Matcher; 4 import java.util.regex.Pattern; 5 6 import net.sourceforge.pinyin4j.PinyinHelper; 7 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 8 import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 9 import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 10 import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; 11 import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 12 13 /** 14 * 字符串轉換為拼音工具類 15 * 16 * @projectName: PinyinDome 17 */ 18 public class PinyinUtils { 19 20 /** 21 * 獲得漢語拼音首字母 22 * 23 * @param chines 24 * 漢字 25 * @return 26 */ 27 public static String getAlpha(String chines) { 28 chines = cleanChar(chines); 29 String pinyinName = ""; 30 char[] nameChar = chines.toCharArray(); 31 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 32 defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); 33 defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 34 for (int i = 0; i < nameChar.length; i++) { 35 if (nameChar[i] > 128) { 36 try { 37 pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0); 38 } catch (BadHanyuPinyinOutputFormatCombination e) { 39 e.printStackTrace(); 40 } 41 } else { 42 pinyinName += nameChar[i]; 43 } 44 } 45 return pinyinName; 46 } 47 48 /** 49 * 將字符串中的中文轉化為拼音,英文字符不變 50 * 51 * @param inputString 52 * 漢字 53 * @return 54 */ 55 public static String getPingYin(String inputString) { 56 inputString = cleanChar(inputString); 57 HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); 58 format.setCaseType(HanyuPinyinCaseType.LOWERCASE); 59 format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 60 format.setVCharType(HanyuPinyinVCharType.WITH_V); 61 String output = ""; 62 if (inputString != null && inputString.length() > 0 && !"null".equals(inputString)) { 63 char[] input = inputString.trim().toCharArray(); 64 try { 65 for (int i = 0; i < input.length; i++) { 66 if (java.lang.Character.toString(input[i]).matches("[\\u4E00-\\u9FA5]+")) { 67 String[] temp = PinyinHelper.toHanyuPinyinStringArray(input[i], format); 68 output += temp[0]; 69 } else 70 output += java.lang.Character.toString(input[i]); 71 } 72 } catch (BadHanyuPinyinOutputFormatCombination e) { 73 e.printStackTrace(); 74 } 75 } else { 76 return "*"; 77 } 78 return output; 79 } 80 81 /** 82 * 漢字轉換位漢語拼音首字母,英文字符不變 83 * 84 * @param chines 85 * 漢字 86 * @return 拼音 87 */ 88 public static String converterToFirstSpell(String chines) { 89 chines = cleanChar(chines); 90 String pinyinName = ""; 91 char[] nameChar = chines.toCharArray(); 92 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 93 defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); 94 defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 95 for (int i = 0; i < nameChar.length; i++) { 96 if (nameChar[i] > 128) { 97 try { 98 pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0); 99 } catch (BadHanyuPinyinOutputFormatCombination e) { 100 e.printStackTrace(); 101 } 102 } else { 103 pinyinName += nameChar[i]; 104 } 105 } 106 return pinyinName; 107 } 108 109 /** 110 * 清理特殊字符以便得到 111 * @param chines 112 * @return 113 */ 114 public static String cleanChar(String chines) { 115 chines = chines.replaceAll("[\\p{Punct}\\p{Space}]+", ""); // 正則去掉所有字符操作 116 // 正則表達式去掉所有中文的特殊符號 117 String regEx = "[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}<>《》【】‘;:”“’。,、?]"; 118 Pattern pattern = Pattern.compile(regEx); 119 Matcher matcher = pattern.matcher(chines); 120 chines = matcher.replaceAll("").trim(); 121 return chines; 122 } 123 124 }