JAVA中漢字轉拼音的方法並不復雜,可以使用pinyin4j包來實現。
一、下載pinyin4j的架包,並導入項目中,如下:
如果是maven項目,maven依賴如下:
1 <dependency> 2 <groupId>com.belerweb</groupId> 3 <artifactId>pinyin4j</artifactId> 4 <version>2.5.0</version> 5 </dependency>
二、漢字轉拼音方法,附上代碼例子,如下:
1 public class PinyinUtil { 2 3 public static void main(String[] args) throws Exception { 4 System.out.println(getPinyin("haha你笑起來真好看", " ")); 5 System.out.println(getPinyinInitials("你笑起來真好看")); 6 } 7 8 /** 9 * 將漢字轉換為全拼 10 * 11 * @param text 文本 12 * @param separator 分隔符 13 * @return {@link String} 14 */ 15 public static String getPinyin(String text, String separator) { 16 char[] chars = text.toCharArray(); 17 HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); 18 // 設置大小寫 19 format.setCaseType(HanyuPinyinCaseType.LOWERCASE); 20 // 設置聲調表示方法 21 format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 22 // 設置字母u表示方法 23 format.setVCharType(HanyuPinyinVCharType.WITH_V); 24 String[] s; 25 String rs = StringUtils.EMPTY; 26 try { 27 StringBuilder sb = new StringBuilder(); 28 for (int i = 0; i < chars.length; i++) { 29 // 判斷是否為漢字字符 30 if (String.valueOf(chars[i]).matches("[\\u4E00-\\u9FA5]+")) { 31 s = PinyinHelper.toHanyuPinyinStringArray(chars[i], format); 32 if (s != null) { 33 sb.append(s[0]).append(separator); 34 continue; 35 } 36 } 37 sb.append(String.valueOf(chars[i])); 38 if ((i + 1 >= chars.length) || String.valueOf(chars[i + 1]).matches("[\\u4E00-\\u9FA5]+")) { 39 sb.append(separator); 40 } 41 } 42 rs = sb.substring(0, sb.length() - 1); 43 } catch (BadHanyuPinyinOutputFormatCombination e) { 44 e.printStackTrace(); 45 } 46 return rs; 47 } 48 49 /** 50 * 獲取漢字首字母 51 * 52 * @param text 文本 53 * @return {@link String} 54 */ 55 public static String getPinyinInitials(String text) { 56 StringBuilder sb = new StringBuilder(); 57 for (int i = 0; i < text.length(); i++) { 58 char ch = text.charAt(i); 59 String[] s = PinyinHelper.toHanyuPinyinStringArray(ch); 60 if (s != null) { 61 sb.append(s[0].charAt(0)); 62 } else { 63 sb.append(ch); 64 } 65 } 66 return sb.toString(); 67 } 68 }
其中,拼音格式參數說明:
HanyuPinyinCaseType | 設置拼音的大小寫 | LOWERCASE | 小寫 |
UPPERCASE | 大寫 | ||
HanyuPinyinToneType | 設置拼音的音調 | WITH_TONE_NUMBER | 用數字表示音調。如:wo3 |
WITHOUT_TONE | 不表示音調。如:wo | ||
WITH_TONE_MARK | 用符號表示音調。如:wŏ | ||
HanyuPinyinVCharType | 設置拼音的表示方法 | WITH_U_AND_COLON | 用字母u和冒號表示。如:lu: |
WITH_V | 用字母v表示。如:lv | ||
WITH_U_UNICODE | 用Unicode編碼表示。如:lü |
PS:這里有一個注意的點,就是音調和表示方法是配合使用的,所以用符號表示音調的時候,只能使用Unicode編碼的方法顯示,如果設置其他兩種表示方式會報錯。
格式效果:
表示方法 | ||||
WITH_U_AND_COLON | WITH_V | WITH_U_UNICODE | ||
聲調 | WITH_TONE_NUMBER | lu3 | lv | lü3 |
WITHOUT_TONE | lu | lv3 | lü | |
WITH_TONE_MARK | Exception | Exception | lǚ |
三、使用效果如下:
文本:haha你笑起來真好看
全拼:haha ni xiao qi lai zhen hao kan
首字母:nxqlzhk