Java漢字轉(zhuǎn)拼音類庫(kù)Pinyin4j詳細(xì)使用方法與實(shí)例
漢字轉(zhuǎn)拼音類庫(kù)Pinyin4j一般用法
pinyin4j的使用很方便,一般轉(zhuǎn)換只需要使用PinyinHelper類的靜態(tài)工具方法即可:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉'); //該類還有其他的拼音轉(zhuǎn)換形式,但是基本上用不到,就不介紹了
返回的數(shù)組即是該字符的拼音,如上例就是pinyin[0]=liu2,后面的數(shù)字代表聲調(diào),聲調(diào)為5表示輕讀,無(wú)聲調(diào)。之所謂返回?cái)?shù)組,是因?yàn)楸慌卸ǖ臐h字有可能有多個(gè)讀音。如果輸入的參數(shù)不是漢字,則返回null。
拼音格式化
如果對(duì)于拼音轉(zhuǎn)換后的結(jié)果有一些特定的格式要求目前pinyin4j支持:
聲調(diào)格式化。例如:“劉”字的格式化后為“l(fā)iu2”或“l(fā)iu”或“l(fā)iú”
對(duì)特殊拼音ü的的顯示格式。例如“u:”或“v”或“ü”
大小寫的轉(zhuǎn)換。例如:“l(fā)iu2”或“LIU2”
以上這些格式可以混合使用,下面就來(lái)介紹具體的使用方法,首先需要?jiǎng)?chuàng)建格式化對(duì)象HanyuPinyinOutputFormat,例如:
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
然后分別調(diào)用outputFormat的set方法設(shè)置上述一些格式要求:
設(shè)置聲調(diào)格式:
outputFormat.setToneType(HanyuPinyinToneType);
方法參數(shù)HanyuPinyinToneType有以下常量對(duì)象:
HanyuPinyinToneType.WITH_TONE_NUMBER 用數(shù)字表示聲調(diào),例如:liu2
HanyuPinyinToneType.WITHOUT_TONE 無(wú)聲調(diào)表示,例如:liu
HanyuPinyinToneType.WITH_TONE_MARK 用聲調(diào)符號(hào)表示,例如:liú
設(shè)置特殊拼音ü的顯示格式:
outputFormat.setVCharType(HanyuPinyinVCharType);
方法參數(shù)HanyuPinyinVCharType有以下常量對(duì)象:
HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一個(gè)冒號(hào)表示該拼音,例如:lu:
HanyuPinyinVCharType.WITH_V 以V表示該字符,例如:lv
HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示
設(shè)置大小寫格式
outputFormat.setCaseType(HanyuPinyinCaseType);
HanyuPinyinCaseType.LOWERCASE 轉(zhuǎn)換后以全小寫方式輸出
HanyuPinyinCaseType.UPPERCASE 轉(zhuǎn)換后以全大寫方式輸出
設(shè)置好格式對(duì)象后還是利用上述的工具類方法進(jìn)行拼音轉(zhuǎn)換,只不過(guò)需要將格式化對(duì)象當(dāng)成方法參數(shù)傳入轉(zhuǎn)換方法,告知要轉(zhuǎn)換的格式要求:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉', outputFormat);
但該方法會(huì)有異常拋出,注意處理。
示例
import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class Test { public static void main(String[] args) { import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class Test { public static void main(String[] args) { HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK); outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE); outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); try { System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('劉',outputFormat))); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } } private static String concatPinyinStringArray(String[] pinyinArray) { StringBuffer pinyinStrBuf = new StringBuffer(); if ((null != pinyinArray) && (pinyinArray.length > 0)) { for (int i = 0; i < pinyinArray.length; i++) { pinyinStrBuf.append(pinyinArray[i]); pinyinStrBuf.append(System.getProperty("line.separator")); } } String outputString = pinyinStrBuf.toString(); return outputString; } }
輸出結(jié)果為:LIú
其他
PinyinHelper還有其他的靜態(tài)方法,但示例和講解中使用的方法是常見(jiàn)的拼音格式,因此其他靜態(tài)方法我沒(méi)有調(diào)研其含義。
貌似支持生僻字,我試過(guò)很怪異的字,都可以將其讀音拼寫出來(lái),因此這個(gè)工具包還是很強(qiáng)的。
拼音工具
package cn.itcast.bos.utils; import java.util.Arrays; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class PinYin4jUtils { /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @return */ public static String[] stringToPinyin(String src) { return stringToPinyin(src, false, null); } /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @return */ public static String[] stringToPinyin(String src, String separator) { return stringToPinyin(src, true, separator); } /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @param isPolyphone * 是否查出多音字的所有拼音 * @param separator * 多音字拼音之間的分隔符 * @return */ public static String[] stringToPinyin(String src, boolean isPolyphone, String separator) { // 判斷字符串是否為空 if ("".equals(src) || null == src) { return null; } char[] srcChar = src.toCharArray(); int srcCount = srcChar.length; String[] srcStr = new String[srcCount]; for (int i = 0; i < srcCount; i++) { srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); } return srcStr; } /** * 將單個(gè)字符轉(zhuǎn)換成拼音 * * @param src * @return */ public static String charToPinyin(char src, boolean isPolyphone, String separator) { // 創(chuàng)建漢語(yǔ)拼音處理類 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 輸出設(shè)置,大小寫,音標(biāo)方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); StringBuffer tempPinying = new StringBuffer(); // 如果是中文 if (src > 128) { try { // 轉(zhuǎn)換得出結(jié)果 String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, defaultFormat); // 是否查出多音字,默認(rèn)是查出多音字的第一個(gè)字符 if (isPolyphone && null != separator) { for (int i = 0; i < strs.length; i++) { tempPinying.append(strs[i]); if (strs.length != (i + 1)) { // 多音字之間用特殊符號(hào)間隔起來(lái) tempPinying.append(separator); } } } else { tempPinying.append(strs[0]); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { tempPinying.append(src); } return tempPinying.toString(); } public static String hanziToPinyin(String hanzi) { return hanziToPinyin(hanzi, " "); } /** * 將漢字轉(zhuǎn)換成拼音 * * @param hanzi * @param separator * @return */ public static String hanziToPinyin(String hanzi, String separator) { // 創(chuàng)建漢語(yǔ)拼音處理類 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 輸出設(shè)置,大小寫,音標(biāo)方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); String pinyingStr = ""; try { pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } return pinyingStr; } /** * 將字符串?dāng)?shù)組轉(zhuǎn)換成字符串 * * @param str * @param separator * 各個(gè)字符串之間的分隔符 * @return */ public static String stringArrayToString(String[] str, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < str.length; i++) { sb.append(str[i]); if (str.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 簡(jiǎn)單的將各個(gè)字符數(shù)組之間連接起來(lái) * * @param str * @return */ public static String stringArrayToString(String[] str) { return stringArrayToString(str, ""); } /** * 將字符數(shù)組轉(zhuǎn)換成字符串 * * @param str * @param separator * 各個(gè)字符串之間的分隔符 * @return */ public static String charArrayToString(char[] ch, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < ch.length; i++) { sb.append(ch[i]); if (ch.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 將字符數(shù)組轉(zhuǎn)換成字符串 * * @param str * @return */ public static String charArrayToString(char[] ch) { return charArrayToString(ch, " "); } /** * 取漢字的首字母 * * @param src * @param isCapital * 是否是大寫 * @return */ public static char[] getHeadByChar(char src, boolean isCapital) { // 如果不是漢字直接返回 if (src <= 128) { return new char[] { src }; } // 獲取所有的拼音 String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src); // 創(chuàng)建返回對(duì)象 int polyphoneSize = pinyingStr.length; char[] headChars = new char[polyphoneSize]; int i = 0; // 截取首字符 for (String s : pinyingStr) { char headChar = s.charAt(0); // 首字母是否大寫,默認(rèn)是小寫 if (isCapital) { headChars[i] = Character.toUpperCase(headChar); } else { headChars[i] = headChar; } i++; } return headChars; } /** * 取漢字的首字母(默認(rèn)是大寫) * * @param src * @return */ public static char[] getHeadByChar(char src) { return getHeadByChar(src, true); } /** * 查找字符串首字母 * * @param src * @return */ public static String[] getHeadByString(String src) { return getHeadByString(src, true); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大寫 * @return */ public static String[] getHeadByString(String src, boolean isCapital) { return getHeadByString(src, isCapital, null); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大寫 * @param separator * 分隔符 * @return */ public static String[] getHeadByString(String src, boolean isCapital, String separator) { char[] chars = src.toCharArray(); String[] headString = new String[chars.length]; int i = 0; for (char ch : chars) { char[] chs = getHeadByChar(ch, isCapital); StringBuffer sb = new StringBuffer(); if (null != separator) { int j = 1; for (char ch1 : chs) { sb.append(ch1); if (j != chs.length) { sb.append(separator); } j++; } } else { sb.append(chs[0]); } headString[i] = sb.toString(); i++; } return headString; } public static void main(String[] args) { // pin4j 簡(jiǎn)碼 和 城市編碼 String s1 = "中華人民共和國(guó)"; String[] headArray = getHeadByString(s1); // 獲得每個(gè)漢字拼音首字母 System.out.println(Arrays.toString(headArray)); String s2 ="長(zhǎng)城" ; System.out.println(Arrays.toString(stringToPinyin(s2,true,","))); String s3 ="長(zhǎng)"; System.out.println(Arrays.toString(stringToPinyin(s3,true,","))); } }
更多關(guān)于Java漢字轉(zhuǎn)拼音類庫(kù)Pinyin4j詳細(xì)使用方法與實(shí)例請(qǐng)查看下面的相關(guān)鏈接
- ASP.NET Core使用微軟官方類庫(kù)實(shí)現(xiàn)漢字轉(zhuǎn)拼音
- swift如何利用系統(tǒng)庫(kù)將漢字轉(zhuǎn)換為拼音詳解
- JavaScript實(shí)現(xiàn)漢字轉(zhuǎn)換為拼音的庫(kù)文件示例
- python實(shí)現(xiàn)將漢字轉(zhuǎn)換成漢語(yǔ)拼音的庫(kù)
- asp.net 根據(jù)漢字的拼音首字母搜索數(shù)據(jù)庫(kù)(附 LINQ 調(diào)用方法)
- python munch庫(kù)的使用解析
- 關(guān)于python3安裝pip及requests庫(kù)的導(dǎo)入問(wèn)題
- python使用Streamlit庫(kù)制作Web可視化頁(yè)面
- 教你學(xué)會(huì)通過(guò)python的matplotlib庫(kù)繪圖
- 教你使用Python pypinyin庫(kù)實(shí)現(xiàn)漢字轉(zhuǎn)拼音
相關(guān)文章
使用純java config來(lái)配置spring mvc方式
這篇文章主要介紹了使用純java config來(lái)配置spring mvc方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-11-11面試官:Java中new Object()到底占用幾個(gè)字節(jié)
這篇文章主要介紹了面試官:Java中new Object()到底占用幾個(gè)字節(jié),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-02-02java 實(shí)現(xiàn)漢諾塔詳解及實(shí)現(xiàn)代碼
這篇文章主要介紹了java 實(shí)現(xiàn)漢諾塔詳解及實(shí)現(xiàn)代碼的相關(guān)資料,需要的朋友可以參考下2017-04-04Spring context:component-scan的使用及說(shuō)明
這篇文章主要介紹了Spring context:component-scan的使用及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-09-09spring基礎(chǔ)系列之JavaConfig配置詳解
本篇文章主要介紹了spring基礎(chǔ)系列之JavaConfig配置詳解,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-07-07Spring 自動(dòng)裝配的二義性實(shí)例解析
這篇文章主要介紹了Spring 自動(dòng)裝配的二義性實(shí)例解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-11-11在Spring Boot框架中使用AOP的正確姿勢(shì)
aop是spring的兩大功能模塊之一,功能非常強(qiáng)大,為解耦提供了非常優(yōu)秀的解決方案。下面這篇文章主要給大家介紹了如何在Spring Boot框架中使用AOP的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2018-08-08