Java 判斷字符串中是否包含中文的實例詳解
Java 判斷字符串中是否包含中文的實例詳解
Java判斷一個字符串是否有中文是利用Unicode編碼來判斷,因為中文的編碼區(qū)間為:0x4e00--0x9fbb, 不過通用區(qū)間來判斷中文也不非常精確,因為有些中文的標點符號利用區(qū)間判斷會得到錯誤的結果。而且利用區(qū)間判斷中文效率也并不高,例如:str.substring(i, i + 1).matches("[\\一-\\?]+"),就需要遍歷整個字符串,如果字符串太長效率非常低,而且判斷標點還會錯誤。這里提高 一個高效準確的判斷方法,使用Java中的Character類:
實例代碼:
package test; import static java.lang.Character.UnicodeBlock.*; import com.google.common.base.Strings; public class CheckContainChinese { public static void main(String[] args) { String containChinese = "test,我有中文"; String containNoChiese = "test, i don't contain chinese"; System.out.println("containChinese 是否包含中文 :" + checkStringContainChinese(containChinese)); System.out.println("containNoChiese 是否包含中文 :" + checkStringContainChinese(containNoChiese)); } private static boolean checkStringContainChinese(String checkStr){ if(!Strings.isNullOrEmpty(checkStr)){ char[] checkChars = checkStr.toCharArray(); for(int i = 0; i < checkChars.length; i++){ char checkChar = checkChars[i]; if(checkCharContainChinese(checkChar)){ return true; } } } return false; } private static boolean checkCharContainChinese(char checkChar){ Character.UnicodeBlock ub = Character.UnicodeBlock.of(checkChar); if(CJK_UNIFIED_IDEOGRAPHS == ub || CJK_COMPATIBILITY_IDEOGRAPHS == ub || CJK_COMPATIBILITY_FORMS == ub || CJK_RADICALS_SUPPLEMENT == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B == ub){ return true; } return false; } }
運行結果:
以上就是java 檢查字符串是否含有中文的實例,如有疑問請留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
相關文章
Java使用poi-tl1.9.1生成Word文檔的技巧分享
本文將簡單介紹poi-tl的相關知識,通過一個實際的案例實踐,充分介紹如何利用poi-tl進行目標文檔的生成,同時分享幾個不同的office版本如何進行圖表生成的解決方案,需要的朋友可以參考下2023-09-09java synchronized加載加鎖-線程可重入詳解及實例代碼
這篇文章主要介紹了java synchronized加載加鎖-線程可重入詳解及實例代碼的相關資料,需要的朋友可以參考下2017-02-02RabbitMQ的Direct Exchange模式實現(xiàn)的消息發(fā)布案例(示例代碼)
本文介紹了RabbitMQ的DirectExchange模式下的消息發(fā)布和消費的實現(xiàn),詳細說明了如何在DirectExchange模式中進行消息的發(fā)送和接收,以及消息處理的基本方法,感興趣的朋友跟隨小編一起看看吧2024-09-09