Java使用正則表達式(regex)匹配中文實例代碼
只能輸入中文
/**
* 22.驗證漢字
* 表達式 ^[\u4e00-\u9fa5]{0,}$
* 描述 只能漢字
* 匹配的例子 清清月兒
*/
@Test
public void a1() {
Scanner sc = new Scanner(System.in);
String input = sc.nextLine();
String regex = "^[\\u4e00-\\u9fa5]*$";
Matcher m = Pattern.compile(regex).matcher(input);
System.out.println(m.find());
sc.close();
}
PS:下面看下Java中要匹配中文的正則表達式可以有兩種寫法:一是使用unicode中文碼;二是直接使用漢字字符;
例:
(1)String str = "晴";
String regexStr = "[\u4E00-\u9FA5]"; str.regex(regexStr);
(2)String str = "晴";
String regexStr = "[一-龥]"; str.regex(regexStr);
說明:
(1)現(xiàn)在網(wǎng)上大多數(shù)用于判斷中文字符的是 \u4E00-\u9FA5 這個范圍是只是“中日韓統(tǒng)一表意文字”這個區(qū)間,但這不是全部,如果要全部包含,則還要他們的擴展集、部首、象形字、注間字母等等; 具體可以查看unicode中簡體中文編碼
(2) "[一-龥]";是查出的\u4E00-\u9FA5對應(yīng)的中文。具體uniocde2中文進行查詢
以上所述是小編給大家介紹的Java使用正則表達式(regex)匹配中文實例代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
IntelliJ IDEA本地代碼覆蓋后恢復(fù)原來的代碼圖解
今天小編就為大家分享一篇關(guān)于IntelliJ IDEA本地代碼覆蓋后恢復(fù)原來的代碼圖解,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2018-10-10
jmeter設(shè)置全局變量與正則表達式提取器過程圖解
這篇文章主要介紹了jmeter設(shè)置全局變量與正則表達式提取器過程圖解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-10-10
Mybatis實戰(zhàn)教程之入門到精通(經(jīng)典)
MyBatis是支持普通SQL查詢,存儲過程和高級映射的優(yōu)秀持久層框架,通過本文給大家介紹Mybatis實戰(zhàn)教程之入門到精通,對mybatis實戰(zhàn)教程相關(guān)知識感興趣的朋友一起學(xué)習(xí)吧2016-01-01

