基于Java編寫emoji表情處理工具類
emoji表情也是使用Unicode編碼的,但UTF8編碼是不支持的。我們?nèi)绻氪鎯?chǔ)emoji到數(shù)據(jù)庫,一般有兩種方法,以mysql為例,將數(shù)據(jù)庫編碼從 utf8 改為 utf8mb4,第二種就是做一個(gè)轉(zhuǎn)換,將emoji表情轉(zhuǎn)換成另一個(gè)字符,所以本文主要來和大家講講如何使用Java實(shí)現(xiàn)處理emoji表情吧
xml
<!-- https://mvnrepository.com/artifact/com.vdurmont/emoji-java --> <dependency> <groupId>com.vdurmont</groupId> <artifactId>emoji-java</artifactId> <version>5.1.1</version> </dependency>
java代碼
import java.io.UnsupportedEncodingException; import java.net.URLDecoder; import java.net.URLEncoder; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.lang.StringUtils; import com.vdurmont.emoji.EmojiParser; /** * emoji表情過濾 * @author madaha * */ public class EmojiFilter { /** * 判斷是否存在Emoji * @author madaha * * @param codePoint * @return */ private static boolean isEmojiCharacter(char codePoint) { return (codePoint == 0x0) || (codePoint == 0x9) || (codePoint == 0xA) || (codePoint == 0xD) || ((codePoint >= 0x20) && (codePoint <= 0xD7FF)) || ((codePoint >= 0xE000) && (codePoint <= 0xFFFD)) || ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF)); } /** * 過濾emoji 或者 其他非文字類型的字符 * @author madaha * * @param source 待過濾字符串 * @return */ public static String filterEmoji(String source) { if (StringUtils.isBlank(source)) { return source; } StringBuilder buf = null; int len = source.length(); for (int i = 0; i < len; i++) { char codePoint = source.charAt(i); if (isEmojiCharacter(codePoint)) { if (buf == null) { buf = new StringBuilder(source.length()); } buf.append(codePoint); } } if (buf == null) { return source; } else { if (buf.length() == len) { buf = null; return source; } else { return buf.toString(); } } } /** * @Description 將字符串中的emoji表情轉(zhuǎn)換成可以在utf-8字符集數(shù)據(jù)庫中保存的格式(表情占4個(gè)字節(jié),需要utf8mb4字符集) * @param str 待轉(zhuǎn)換字符串 * @return 轉(zhuǎn)換后字符串 * @throws UnsupportedEncodingException * exception */ public static String emojiConvert1(String str) throws UnsupportedEncodingException { String patternString = "([\\x{10000}-\\x{10ffff}\ud800-\udfff])"; Pattern pattern = Pattern.compile(patternString); Matcher matcher = pattern.matcher(str); StringBuffer sb = new StringBuffer(); while (matcher.find()) { try { matcher.appendReplacement(sb, "[[" + URLEncoder.encode(matcher.group(1), "UTF-8") + "]]"); } catch (UnsupportedEncodingException e) { System.out.println(e); throw e; } } matcher.appendTail(sb); // System.out.println("emojiConvert " + str + " to " + sb.toString() + ", len:" + sb.length()); return sb.toString(); } /** * @Description 還原utf8數(shù)據(jù)庫中保存的含轉(zhuǎn)換后emoji表情的字符串 * @param str 轉(zhuǎn)換前的字符串 * @return 轉(zhuǎn)換后的字符串 * @throws UnsupportedEncodingException * exception */ public static String emojiRecovery2(String str) throws UnsupportedEncodingException { String patternString = "\\[\\[(.*?)\\]\\]"; Pattern pattern = Pattern.compile(patternString); Matcher matcher = pattern.matcher(str); StringBuffer sb = new StringBuffer(); while (matcher.find()) { try { matcher.appendReplacement(sb, URLDecoder.decode(matcher.group(1), "UTF-8")); } catch (UnsupportedEncodingException e) { System.out.println(e); throw e; } } matcher.appendTail(sb); // System.out.println("emojiRecovery " + str + " to " + sb.toString()); return sb.toString(); } /** * emoji表情處理測試方法 * @author madaha * * @param args */ public static void main(String[] args) { String str = "emoji表情????輸入測試????"; System.out.println("原始字符為:\n" + str); System.out.println("to aliases 之后:\n" + EmojiParser.parseToAliases(str)); str = EmojiParser.parseToAliases(str); System.out.println("還原:\n" + EmojiParser.parseToUnicode(str)); } }
到此這篇關(guān)于基于Java編寫emoji表情處理工具類的文章就介紹到這了,更多相關(guān)Java處理emoji表情內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
java 實(shí)現(xiàn)多個(gè)list 合并成一個(gè)去掉重復(fù)的案例
這篇文章主要介紹了java 實(shí)現(xiàn)多個(gè)list 合并成一個(gè)去掉重復(fù)的案例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-08-08Netty分布式Server啟動(dòng)流程服務(wù)端初始化源碼分析
本章主要講解server啟動(dòng)的關(guān)鍵步驟,?讀者只需要了解server啟動(dòng)的大概邏輯,?知道關(guān)鍵的步驟在哪個(gè)類執(zhí)行即可,?并不需要了解每一步的運(yùn)作機(jī)制,?之后會(huì)對每個(gè)模塊進(jìn)行深度分析2022-03-03Spring、Spring?Boot、Spring?Cloud?的區(qū)別與聯(lián)系分析
Spring、SpringBoot和SpringCloud是Java開發(fā)中常用的框架,分別針對企業(yè)級(jí)應(yīng)用開發(fā)、快速開發(fā)和分布式系統(tǒng),本文介紹Spring、Spring?Boot、Spring?Cloud?的區(qū)別與聯(lián)系,感興趣的朋友一起看看吧2025-03-03javaweb實(shí)戰(zhàn)之商城項(xiàng)目開發(fā)(二)
這篇文章主要針對javaweb商城項(xiàng)目開發(fā)進(jìn)行實(shí)戰(zhàn)演習(xí),利用mybatis創(chuàng)建DAO層,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-02-02Mybatis-Plus支持GBase8s分頁查詢的實(shí)現(xiàn)示例
本文主要介紹了使?Mybatis-Plus?支持?GBase8s?的分頁查詢,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01SpringSecurity導(dǎo)致SpringBoot跨域失效的問題解決
本文主要介紹了SpringSecurity導(dǎo)致SpringBoot跨域失效的問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01java springboot郵箱找回密碼功能的實(shí)現(xiàn)講解
這篇文章主要介紹了java springboot郵箱找回密碼功能的實(shí)現(xiàn)講解,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-01-01SpringBoot框架中Mybatis-plus的簡單使用操作匯總
這篇文章主要介紹了SpringBoot框架中Mybatis-plus的簡單使用,本文通過示例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-02-02mybatis如何獲取剛剛新插入數(shù)據(jù)的主鍵值id
這篇文章主要介紹了mybatis如何獲取剛剛新插入數(shù)據(jù)的主鍵值id問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08