快捷導(dǎo)航

Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法

更新時(shí)間：2023年11月01日 11:10:22 作者：老馬嘯西風(fēng)

有時(shí)候我們希望計(jì)算兩個(gè)漢字的相似度,比如文本的 OCR 等場(chǎng)景,用于識(shí)別糾正,本文給大家詳細(xì)介紹了Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法,文中有詳細(xì)的實(shí)現(xiàn)代碼,需要的朋友可以參考下

計(jì)算漢字相似度

情景

有時(shí)候我們希望計(jì)算兩個(gè)漢字的相似度，比如文本的 OCR 等場(chǎng)景。用于識(shí)別糾正。

實(shí)現(xiàn)

引入 maven

<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>nlp-hanzi-similar</artifactId>
    <version>1.3.0</version>
</dependency>

java 實(shí)現(xiàn)

double rate1 = HanziSimilarHelper.similar('末', '未');

返回對(duì)應(yīng)的相似度：

0.9629629629629629

返回一個(gè)漢字的相似列表

情景

找到相似的漢字，有很多有趣的場(chǎng)景。

實(shí)現(xiàn)

List<String> list = HanziSimilarHelper.similarList('愛');
Assert.assertEquals("[爰, 爯, 受, 爭(zhēng), 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

開源地址

為了便于大家學(xué)習(xí)，上述代碼已開源

https://github.com/houbb/nlp-hanzi-similar

在線體驗(yàn)

到此這篇關(guān)于Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法的文章就介紹到這了,更多相關(guān)Java計(jì)算兩個(gè)漢字相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

Java基礎(chǔ)學(xué)習(xí)之構(gòu)造方法詳解
這篇文章主要為大家詳細(xì)介紹了Java基礎(chǔ)學(xué)習(xí)中構(gòu)造方法的概述及注意事項(xiàng)，文中的示例代碼講解詳細(xì)，對(duì)我們學(xué)習(xí)Java有一定幫助，需要的可以參考一下
2022-08-08
解決mybatis-plus-boot-starter與mybatis-spring-boot-starter的錯(cuò)誤問題
本文主要講述了在使用MyBatis和MyBatis-Plus時(shí)遇到的綁定異常問題,通過排查和總結(jié),作者發(fā)現(xiàn)使用MyBatis-Plus?Boot?Starter可以解決這個(gè)問題,文章詳細(xì)對(duì)比了MyBatis-Plus?Boot?Starter和MyBatis?Spring?Boot?Starter的功能和使用場(chǎng)景
2025-01-01
Spring data JPA只查詢部分字段問題及解決
這篇文章主要介紹了Spring data JPA只查詢部分字段問題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
2024-08-08
java數(shù)組、泛型、集合在多態(tài)中的使用及對(duì)比
本文主要介紹了java數(shù)組、泛型、集合在多態(tài)中的使用及對(duì)比。具有很好的參考價(jià)值，下面跟著小編一起來看下吧
2017-03-03
Java中Map的遍歷方法及性能測(cè)試
這篇文章主要介紹了Java中Map的遍歷方法及性能測(cè)試,本文講解對(duì)HashMap、TreeMap進(jìn)行對(duì)比測(cè)試,給出測(cè)試代碼、測(cè)試結(jié)果和測(cè)試結(jié)論,需要的朋友可以參考下
2015-01-01
Java中定時(shí)任務(wù)的全方位場(chǎng)景實(shí)現(xiàn)思路分析
在開發(fā)過程中,根據(jù)需求和業(yè)務(wù)的不同經(jīng)常會(huì)有很多場(chǎng)景需要用到不同特性的定時(shí)任務(wù),本文將針對(duì)這些場(chǎng)景,提供不同的一個(gè)實(shí)現(xiàn)思路,感興趣的小伙伴快跟隨小編一起學(xué)習(xí)一下吧
2023-12-12
Java8中List轉(zhuǎn)Map(Collectors.toMap) 的技巧分享
在最近的工作開發(fā)之中,慢慢習(xí)慣了很多Java8中的Stream的用法,很方便而且也可以并行的去執(zhí)行這個(gè)流,這篇文章主要給大家介紹了關(guān)于Java8中List轉(zhuǎn)Map(Collectors.toMap) 的相關(guān)資料,需要的朋友可以參考下
2021-07-07
一文搞懂Spring Bean中的作用域和生命周期
Spring作為當(dāng)前Java最流行、最強(qiáng)大的輕量級(jí)框架，受到了程序員的熱烈歡迎。了解Spring?Bean的作用域與生命周期是非常必要的，快跟隨小編一起學(xué)習(xí)學(xué)習(xí)吧
2022-06-06
mybatis 中 foreach collection的用法小結(jié)(三種)
這篇文章主要介紹了mybatis 中 foreach collection的用法小結(jié)(三種),需要的朋友可以參考下
2017-10-10
JAVA實(shí)現(xiàn)遍歷文件夾下的所有文件(遞歸調(diào)用和非遞歸調(diào)用)
本篇文章主要介紹了JAVA 遍歷文件夾下的所有文件(遞歸調(diào)用和非遞歸調(diào)用) ，具有一定的參考價(jià)值，有興趣的可以了解一下。
2017-01-01