欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法

 更新時(shí)間:2023年11月01日 11:10:22   作者:老馬嘯西風(fēng)  
有時(shí)候我們希望計(jì)算兩個(gè)漢字的相似度,比如文本的 OCR 等場(chǎng)景,用于識(shí)別糾正,本文給大家詳細(xì)介紹了Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法,文中有詳細(xì)的實(shí)現(xiàn)代碼,需要的朋友可以參考下

計(jì)算漢字相似度

情景

有時(shí)候我們希望計(jì)算兩個(gè)漢字的相似度,比如文本的 OCR 等場(chǎng)景。用于識(shí)別糾正。

實(shí)現(xiàn)

引入 maven

<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>nlp-hanzi-similar</artifactId>
    <version>1.3.0</version>
</dependency>

java 實(shí)現(xiàn)

double rate1 = HanziSimilarHelper.similar('末', '未');

返回對(duì)應(yīng)的相似度:

0.9629629629629629

返回一個(gè)漢字的相似列表

情景

找到相似的漢字,有很多有趣的場(chǎng)景。

實(shí)現(xiàn)

List<String> list = HanziSimilarHelper.similarList('愛');
Assert.assertEquals("[爰, 爯, 受, 爭(zhēng), 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

開源地址

為了便于大家學(xué)習(xí),上述代碼已開源

https://github.com/houbb/nlp-hanzi-similar

在線體驗(yàn)

在線體驗(yàn)

到此這篇關(guān)于Java計(jì)算兩個(gè)漢字相似度的實(shí)現(xiàn)方法的文章就介紹到這了,更多相關(guān)Java計(jì)算兩個(gè)漢字相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論