欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java計算兩個漢字相似度的實現(xiàn)方法

 更新時間:2023年11月01日 11:10:22   作者:老馬嘯西風  
有時候我們希望計算兩個漢字的相似度,比如文本的 OCR 等場景,用于識別糾正,本文給大家詳細介紹了Java計算兩個漢字相似度的實現(xiàn)方法,文中有詳細的實現(xiàn)代碼,需要的朋友可以參考下

計算漢字相似度

情景

有時候我們希望計算兩個漢字的相似度,比如文本的 OCR 等場景。用于識別糾正。

實現(xiàn)

引入 maven

<dependency>
    <groupId>com.github.houbb</groupId>
    <artifactId>nlp-hanzi-similar</artifactId>
    <version>1.3.0</version>
</dependency>

java 實現(xiàn)

double rate1 = HanziSimilarHelper.similar('末', '未');

返回對應(yīng)的相似度:

0.9629629629629629

返回一個漢字的相似列表

情景

找到相似的漢字,有很多有趣的場景。

實現(xiàn)

List<String> list = HanziSimilarHelper.similarList('愛');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

開源地址

為了便于大家學(xué)習(xí),上述代碼已開源

https://github.com/houbb/nlp-hanzi-similar

在線體驗

在線體驗

到此這篇關(guān)于Java計算兩個漢字相似度的實現(xiàn)方法的文章就介紹到這了,更多相關(guān)Java計算兩個漢字相似度內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論