欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python+fuzzywuzzy計算兩個字符串之間的相似度

 更新時間:2022年09月27日 09:10:44   作者:古明地覺  
fuzzywuzzy?可以計算兩個字符串之間的相似度,它依據(jù)?Levenshtein?Distance?算法來進行計算,該算法又叫?Edit?Distance?算法,感興趣的小伙伴可以跟隨小編一起學習一下

fuzzywuzzy 可以計算兩個字符串之間的相似度,它依據(jù) Levenshtein Distance 算法來進行計算。該算法又叫 Edit Distance 算法,是指兩個字符串之間,由一個轉(zhuǎn)成另一個所需要的最少編輯操作次數(shù)。許可的編輯操作包括將一個字符替換成另一個字符,插入一個字符,刪除一個字符。一般來說,編輯距離越小,兩個串的相似度越高。

我們來看一下該模塊的用法,非常簡單:

from?fuzzywuzzy?import?fuzz

#?調(diào)用?fuzz.ratio?即可計算兩個字符串的相似度
print(
????fuzz.ratio("古明地覺",?"古明地戀")
)??#?75

#?我們看到?ratio?是完全匹配的
#?它把字符串的長度也考慮在內(nèi)了
print(
????fuzz.ratio("古明地覺",?"古明地覺aa")
)??#?80

#?partial_ratio是非完全匹配
#?如果一方結(jié)束了,那么剩下的就不考慮了
print(
????fuzz.partial_ratio("古明地覺",?"古明地覺,小五蘿莉")
)??#?100

#?token_sort_ratio表示忽略順序匹配
#?但前提是多個詞,以空格進行分隔
print(
????fuzz.ratio("古?明?地?覺",?"古?明?地?覺"[::?-1])
)??#?25
print(
????fuzz.token_sort_ratio("古?明?地?覺",?"古?明?地?覺"[::?-1])
)??#?100

#?token_set_ratio表示去重匹配
#?同樣:前提是多個詞,以空格進行分隔
print(fuzz.ratio("a?a?a?he",?"a?he"))??#?67
print(
????fuzz.token_set_ratio("a?a?a?he",?"a?he")
)??#?100

當我們使用 git 的時候,如果命令輸錯了,那么會告訴你此命令不是一個 git 命令,這是理所應當?shù)?。然后重點來了,git 還會提示一些與你輸錯的命令長得非常相似的一些命令。

所以這里面也用到了字符串的相似度原理,找出 git 命令中和你輸錯的命令最相似的幾個,然后進行提示。

如果我們也寫了一個類似的程序,需要用戶通過命令行參數(shù)的方式,那么當用戶輸入了一個不存在的命令時,我們也可以這么做。而實現(xiàn)方法也很簡單,就是將所有的命令和用戶輸錯的命令都計算一個相似度,然后返回相似度最高的 n 個即可。

使用上面的 fuzz 完全可以實現(xiàn),當然 fuzzywuzzy 模塊還提供了一個 extract 函數(shù),可以讓我們更加輕松地做到這一點。

from?fuzzywuzzy?import?process

words?=?["hello?python",?"hello?java",?
?????????"hello?golang",?"hello?php"]
#?會自動和?words?里面的每一個元素進行比較
#?然后按照相似度從高到低排列
print(process.extract("hello?thon",?words))
"""
[('hello?python',?91),?('hello?php',?74),?
?('hello?golang',?73),?('hello?java',?64)]
"""

#?還可以傳入一個?limit?參數(shù)
#?表示只返回前?limit?個,默認為5
print(
????process.extract("hello?thon",?words,?limit=2)
)?
"""
[('hello?python',?91),?
?('hello?php',?74)]
"""

#?返回分數(shù)最高的,此時返回一個元組
print(
????process.extractOne("hello?thon",?words)
)??
"""
('hello?python',?91)
"""

這個模塊使用起來還是比較簡單的,當然核心是字符串相似度的計算原理,這才是重點,有興趣可以去了解一下。

另外使用 fuzzywuzzy 這個模塊的時候,會彈出一個警告:

UserWarning: Using slow pure-python SequenceMatcher. Install python-Levenshtein to remove this warning

提示我們可以通過安裝 python-Levenshtein 得到解決,這是一個用于加速字符串匹配的庫,可提供 4 到 10 倍的加速。當然即使沒有這個庫也是可以的,沒有的話 fuzzywuzzy 底層會使用標準庫 difflib 進行匹配,只是會彈出警告罷了。

到此這篇關(guān)于Python+fuzzywuzzy計算兩個字符串之間的相似度的文章就介紹到這了,更多相關(guān)Python fuzzywuzzy內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • pyqt5實現(xiàn)登錄界面的模板

    pyqt5實現(xiàn)登錄界面的模板

    這篇文章主要為大家詳細介紹了pyqt5登錄界面的實現(xiàn)模板,通過登錄界面打開主界面的實現(xiàn)方式,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-03-03
  • PyCharm添加Anaconda中的虛擬環(huán)境Python解釋器出現(xiàn)Conda?executable?is?not?found錯誤解決

    PyCharm添加Anaconda中的虛擬環(huán)境Python解釋器出現(xiàn)Conda?executable?is?not

    這篇文章主要給大家介紹了關(guān)于PyCharm添加Anaconda中的虛擬環(huán)境Python解釋器出現(xiàn)Conda?executable?is?not?found錯誤的解決辦法,文中通過圖文介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2023-02-02
  • pytorch如何利用ResNet18進行手寫數(shù)字識別

    pytorch如何利用ResNet18進行手寫數(shù)字識別

    這篇文章主要介紹了pytorch如何利用ResNet18進行手寫數(shù)字識別問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-02-02
  • Python腳本實現(xiàn)蝦米網(wǎng)簽到功能

    Python腳本實現(xiàn)蝦米網(wǎng)簽到功能

    這篇文章主要介紹了Python腳本實現(xiàn)蝦米網(wǎng)簽到功能的方法,涉及Python調(diào)用URL模塊實現(xiàn)數(shù)據(jù)傳輸與處理的相關(guān)技巧,需要的朋友可以參考下
    2016-04-04
  • python用pd.read_csv()方法來讀取csv文件的實現(xiàn)

    python用pd.read_csv()方法來讀取csv文件的實現(xiàn)

    本文主要介紹了python用pd.read_csv()方法來讀取csv文件的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2022-06-06
  • spyder快捷鍵與python符號化輸出方式

    spyder快捷鍵與python符號化輸出方式

    這篇文章主要介紹了spyder快捷鍵與python符號化輸出方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-02-02
  • Python實現(xiàn)中一次讀取多個值的方法

    Python實現(xiàn)中一次讀取多個值的方法

    下面小編就為大家分享一篇Python實現(xiàn)中一次讀取多個值的方法,具有很好的參考價值,我對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • Python中正則表達式的用法實例匯總

    Python中正則表達式的用法實例匯總

    這篇文章主要介紹了Python中正則表達式的用法實例匯總,非常實用,需要的朋友可以參考下
    2014-08-08
  • python使用range函數(shù)計算一組數(shù)和的方法

    python使用range函數(shù)計算一組數(shù)和的方法

    這篇文章主要介紹了python使用range函數(shù)計算一組數(shù)和的方法,涉及Python中range函數(shù)的使用技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-05-05
  • python如何利用traceback獲取詳細的異常信息

    python如何利用traceback獲取詳細的異常信息

    異常信息的獲取對于程序的調(diào)試非常重要,可以有助于快速定位有錯誤程序語句的位置。這篇文章主要給大家介紹了關(guān)于python如何利用traceback獲取詳細的異常信息的相關(guān)資料,需要的朋友可以參考下
    2021-06-06

最新評論