python?字符串模糊匹配Fuzzywuzzy的實(shí)現(xiàn)
Python提供fuzzywuzzy模塊,不僅可用于計(jì)算兩個(gè)字符串之間的相似度,而且還提供排序接口能從大量候選集中找到最相似的句子。
(1)安裝
pip install fuzzywuzzy
(2)接口說(shuō)明
兩個(gè)模塊:fuzz, process,fuzz主要用于兩字符串之間匹配,process主要用于搜索排序。
- fuzz.ratio(s1,s2)直接計(jì)算s1和s2之間的相似度,返回值為0-100,100表示完全相同;
- fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;
- fuzz.token_sort_ratio(S1,S2)只比較S1,S2單詞是否相同,不考慮詞語(yǔ)之間的順序;
- fuzz.token_set_ratio(S1,S2)相比f(wàn)uzz.token_sort_ratio不考慮詞語(yǔ)出現(xiàn)的次數(shù);
- process.extract(S1, ListS,limit=n),表示從列表ListS中找出Top n與S1最相似的句子;
- process.extractOne(S1,ListS),返回最相似的一個(gè)
(3)使用
from fuzzywuzzy import fuzz a = 'a b c' b = ' a c b ' c = 'a c' fuzz.ratio(a, c) ? ? >> 75 fuzz.ratio(b, c) ?? ?>> 60 ?? ? fuzz.partial_ratio(a, c) ?? ?>> 67 fuzz.partial_ratio(b, c) ?? ?>> 100?? ? ?? ? fuzz.token_sort_ratio(a, c) ?? ?>> 75 fuzz.token_sort_ratio(b, c) ?? ?>> 75?? ? fuzz.token_set_ratio(a, c) ?? ?>> 100 fuzz.token_set_ratio(b, c) ?? ?>> 100
到此這篇關(guān)于python 字符串模糊匹配Fuzzywuzzy的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python 字符串模糊匹配內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
用python介紹4種常用的單鏈表翻轉(zhuǎn)的方法小結(jié)
這篇文章主要介紹了用python介紹4種常用的單鏈表翻轉(zhuǎn)的方法小結(jié),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-02-02python常用庫(kù)之NumPy和sklearn入門(mén)
這篇文章主要介紹了python常用庫(kù)之NumPy和sklearn入門(mén),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07python 將數(shù)據(jù)保存為excel的xls格式(實(shí)例講解)
下面小編就為大家分享一篇python 將數(shù)據(jù)保存為excel的xls格式(實(shí)例講解),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05python使用正則表達(dá)式的search()函數(shù)實(shí)現(xiàn)指定位置搜索功能
SEARCH函數(shù),函數(shù)名。主要用來(lái)返回指定的字符串在原始字符串中首次出現(xiàn)的位置 ,從左到右查找,忽略英文字母的大小寫(xiě)。接下來(lái)通過(guò)本文給大家介紹python使用正則表達(dá)式的search()函數(shù)實(shí)現(xiàn)指定位置搜索功能,需要的朋友一起看看吧2017-11-11使用Python實(shí)現(xiàn)一個(gè)強(qiáng)大的文件系統(tǒng)結(jié)構(gòu)創(chuàng)建器
這篇文章主要為大家詳細(xì)介紹了一個(gè)基于?wxPython?的文件系統(tǒng)結(jié)構(gòu)創(chuàng)建器程序,展示如何通過(guò)?CustomTreeCtrl?組件實(shí)現(xiàn)文件夾和文件的可視化管理,感興趣的可以了解下2025-05-05