python?字符串模糊匹配Fuzzywuzzy的實(shí)現(xiàn)
Python提供fuzzywuzzy模塊,不僅可用于計(jì)算兩個(gè)字符串之間的相似度,而且還提供排序接口能從大量候選集中找到最相似的句子。
(1)安裝
pip install fuzzywuzzy
(2)接口說明
兩個(gè)模塊:fuzz, process,fuzz主要用于兩字符串之間匹配,process主要用于搜索排序。
- fuzz.ratio(s1,s2)直接計(jì)算s1和s2之間的相似度,返回值為0-100,100表示完全相同;
- fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;
- fuzz.token_sort_ratio(S1,S2)只比較S1,S2單詞是否相同,不考慮詞語(yǔ)之間的順序;
- fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考慮詞語(yǔ)出現(xiàn)的次數(shù);
- process.extract(S1, ListS,limit=n),表示從列表ListS中找出Top n與S1最相似的句子;
- process.extractOne(S1,ListS),返回最相似的一個(gè)
(3)使用
from fuzzywuzzy import fuzz a = 'a b c' b = ' a c b ' c = 'a c' fuzz.ratio(a, c) ? ? >> 75 fuzz.ratio(b, c) ?? ?>> 60 ?? ? fuzz.partial_ratio(a, c) ?? ?>> 67 fuzz.partial_ratio(b, c) ?? ?>> 100?? ? ?? ? fuzz.token_sort_ratio(a, c) ?? ?>> 75 fuzz.token_sort_ratio(b, c) ?? ?>> 75?? ? fuzz.token_set_ratio(a, c) ?? ?>> 100 fuzz.token_set_ratio(b, c) ?? ?>> 100
到此這篇關(guān)于python 字符串模糊匹配Fuzzywuzzy的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python 字符串模糊匹配內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
科學(xué)計(jì)算與數(shù)據(jù)分析利器Python數(shù)據(jù)分析庫(kù)Scipy使用詳解
Scipy在現(xiàn)代科學(xué)研究和數(shù)據(jù)分析中是一個(gè)不可或缺的庫(kù),它建立在NumPy的基礎(chǔ)上,提供了更多的高級(jí)科學(xué)計(jì)算功能,包括優(yōu)化、信號(hào)處理、統(tǒng)計(jì)分析、插值、線性代數(shù)等,本文將會(huì)學(xué)習(xí)Scipy庫(kù)的各種功能和用法,包括數(shù)學(xué)優(yōu)化、統(tǒng)計(jì)分析、信號(hào)處理和插值等方面2023-11-11如何基于Python實(shí)現(xiàn)word文檔重新排版
這篇文章主要介紹了如何基于Python實(shí)現(xiàn)word文檔重新排版,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-09-09利用Python提取PDF文本的簡(jiǎn)單方法實(shí)例
日常工作中我們經(jīng)常會(huì)用到pdf格式的文件,大多數(shù)情況下是瀏覽或者編輯pdf信息,但有時(shí)候需要提取pdf中的文本,下面這篇文章主要給大家介紹了關(guān)于利用Python提取PDF文本的簡(jiǎn)單方法,需要的朋友可以參考下2022-07-07python代碼實(shí)現(xiàn)學(xué)生信息管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python代碼實(shí)現(xiàn)學(xué)生信息管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-05-05Python線程之同步機(jī)制實(shí)際應(yīng)用場(chǎng)景舉例說明
這篇文章主要給大家分享的是Python線程之同步機(jī)制實(shí)際應(yīng)用場(chǎng)景舉例說明,銀行轉(zhuǎn)賬小栗子供大家參考學(xué)習(xí),希望對(duì)你有一定的幫助2022-02-02Python實(shí)現(xiàn)端口復(fù)用實(shí)例代碼
這篇文章主要介紹了Python實(shí)現(xiàn)端口復(fù)用實(shí)例代碼,需要的朋友可以參考下2014-07-07Python正則表達(dá)式?r'(.*)?are?(.*?)?.*'的深入理解
日常的開發(fā)工作中經(jīng)常會(huì)有處理字符串的需求,簡(jiǎn)單的字符串處理,我們使用python內(nèi)置的字符串處理函數(shù)就可以了,但是復(fù)雜的字符串匹配就需要借助正則表達(dá)式了,這篇文章主要給大家介紹了關(guān)于Python正則表達(dá)式?r‘(.*)?are?(.*?)?.*‘的相關(guān)資料,需要的朋友可以參考下2022-07-07pytorch?cuda安裝報(bào)錯(cuò)的解決方法
這篇文章主要給大家介紹了關(guān)于pytorch?cuda安裝報(bào)錯(cuò)的解決方法,文中通過圖文介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Pytorch具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2023-01-01