快捷導(dǎo)航

python中similarity函數(shù)實(shí)例用法

更新時(shí)間：2021年10月20日 08:34:06 作者：小妮淺淺

在本篇文章里小編給大家整理的是一篇關(guān)于python中similarity函數(shù)實(shí)例用法，有興趣的朋友們可以跟著學(xué)習(xí)下。

1、similarity函數(shù)接收兩個(gè)列表，并返回由兩個(gè)列表中相同元素組成的列表。

2、函數(shù)使用列表推導(dǎo)，遍歷所有a列表中的元素，并使用in關(guān)鍵詞來(lái)判斷這些元素是否存在于b列表中。

實(shí)例

def similarity(a, b):
  return [item for item in a if item in b]
 
# EXAMPLES
similarity([1, 2, 3], [1, 2, 4]) # [1, 2]

知識(shí)點(diǎn)擴(kuò)充：

python 語(yǔ)義similarity_Python：string的語(yǔ)義相似度得分

Python：string的語(yǔ)義相似度得分

有沒(méi)有用于計(jì)算一對(duì)句子的語(yǔ)義相似度分?jǐn)?shù)的庫(kù)？

我知道WordNet的語(yǔ)義數(shù)據(jù)庫(kù)，以及如何為2個(gè)單詞生成分?jǐn)?shù)，但是我正在尋找能夠在整個(gè)句子和輸出中執(zhí)行所有預(yù)處理任務(wù)(如端口詞干，停用詞刪除等)的庫(kù)兩個(gè)句子如何相關(guān)的分?jǐn)?shù)。

我發(fā)現(xiàn)了一個(gè)使用.NET框架編寫(xiě)的工作，它使用一系列預(yù)處理步驟來(lái)計(jì)算分?jǐn)?shù)。有沒(méi)有任何項(xiàng)目，在Python中做到這一點(diǎn)？

我不是在尋找能夠幫助我find分?jǐn)?shù)的操作順序(就像這里要求的那樣)

我喜歡自己實(shí)現(xiàn)每個(gè)階段，或者從不同的庫(kù)中粘貼函數(shù)，以便它可以用于句對(duì)，但是我主要需要這個(gè)工具來(lái)testing數(shù)據(jù)的推論。

編輯：我正在考慮使用NLTK和計(jì)算每?jī)蓚€(gè)單詞對(duì)這兩個(gè)句子迭代的得分，然后從結(jié)果的標(biāo)準(zhǔn)偏差中得出推論，但我不知道這是否是一個(gè)合理的相似性估計(jì)。另外，這將花費(fèi)很長(zhǎng)的時(shí)間。

再次，我正在尋找已經(jīng)實(shí)現(xiàn)這個(gè)智能的項(xiàng)目/庫(kù)。東西，讓我這樣做：

import amazing_semsim_package str1='Birthday party ruined as cake explodes' str2='Grandma mistakenly bakes cake using gunpowder' >>similarity(str1,str2) >>0.889

我見(jiàn)過(guò)的最好的包裝是在Gensim主頁(yè)find的Gensim 。我已經(jīng)使用過(guò)很多次了，總體而言非常滿意，它的易用性，它是用Python編寫(xiě)的，并且有一個(gè)簡(jiǎn)單的跟隨教程來(lái)開(kāi)始，它比較了9個(gè)string。它可以通過(guò)點(diǎn)安裝，所以你不會(huì)有很多麻煩得到它安裝，我希望。

你使用哪種評(píng)分algorithm在很大程度上取決于你的問(wèn)題的背景，但是如果你想要一些基本的東西的話，我build議開(kāi)始使用LSI的function。 (這是教程引導(dǎo)你通過(guò)。)

如果您閱讀gensim教程，它將引導(dǎo)您通過(guò)比較兩個(gè)string，使用Similaritiesfunction。這樣可以讓你看到你的叮咬是如何根據(jù)它們所包含的文字相互比較的，或者是一些其他的刺痛。

到此這篇關(guān)于python中similarity函數(shù)實(shí)例用法的文章就介紹到這了,更多相關(guān)python中similarity函數(shù)的使用內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: