快捷導(dǎo)航

使用Python計(jì)算兩個(gè)不同列表的相似度

更新時(shí)間：2023年07月28日 08:51:33 作者：袁袁袁袁滿(mǎn)

這篇文章主要介紹了使用Python計(jì)算兩個(gè)不同列表的相似度,Python數(shù)據(jù)開(kāi)發(fā)工作中的需求兩個(gè)不同列表給出相似度，本文實(shí)現(xiàn)判斷數(shù)字類(lèi)型相似度和字符串類(lèi)型相似度，非常實(shí)用,需要的朋友可以參考下

數(shù)字類(lèi)型相似度

可以使用余弦相似度來(lái)計(jì)算兩個(gè)列表的相似度。

具體步驟如下：

將兩個(gè)列表轉(zhuǎn)化為向量形式，即將列表中的元素作為向量的分量。
計(jì)算向量的點(diǎn)積。
計(jì)算向量的模長(zhǎng)。
計(jì)算余弦值。
將余弦值作為相似度。

Python代碼實(shí)現(xiàn)：

import math
def cosine_similarity(list1, list2):
    dot_product = sum([list1[i]*list2[i] for i in range(len(list1))])
    norm1 = math.sqrt(sum([x**2 for x in list1]))
    norm2 = math.sqrt(sum([x**2 for x in list2]))
    similarity = dot_product / (norm1 * norm2)
    return similarity
# 示例
list1 = [1, 2, 3, 4, 5]
list2 = [3, 4, 5, 6, 7]
similarity = cosine_similarity(list1, list2)
print(similarity)

輸出結(jié)果為：

0.9970544855015815

表示兩個(gè)列表的相似度很高。

字符串類(lèi)型相似度

可以使用Jaccard相似度來(lái)計(jì)算兩個(gè)字符串列表的相似度。

Jaccard相似度是通過(guò)計(jì)算兩個(gè)集合的交集與并集之比來(lái)衡量它們的相似程度。具體步驟如下：

將兩個(gè)列表轉(zhuǎn)化為集合形式，即將列表中的元素作為集合的元素。
計(jì)算兩個(gè)集合的交集。
計(jì)算兩個(gè)集合的并集。
計(jì)算交集與并集之比。
將比值作為相似度。

Python代碼實(shí)現(xiàn)：

def jaccard_similarity(list1, list2):
    set1 = set(list1)
    set2 = set(list2)
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    similarity = intersection / union
    return similarity
# 示例
list1 = ['apple', 'banana', 'orange']
list2 = ['apple', 'pear', 'peach']
similarity = jaccard_similarity(list1, list2)
print(similarity)

輸出結(jié)果為：

0.25

表示兩個(gè)字符串列表的相似度較低。

到此這篇關(guān)于使用Python計(jì)算兩個(gè)不同列表的相似度的文章就介紹到這了,更多相關(guān)Python計(jì)算列表相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

jupyter的安裝與使用以及運(yùn)行卡頓問(wèn)題及解決
這篇文章主要介紹了jupyter的安裝與使用以及運(yùn)行卡頓問(wèn)題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
2024-06-06
pytest自定義命令行參數(shù)的實(shí)現(xiàn)
本文主要介紹了在使用pytest運(yùn)行測(cè)試用例時(shí),通過(guò)傳遞自定義命令行參數(shù)來(lái)啟動(dòng)mitmdump進(jìn)程進(jìn)行抓包,具有一定的參考價(jià)值,感興趣的可以了解一下
2024-12-12
獲取CSDN文章內(nèi)容并轉(zhuǎn)換為markdown文本的python
這篇文章主要介紹了自己寫(xiě)的小工具，可以直接獲取csdn文章并轉(zhuǎn)換為markdown格式,需要的朋友可以參考下
2020-09-09
python 實(shí)現(xiàn)的車(chē)牌識(shí)別項(xiàng)目
這篇文章主要介紹了python 實(shí)現(xiàn)的車(chē)牌識(shí)別項(xiàng)目，幫助大家更好的理解和使用python，感興趣的朋友可以了解下
2021-01-01
Python?GUI實(shí)現(xiàn)PDF轉(zhuǎn)Word功能
這篇文章主要介紹了如何使用?wxPython?創(chuàng)建一個(gè)簡(jiǎn)單的圖形用戶(hù)界面（GUI）應(yīng)用程序,結(jié)合?pdf2docx?庫(kù),實(shí)現(xiàn)將?PDF?轉(zhuǎn)換為?Word?文檔的功能,需要的可以參考下
2024-12-12
使用wxPython和ECharts實(shí)現(xiàn)生成和保存HTML圖表
wxPython是一個(gè)基于wxWidgets的Python?GUI庫(kù)，ECharts是一個(gè)用于數(shù)據(jù)可視化的JavaScript庫(kù)，本文主要為大家介紹了如何使用wxPython和ECharts庫(kù)來(lái)生成和保存HTML圖表，感興趣的可以學(xué)習(xí)一下
2023-08-08
python列表的特點(diǎn)分析
在本篇文章里小編個(gè)大家整理的是一篇關(guān)于python列表的特點(diǎn)分析內(nèi)容總結(jié)，有需要的朋友們可以學(xué)習(xí)下。
2021-08-08
Python tornado上傳文件的功能
這篇文章主要介紹了Python tornado上傳文件的功能，代碼分為普通上傳和ajax上傳，通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2020-03-03
基于Python實(shí)現(xiàn)身份證信息識(shí)別功能
身份證是用于證明個(gè)人身份和身份信息的官方證件,在現(xiàn)代社會(huì)中,身份證被廣泛應(yīng)用于各種場(chǎng)景,如就業(yè)、教育、醫(yī)療、金融等,它包含了個(gè)人的基本信息,本文給大家介紹了如何基于Python實(shí)現(xiàn)身份證信息識(shí)別功能,感興趣的朋友可以參考下
2024-01-01
關(guān)于numpy中np.nonzero()函數(shù)用法的詳解
下面小編就為大家?guī)?lái)一篇關(guān)于numpy中np.nonzero()函數(shù)用法的詳解。小編覺(jué)得挺不錯(cuò)的，現(xiàn)在就分享給大家，也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
2017-02-02