欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python機器學習中實現距離和相似性計算詳解

 更新時間:2023年03月08日 08:43:25   作者:吃肉的小饅頭  
這篇文章主要為大家詳細介紹了Python機器學習中實現距離和相似性計算的方法,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下

歐氏距離

也稱歐幾里得距離,是指在m維空間中兩個點之間的真實距離。歐式距離在ML中使用的范圍比較廣,也比較通用,就比如說利用k-Means對二維平面內的數據點進行聚類,對魔都房價的聚類分析(price/m^2 與平均房價)等。

兩個n維向量a

(x11?,x12?.....x1n?)

與 b

(x21?,x22?.....x2n?)

間的歐氏距離

python 實現為:

def EuclideanDistance(x, y):
    import numpy as np
    x = np.array(x)
    y = np.array(y)
    return np.sqrt(np.sum(np.square(x-y)))

這里傳入的參數可以是任意維的,該公式也適應上邊的二維和三維

曼哈頓距離

python 實現為:

def ManhattanDistance(x, y):
    import numpy as np
    x = np.array(x)
    y = np.array(y)
    return np.sum(np.abs(x-y))

切比雪夫距離

切比雪夫距離(Chebyshev Distance)的定義為:max( | x2-x1 | , |y2-y1 | , … ), 切比雪夫距離用的時候數據的維度必須是三個以上

python 實現為:

def ChebyshevDistance(x, y):
    import numpy as np
    x = np.array(x)
    y = np.array(y)
    return np.max(np.abs(x-y))

馬氏距離

有M個樣本向量X1~Xm,協方差矩陣記為S,均值記為向量μ,則其中樣本向量X到u的馬氏距離表示為

python實現:

def MahalanobisDistance(x, y):
    '''
    馬氏居立中的(x,y)與歐幾里得距離的(x,y)不同,歐幾里得距離中的(x,y)指2個樣本,每個樣本的維數為x或y的維數;這里的(x,y)指向量是2維的,樣本個數為x或y的維數,若要計算n維變量間的馬氏距離則需要改變輸入的參數如(x,y,z)為3維變量。
    '''
    import numpy as np
    x = np.array(x)
    y = np.array(y)
    
    X = np.vstack([x,y])
    X_T = X.T
    sigma = np.cov(X)
    sigma_inverse = np.linalg.inv(sigma)
    
    d1=[]
    for i in range(0, X_T.shape[0]):
        for j in range(i+1, X_T.shape[0]):
            delta = X_T[i] - X_T[j]
            d = np.sqrt(np.dot(np.dot(delta,sigma_inverse),delta.T))
            d1.append(d)
        
    return d1

夾角余弦

def moreCos(a,b):
    sum_fenzi = 0.0
    sum_fenmu_1,sum_fenmu_2 = 0,0
    for i in range(len(a)):
        sum_fenzi += a[i]*b[i]
        sum_fenmu_1 += a[i]**2 
        sum_fenmu_2 += b[i]**2 

    return sum_fenzi/( sqrt(sum_fenmu_1) * sqrt(sum_fenmu_2) )

閔可夫斯基距離

當p=1時,就是曼哈頓距離

當p=2時,就是歐氏距離

當p→∞時,就是切比雪夫距離

python實現:

def MinkowskiDistance(x, y, p):
    import math
    import numpy as np
    zipped_coordinate = zip(x, y)
    return math.pow(np.sum([math.pow(np.abs(i[0]-i[1]), p) for i in zipped_coordinate]), 1/p)

漢明距離

兩個等長字符串s1與s2之間的漢明距離定義為將其中一個變?yōu)榱硗庖粋€所需要作的最小替換次數

def hanmingDis(a,b):
    sumnum = 0
    for i in range(len(a)):
        if a[i]!=b[i]:
            sumnum += 1
    return sumnum

杰卡德距離 & 杰卡德相似系數

杰卡德距離,杰卡德距離用兩個集合中不同元素占所有元素的比例來衡量兩個集合的區(qū)分度。

def jiekadeDis(a,b):
    set_a = set(a)
    set_b = set(b)
    dis = float(len( (set_a | set_b) - (set_a & set_b) ) )/ len(set_a | set_b)
    return dis

杰卡德相似系數

兩個集合A和B的交集元素在A,B的并集中所占的比例,稱為兩個集合的杰卡德相似系數,用符號J(A,B)表示。

def jiekadeXSDis(a,b):
    set_a = set(a)
    set_b = set(b)
    dis = float(len(set_a & set_b)  )/ len(set_a | set_b)
    return dis

相關系數 & 相關距離

相關系數

import math

def c_Pearson(x, y):

    x_mean, y_mean = sum(x)/len(x), sum(y)/len(y)
    cov =0.0
    x_pow = 0.0
    y_pow = 0.0
    for i in range(len(x)):
        cov += (x[i]-x_mean) *(y[i] - y_mean)
    for i in range(len(x)):
        x_pow += math.pow(x[i] - x_mean, 2)
    for i in range(len(x)):
        y_pow += math.pow(y[i] - y_mean, 2)
    sumBm = math.sqrt(x_pow * y_pow)
    p = cov / sumBm

    return p

信息熵

衡量分布的混亂程度或分散程度的一種度量.

import numpy as np

data=['a','b','c','a','a','b']
data1=np.array(data)
#計算信息熵的方法
def calc_ent(x):
    """
        calculate shanno ent of x
    """

    x_value_list = set([x[i] for i in range(x.shape[0])])
    ent = 0.0
    for x_value in x_value_list:
        p = float(x[x == x_value].shape[0]) / x.shape[0]
        logp = np.log2(p)
        ent -= p * logp

    return ent

到此這篇關于Python機器學習中實現距離和相似性計算詳解的文章就介紹到這了,更多相關Python距離 相似性計算內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python .py生成.pyd文件并打包.exe 的注意事項說明

    Python .py生成.pyd文件并打包.exe 的注意事項說明

    這篇文章主要介紹了Python .py生成.pyd文件并打包.exe 的注意事項說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • python如何寫try語句

    python如何寫try語句

    在本篇文章里小編給大家整理的是一篇關于python寫try語句的方法相關內容,有興趣的朋友們可以跟著學習參考下。
    2020-07-07
  • Django使用jinja2模板的實現

    Django使用jinja2模板的實現

    本文主要介紹了Django使用jinja2模板的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-02-02
  • python 使用遞歸的方式實現語義圖片分割功能

    python 使用遞歸的方式實現語義圖片分割功能

    這篇文章主要介紹了python 使用遞歸的方式實現語義圖片分割,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-07-07
  • 用Python制作燈光秀短視頻的思路詳解

    用Python制作燈光秀短視頻的思路詳解

    這篇文章主要介紹了用Python制作燈光秀短視頻的思路詳解,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友參考下吧
    2021-04-04
  • Python中raise用法簡單實例(超級詳細,看了無師自通)

    Python中raise用法簡單實例(超級詳細,看了無師自通)

    python中raise語句用于手動觸發(fā)異常,通過raise語句可以在代碼中顯式地引發(fā)異常,從而使程序進入異常處理流程,下面這篇文章主要給大家介紹了關于Python中raise用法的相關資料,需要的朋友可以參考下
    2024-03-03
  • python列表刪除和多重循環(huán)退出原理詳解

    python列表刪除和多重循環(huán)退出原理詳解

    這篇文章主要介紹了python列表刪除和多重循環(huán)退出原理詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-03-03
  • 淺談Python里面None True False之間的區(qū)別

    淺談Python里面None True False之間的區(qū)別

    這篇文章主要介紹了淺談Python里面None True False之間的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • 詳解Python連接oracle的問題記錄與解決

    詳解Python連接oracle的問題記錄與解決

    這篇文章主要為大家詳細介紹了Python連接oracle時會出現的一些問題記錄與解決方法,文中的示例代碼講解詳細,需要的小伙伴可以參考一下
    2023-04-04
  • django rest framework 實現用戶登錄認證詳解

    django rest framework 實現用戶登錄認證詳解

    這篇文章主要介紹了django rest framework 實現用戶登錄認證詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-07-07

最新評論