Python 支持向量機(jī)分類器的實(shí)現(xiàn)
支持向量機(jī)(Support Vector Machine, SVM)是一類按監(jiān)督學(xué)習(xí)(supervised learning)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器(generalized linear classifier),其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面(maximum-margin hyperplane)
SVM使用鉸鏈損失函數(shù)(hinge loss)計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn)(empirical risk)并在求解系統(tǒng)中加入了正則化項(xiàng)以優(yōu)化結(jié)構(gòu)風(fēng)險(xiǎn)(structural risk),是一個(gè)具有稀疏性和穩(wěn)健性的分類器。SVM可以通過(guò)核方法(kernel method)進(jìn)行非線性分類,是常見的核學(xué)習(xí)(kernel learning)方法之一。
SVM被提出于1964年,在二十世紀(jì)90年代后得到快速發(fā)展并衍生出一系列改進(jìn)和擴(kuò)展算法,在人像識(shí)別、文本分類等模式識(shí)別(pattern recognition)問(wèn)題中有得到應(yīng)用。
import numpy as np
from scipy import io as spio
from matplotlib import pyplot as plt
from sklearn import svm
def SVM():
'''data1——線性分類'''
data1 = spio.loadmat('data1.mat')
X = data1['X']
y = data1['y']
y = np.ravel(y)
plot_data(X, y)
model = svm.SVC(C=1.0, kernel='linear').fit(X, y) # 指定核函數(shù)為線性核函數(shù)
plot_decisionBoundary(X, y, model) # 畫決策邊界
'''data2——非線性分類'''
data2 = spio.loadmat('data2.mat')
X = data2['X']
y = data2['y']
y = np.ravel(y)
plt = plot_data(X, y)
plt.show()
model = svm.SVC(gamma=100).fit(X, y) # gamma為核函數(shù)的系數(shù),值越大擬合的越好
plot_decisionBoundary(X, y, model, class_='notLinear') # 畫決策邊界
# 作圖
def plot_data(X, y):
plt.figure(figsize=(10, 8))
pos = np.where(y == 1) # 找到y(tǒng)=1的位置
neg = np.where(y == 0) # 找到y(tǒng)=0的位置
p1, = plt.plot(np.ravel(X[pos, 0]), np.ravel(X[pos, 1]), 'ro', markersize=8)
p2, = plt.plot(np.ravel(X[neg, 0]), np.ravel(X[neg, 1]), 'g^', markersize=8)
plt.xlabel("X1")
plt.ylabel("X2")
plt.legend([p1, p2], ["y==1", "y==0"])
return plt
# 畫決策邊界
def plot_decisionBoundary(X, y, model, class_='linear'):
plt = plot_data(X, y)
# 線性邊界
if class_ == 'linear':
w = model.coef_
b = model.intercept_
xp = np.linspace(np.min(X[:, 0]), np.max(X[:, 0]), 100)
yp = -(w[0, 0] * xp + b) / w[0, 1]
plt.plot(xp, yp, 'b-', linewidth=2.0)
plt.show()
else: # 非線性邊界
x_1 = np.transpose(np.linspace(np.min(X[:, 0]), np.max(X[:, 0]), 100).reshape(1, -1))
x_2 = np.transpose(np.linspace(np.min(X[:, 1]), np.max(X[:, 1]), 100).reshape(1, -1))
X1, X2 = np.meshgrid(x_1, x_2)
vals = np.zeros(X1.shape)
for i in range(X1.shape[1]):
this_X = np.hstack((X1[:, i].reshape(-1, 1), X2[:, i].reshape(-1, 1)))
vals[:, i] = model.predict(this_X)
plt.contour(X1, X2, vals, [0, 1], color='blue')
plt.show()
if __name__ == "__main__":
SVM()
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
一文教會(huì)你用python連接并簡(jiǎn)單操作SQLserver數(shù)據(jù)庫(kù)
最近要將數(shù)據(jù)寫到數(shù)據(jù)庫(kù)里,學(xué)習(xí)了一下如何用Python來(lái)操作SQLServer數(shù)據(jù)庫(kù),下面這篇文章主要給大家介紹了關(guān)于用python連接并簡(jiǎn)單操作SQLserver數(shù)據(jù)庫(kù)的相關(guān)資料,需要的朋友可以參考下2022-09-09
opencv形態(tài)學(xué)中的孔洞填充詳細(xì)圖解
我們?cè)谶M(jìn)行圖像分割后,分割結(jié)果有時(shí)會(huì)有一些小孔洞,如圖1所示,其中黑白兩色表示兩種不同的類別。一般情況下,這些孔洞屬于錯(cuò)分情況,為了優(yōu)化結(jié)果,我們通常對(duì)這些孔洞進(jìn)行填充。今天我們就用python語(yǔ)言基于OpenCV實(shí)現(xiàn)孔洞填充2022-10-10
Appium自動(dòng)化測(cè)試實(shí)現(xiàn)九宮格解鎖
本文主要介紹了Appium自動(dòng)化測(cè)試實(shí)現(xiàn)九宮格解鎖,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-02-02
解決python繪圖使用subplots出現(xiàn)標(biāo)題重疊的問(wèn)題
這篇文章主要介紹了python繪圖使用subplots出現(xiàn)標(biāo)題重疊的問(wèn)題及解決方法,本文通過(guò)實(shí)例圖文相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-04-04
pandas如何將dataframe中的NaN替換成None
這篇文章主要介紹了pandas如何將dataframe中的NaN替換成None問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08

