Python實現(xiàn)SVM支持向量機的示例代碼

更新時間：2023年02月06日 08:41:24 作者：夢想橡皮擦

SVM 的目的是在數(shù)據(jù)集中找到一條最佳分隔超平面，使得在這個超平面兩側的數(shù)據(jù)分別屬于不同的類別，且該超平面與最近的數(shù)據(jù)點之間的距離最大。本文將通過Python實現(xiàn)SVM支持向量機，感興趣的可以了解一下

什么是支持向量機

支持向量機（SVM），SVM 的目的是在數(shù)據(jù)集中找到一條最佳分隔超平面，使得在這個超平面兩側的數(shù)據(jù)分別屬于不同的類別，且該超平面與最近的數(shù)據(jù)點之間的距離最大。

這些最近的數(shù)據(jù)點稱為支持向量，因此該模型被稱為支持向量機。

SVM 可以處理線性可分和線性不可分的情況，也可以通過使用核函數(shù)來處理非線性問題。

SVM 在解決分類問題時，通常是通過構造一個最大間隔分離超平面來實現(xiàn)的。

在回歸問題中，SVM 通過構造一個回歸超平面來實現(xiàn)預測。

SVM 的核心思想是利用數(shù)學方法將高維數(shù)據(jù)映射到低維空間，從而對不可分數(shù)據(jù)進行線性分類。

SVM 模型具有很好的泛化能力，可以解決高維數(shù)據(jù)的分類問題。

SVM 模型可以使用不同的核函數(shù)，如線性核、多項式核、高斯核等，這樣可以解決非線性問題。此外，SVM 還可以處理大量特征數(shù)據(jù)，并具有高效的計算速度。

用 Python 實現(xiàn) SVM

使用 scikit-learn 庫實現(xiàn) SVM 分類

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加載數(shù)據(jù)集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 創(chuàng)建 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)

# 訓練模型
model.fit(X_train, y_train)

# 在測試集上進行預測
y_pred = model.predict(X_test)

# 計算預測精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

首先使用 load_iris() 函數(shù)加載 iris 數(shù)據(jù)集，然后使用 train_test_split() 函數(shù)將數(shù)據(jù)集劃分為訓練集和測試集。

接著，使用 SVC 函數(shù)創(chuàng)建一個 SVM 模型，并使用 fit() 函數(shù)在訓練集上進行訓練。

最后，使用 predict 函數(shù)在測試集上進行預測，并使用 accuracy_score() 函數(shù)計算預測精度。

多項式和高斯核函數(shù)的 SVM

使用高斯核函數(shù)的 SVM 可以如下實現(xiàn)：

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加載數(shù)據(jù)集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 創(chuàng)建 SVM 模型，使用高斯核函數(shù)
model = SVC(kernel='rbf', C=1, random_state=0)

# 訓練模型
model.fit(X_train, y_train)

# 在測試集上進行預測
y_pred = model.predict(X_test)

# 計算預測精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的代碼中，首先加載了 scikit-learn 中的 iris 數(shù)據(jù)集，并將其特征數(shù)據(jù)存儲在 X 中，標簽存儲在 y 中。

使用 train_test_split() 函數(shù)劃分出了訓練集和測試集，并將其分別存儲在 X_train ， X_test ， y_train ， y_test 中。

創(chuàng)建了一個 SVM 模型，使用了高斯核函數(shù)（Radial basis function, RBF）。參數(shù) C 用于控制對誤差的懲罰程度，數(shù)值越大，懲罰程度越大。參數(shù) gamma 控制高斯核函數(shù)的影響范圍，數(shù)值越小，影響范圍越廣。

使用 fit() 方法訓練模型。訓練后，使用 predict() 方法在測試集上進行預測，并將預測結果存儲在 y_pred 中。

最終的結果將通過 accuracy_score() 函數(shù)計算預測精度，并將其打印出來。

還可以調整 SVM 模型的超參數(shù)以改變模型的表現(xiàn)，例如 C 和 gamma 。通過調整超參數(shù)可以使模型更加適合數(shù)據(jù)，并提高模型的預測精度。

到此這篇關于Python實現(xiàn)SVM支持向量機的示例代碼的文章就介紹到這了,更多相關Python SVM支持向量機內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: