Python實現SVM支持向量機的示例代碼
下面是使用 scikit-learn 庫中的 SVM 模型的示例代碼:
from sklearn import svm from sklearn.datasets import make_classification # generate some example data X, y = make_classification(n_features=4, random_state=0) # fit an SVM model to the data clf = svm.SVC(kernel='linear') clf.fit(X, y) # predict new data print(clf.predict([[0, 0, 0, 0]]))
什么是支持向量機
支持向量機(SVM),SVM 的目的是在數據集中找到一條最佳分隔超平面,使得在這個超平面兩側的數據分別屬于不同的類別,且該超平面與最近的數據點之間的距離最大。
這些最近的數據點稱為支持向量,因此該模型被稱為支持向量機。
SVM 可以處理線性可分和線性不可分的情況,也可以通過使用核函數來處理非線性問題。
SVM 在解決分類問題時,通常是通過構造一個最大間隔分離超平面來實現的。
在回歸問題中,SVM 通過構造一個回歸超平面來實現預測。
SVM 的核心思想是利用數學方法將高維數據映射到低維空間,從而對不可分數據進行線性分類。
SVM 模型具有很好的泛化能力,可以解決高維數據的分類問題。
SVM 模型可以使用不同的核函數,如線性核、多項式核、高斯核等,這樣可以解決非線性問題。此外,SVM 還可以處理大量特征數據,并具有高效的計算速度。
用 Python 實現 SVM
使用 scikit-learn 庫實現 SVM 分類
import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.svm import SVC from sklearn.metrics import accuracy_score # 加載數據集 iris = datasets.load_iris() X = iris["data"] y = iris["target"] # 劃分訓練集和測試集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 創(chuàng)建 SVM 模型 model = SVC(kernel='linear', C=1, random_state=0) # 訓練模型 model.fit(X_train, y_train) # 在測試集上進行預測 y_pred = model.predict(X_test) # 計算預測精度 accuracy = accuracy_score(y_test, y_pred) print("Accuracy:", accuracy)
首先使用 load_iris() 函數加載 iris 數據集,然后使用 train_test_split() 函數將數據集劃分為訓練集和測試集。
接著,使用 SVC 函數創(chuàng)建一個 SVM 模型,并使用 fit() 函數在訓練集上進行訓練。
最后,使用 predict 函數在測試集上進行預測,并使用 accuracy_score() 函數計算預測精度。
多項式和高斯核函數的 SVM
使用高斯核函數的 SVM 可以如下實現:
import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.svm import SVC from sklearn.metrics import accuracy_score # 加載數據集 iris = datasets.load_iris() X = iris["data"] y = iris["target"] # 劃分訓練集和測試集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 創(chuàng)建 SVM 模型,使用高斯核函數 model = SVC(kernel='rbf', C=1, random_state=0) # 訓練模型 model.fit(X_train, y_train) # 在測試集上進行預測 y_pred = model.predict(X_test) # 計算預測精度 accuracy = accuracy_score(y_test, y_pred) print("Accuracy:", accuracy)
在上面的代碼中,首先加載了 scikit-learn 中的 iris 數據集,并將其特征數據存儲在 X 中,標簽存儲在 y 中。
使用 train_test_split() 函數劃分出了訓練集和測試集,并將其分別存儲在 X_train , X_test , y_train , y_test 中。
創(chuàng)建了一個 SVM 模型,使用了高斯核函數(Radial basis function, RBF)。參數 C 用于控制對誤差的懲罰程度,數值越大,懲罰程度越大。參數 gamma 控制高斯核函數的影響范圍,數值越小,影響范圍越廣。
使用 fit() 方法訓練模型。訓練后,使用 predict() 方法在測試集上進行預測,并將預測結果存儲在 y_pred 中。
最終的結果將通過 accuracy_score() 函數計算預測精度,并將其打印出來。
還可以調整 SVM 模型的超參數以改變模型的表現,例如 C 和 gamma 。通過調整超參數可以使模型更加適合數據,并提高模型的預測精度。
到此這篇關于Python實現SVM支持向量機的示例代碼的文章就介紹到這了,更多相關Python SVM支持向量機內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python中三種輸出格式總結(%,format,f-string)
在Python語言編程中,我們會與字符串打交道,那務必會輸出字符串來查看字符串的內容,下面這篇文章主要給大家介紹了關于python中三種輸出格式的相關資料,三種格式分別是%,format,f-string,需要的朋友可以參考下2022-03-03Python日志打印里logging.getLogger源碼分析詳解
在本篇文章里小編給大家整理的是一篇關于Python logging.getLogger源碼分析的相關內容,有興趣的朋友們可以學習參考下。2021-01-01