欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python機器學習應用之支持向量機的分類預測篇

 更新時間:2022年01月18日 17:10:42   作者:柚子味的羊  
最近完成的一個項目用到了SVM,之前也一直有聽說支持向量機,知道它是機器學習中一種非常厲害的算法。利用將近一個星期的時間學習了一下支持向量機,把原理推了一遍,感覺支持向量機確實挺厲害的,這篇文章帶你了解它

支持向量機常用于數(shù)據(jù)分類,也可以用于數(shù)據(jù)的回歸預測

1、Question?

我們經常會遇到這樣的問題,給你一些屬于兩個類別的數(shù)據(jù)(如子圖1),需要一個線性分類器將這些數(shù)據(jù)分開,有很多分法(如子圖2),現(xiàn)在有一個問題,兩個分類器,哪一個更好?為了判斷好壞,我們需要引入一個準則:好的分類器不僅僅能夠很好的分開已有的數(shù)據(jù)集,還能對為知的數(shù)據(jù)進行兩個劃分,假設現(xiàn)在有一個屬于紅色數(shù)據(jù)點的新數(shù)據(jù)(如子圖3中的綠三角),可以看到此時黑色的線會把這個新的數(shù)據(jù)集分錯,而藍色的線不會。**那么如何評判兩條線的健壯性?**此時,引入一個重要的概念——最大間隔(刻畫著當前分類器與數(shù)據(jù)集的邊界)(如子圖4中的陰影部分)可以看到藍色的線最大的間隔大于黑色的線,所以選擇藍色的線作為我們的分類器。(如子圖5)此時的分類器是最優(yōu)分類器嗎?或者說,有沒有更好的分類器具有更大的間隔?有的(如子圖6)為了找到最優(yōu)分類器,引入SVM

2、Answer!——SVM

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
x_fit = np.linspace(0, 3)
#使用SVM
from sklearn.svm import SVC
# SVM 函數(shù)
clf = SVC(kernel='linear')
clf.fit(X, y)
# 最佳函數(shù)
w = clf.coef_[0]
a = -w[0] / w[1]
y_p = a*x_fit - (clf.intercept_[0]) / w[1]

# 最大邊距 下邊界
b_down = clf.support_vectors_[0]
y_down = a* x_fit + b_down[1] - a * b_down[0]
# 最大邊距 上屆
b_up = clf.support_vectors_[-1]
y_up = a* x_fit + b_up[1] - a * b_up[0]

# 畫散點圖
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.4)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)
# 畫函數(shù)
plt.plot(x_fit, y_p, '-c')
# 畫邊距
plt.fill_between(x_fit, y_down, y_up, edgecolor='none', color='#AAAAAA', alpha=0.4)
# 畫支持向量
plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], edgecolor='b',
            s=80, facecolors='none')

運行結果

其中帶邊線的是距離當前分類器最近的點,將這些點稱之為支持向量,支持向量機為我們在眾多可能的分類器之間進行選擇的原則,從而確保對為知數(shù)據(jù)集具有更高的泛化性

3、軟間隔

在很多時候,我們拿到是數(shù)據(jù)不想上述那樣分明(如下圖)這種情況并不容易找到上述那樣的最大間隔。于是就有了軟間隔,相對于硬間隔,我們允許個別數(shù)據(jù)出現(xiàn)在間隔帶中。我們知道,如果沒有一個原則進行約束,滿足軟間隔的分類器也會出現(xiàn)很多條。所以需要對分錯的數(shù)據(jù)進行懲罰,SVM函數(shù),有一個參數(shù)C就是懲罰參數(shù)。懲罰參數(shù)越小,容忍性就越大

——此處C設置為1

#%%軟間隔
X, y = make_blobs(n_samples=60, centers=2, random_state=0, cluster_std=0.9)
x_fit = np.linspace(-2, 4)
# 懲罰參數(shù):C=1,
clf = SVC(C=1, kernel='linear')
clf.fit(X, y)

# 最佳函數(shù)
w = clf.coef_[0]
a = -w[0] / w[1]
y_great = a*x_fit - (clf.intercept_[0]) / w[1]
# 最大邊距 下邊界
b_down = clf.support_vectors_[0]
y_down = a* x_fit + b_down[1] - a * b_down[0]
# 最大邊距 上邊界
b_up = clf.support_vectors_[-1]
y_up = a* x_fit + b_up[1] - a * b_up[0]
# 畫散點圖
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)
# 畫函數(shù)
plt.plot(x_fit, y_great, '-c')
# 畫邊距
plt.fill_between(x_fit, y_down, y_up, edgecolor='none', color='#AAAAAA', alpha=0.4)
# 畫支持向量
plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], edgecolor='b',
            s=80, facecolors='none')

運行結果

——當將C設置為0.2時,SVM會更有包容性,從而兼容更多的錯分樣本,結果如下:

4、超平面

有時,我們得到的數(shù)據(jù)是這樣的(如下圖),這時,可以將二維空間(低維)的數(shù)據(jù)映射到三維空間(高維)中,此時,可以通過一個超平面對數(shù)據(jù)進行劃分,所以,映射的目的在于使用SVM在高維空間找到超平面的能力

#%%超平面
from sklearn.datasets import make_circles
# 畫散點圖
X, y = make_circles(100, factor=.1, noise=.1, random_state=2019)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)

# 數(shù)據(jù)映射
r = np.exp(-(X[:, 0] ** 2 + X[:, 1] ** 2))

ax = plt.subplot(projection='3d')
ax.scatter3D(X[:, 0], X[:, 1], r, c=y, s=50, cmap=plt.cm.Paired)
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')

x_1, y_1 = np.meshgrid(np.linspace(-1, 1), np.linspace(-1, 1))
z =  0.01*x_1 + 0.01*y_1 + 0.5
ax.plot_surface(x_1, y_1, z, alpha=0.3)

運行結果

使用高斯核函數(shù)實現(xiàn)這種情形的分類

#%%使用高斯核函數(shù)實現(xiàn)這種分類:kernel=‘rbf'
# 畫圖
X, y = make_circles(100, factor=.1, noise=.1, random_state=2019)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap=plt.cm.Paired)
clf = SVC(kernel='rbf')
clf.fit(X, y)

ax = plt.gca()
x = np.linspace(-1, 1)
y = np.linspace(-1, 1)
x_1, y_1 = np.meshgrid(x, y)
P = np.zeros_like(x_1)
for i, xi in enumerate(x):
    for j, yj in enumerate(y):
        P[i, j] = clf.decision_function(np.array([[xi, yj]]))
ax.contour(x_1, y_1, P, colors='k', levels=[-1, 0, 0.9], alpha=0.5,linestyles=['--', '-', '--'])
plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], edgecolor='b',s=80, facecolors='none');

運行結果

今日告一段落~

到此這篇關于Python機器學習應用之支持向量機的分類預測篇的文章就介紹到這了,更多相關Python 支持向量機內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 詳解OpenCV圖像的概念和基本操作

    詳解OpenCV圖像的概念和基本操作

    opencv最主要的的功能是用于圖像處理,所以圖像的概念貫穿了整個opencv,與其相關的核心類就是Mat。這篇文章主要介紹了OpenCV圖像的概念和基本操作,需要的朋友可以參考下
    2021-10-10
  • Python實現(xiàn)視頻畫質增強的示例代碼

    Python實現(xiàn)視頻畫質增強的示例代碼

    這篇文章主要為大家詳細介紹了如何利用Python語言實現(xiàn)對視頻進行畫質增強功能,文中的示例代碼講解詳細,感興趣的小伙伴可以嘗試一下
    2022-04-04
  • 解決已經安裝requests,卻依然提示No module named requests問題

    解決已經安裝requests,卻依然提示No module named requests問題

    今天小編就為大家分享一篇解決已經安裝requests,卻依然提示No module named 'requests'問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-05-05
  • python保存數(shù)據(jù)到本地文件的方法

    python保存數(shù)據(jù)到本地文件的方法

    今天小編就為大家分享一篇python保存數(shù)據(jù)到本地文件的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-06-06
  • Python 如何查找特定類型文件

    Python 如何查找特定類型文件

    這篇文章主要介紹了Python 如何定位特定類型文件,幫助大家更好的理解和學習python,感興趣的朋友可以了解下
    2020-08-08
  • Django框架下在URLconf中指定視圖緩存的方法

    Django框架下在URLconf中指定視圖緩存的方法

    這篇文章主要介紹了Django框架下在URLconf中指定視圖緩存的方法,在Python豐富多彩的web框架中,Django是最具人氣的一個,需要的朋友可以參考下
    2015-07-07
  • Python可迭代對象操作示例

    Python可迭代對象操作示例

    這篇文章主要介紹了Python可迭代對象操作,涉及Python列表生成式、迭代器、數(shù)據(jù)遍歷等相關操作技巧,需要的朋友可以參考下
    2019-05-05
  • Python?并行加速技巧分享

    Python?并行加速技巧分享

    這篇文章主要介紹了Python?并行加速技巧分享,文章圍繞文章主題展開詳細的內容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-05-05
  • 教你如何在pycharm中安裝opencv,tensorflow,keras

    教你如何在pycharm中安裝opencv,tensorflow,keras

    今天通過本教程教大家如何在pycharm中安裝opencv,tensorflow,keras,本文分步驟給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-08-08
  • Python torch.flatten()函數(shù)案例詳解

    Python torch.flatten()函數(shù)案例詳解

    這篇文章主要介紹了Python torch.flatten()函數(shù)案例詳解,本篇文章通過簡要的案例,講解了該項技術的了解與使用,以下就是詳細內容,需要的朋友可以參考下
    2021-08-08

最新評論