欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python實(shí)現(xiàn)鳶尾花三種聚類算法(K-means,AGNES,DBScan)

 更新時(shí)間:2019年06月27日 14:44:44   作者:weixin_42134141  
這篇文章主要介紹了python實(shí)現(xiàn)鳶尾花三種聚類算法(K-means,AGNES,DBScan),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

一.分散性聚類(kmeans)

算法流程:

1.選擇聚類的個(gè)數(shù)k.

2.任意產(chǎn)生k個(gè)聚類,然后確定聚類中心,或者直接生成k個(gè)中心。

3.對每個(gè)點(diǎn)確定其聚類中心點(diǎn)。

4.再計(jì)算其聚類新中心。

5.重復(fù)以上步驟直到滿足收斂要求。(通常就是確定的中心點(diǎn)不再改變。

優(yōu)點(diǎn):

1.是解決聚類問題的一種經(jīng)典算法,簡單、快速

2.對處理大數(shù)據(jù)集,該算法保持可伸縮性和高效率

3.當(dāng)結(jié)果簇是密集的,它的效果較好

缺點(diǎn)

1.在簇的平均值可被定義的情況下才能使用,可能不適用于某些應(yīng)用

2.必須事先給出k(要生成的簇的數(shù)目),而且對初值敏感,對于不同的初始值,可能會導(dǎo)致不同結(jié)果。

3.不適合于發(fā)現(xiàn)非凸形狀的簇或者大小差別很大的簇

4.對躁聲和孤立點(diǎn)數(shù)據(jù)敏感

這里為了看鳶尾花的三種聚類算法的直觀區(qū)別,所以不用具體算法實(shí)現(xiàn),只需要調(diào)用相應(yīng)函數(shù)即可。

程序如下: 

import matplotlib.pyplot as plt 
import numpy as np 
from sklearn.cluster import KMeans
from sklearn import datasets 
 
iris = datasets.load_iris() 
X = iris.data[:, :4] # #表示我們?nèi)√卣骺臻g中的4個(gè)維度
print(X.shape)
 
# 繪制數(shù)據(jù)分布圖
plt.scatter(X[:, 0], X[:, 1], c="red", marker='o', label='see') 
plt.xlabel('sepal length') 
plt.ylabel('sepal width') 
plt.legend(loc=2) 
plt.show() 
 
estimator = KMeans(n_clusters=3) # 構(gòu)造聚類器
estimator.fit(X) # 聚類
label_pred = estimator.labels_ # 獲取聚類標(biāo)簽
# 繪制k-means結(jié)果
x0 = X[label_pred == 0]
x1 = X[label_pred == 1]
x2 = X[label_pred == 2]
plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='label0') 
plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='label1') 
plt.scatter(x2[:, 0], x2[:, 1], c="blue", marker='+', label='label2') 
plt.xlabel('sepal length') 
plt.ylabel('sepal width') 
plt.legend(loc=2) 
plt.show() 

運(yùn)行結(jié)果:

 二.結(jié)構(gòu)性聚類(層次聚類)

1.凝聚層次聚類:AGNES算法(自底向上)

首先將每個(gè)對象作為一個(gè)簇,然后合并這些原子簇為越來越大的簇,直到某個(gè)終結(jié)條件被滿足

2.分裂層次聚類:DIANA算法(自頂向下)

首先將所有對象置于一個(gè)簇中,然后逐漸細(xì)分為越來越小的簇,直到達(dá)到了某個(gè)終結(jié)條件。

這里我選擇的AGNES算法。

程序如下:

from sklearn import datasets
from sklearn.cluster import AgglomerativeClustering
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import pandas as pd
 
iris = datasets.load_iris()
irisdata = iris.data
 
clustering = AgglomerativeClustering(linkage='ward', n_clusters=3)
 
res = clustering.fit(irisdata)
 
print ("各個(gè)簇的樣本數(shù)目:")
print (pd.Series(clustering.labels_).value_counts())
print ("聚類結(jié)果:")
print (confusion_matrix(iris.target, clustering.labels_))
 
plt.figure()
d0 = irisdata[clustering.labels_ == 0]
plt.plot(d0[:, 0], d0[:, 1], 'r.')
d1 = irisdata[clustering.labels_ == 1]
plt.plot(d1[:, 0], d1[:, 1], 'go')
d2 = irisdata[clustering.labels_ == 2]
plt.plot(d2[:, 0], d2[:, 1], 'b*')
plt.xlabel("Sepal.Length")
plt.ylabel("Sepal.Width")
plt.title("AGNES Clustering")
plt.show()

運(yùn)行結(jié)果:

三.密度聚類之DBSCAN算法:

算法:

需要兩個(gè)參數(shù):ε (eps) 和形成高密度區(qū)域所需要的最少點(diǎn)數(shù) (minPts)

它由一個(gè)任意未被訪問的點(diǎn)開始,然后探索這個(gè)點(diǎn)的 ε-鄰域,如果 ε-鄰域里有足夠的點(diǎn),則建立一個(gè)新的聚類,否則這個(gè)點(diǎn)被標(biāo)簽為雜音。注意這個(gè)點(diǎn)之后可能被發(fā)現(xiàn)在其它點(diǎn)的 ε-鄰域里,而該 ε-鄰域可能有足夠的點(diǎn),屆時(shí)這個(gè)點(diǎn)會被加入該聚類中。

程序如下:

import matplotlib.pyplot as plt 
import numpy as np 
from sklearn.cluster import KMeans
from sklearn import datasets 
from sklearn.cluster import DBSCAN
 
iris = datasets.load_iris() 
X = iris.data[:, :4] # #表示我們只取特征空間中的4個(gè)維度
print(X.shape)
# 繪制數(shù)據(jù)分布圖
plt.scatter(X[:, 0], X[:, 1], c="red", marker='o', label='see') 
plt.xlabel('sepal length') 
plt.ylabel('sepal width') 
plt.legend(loc=2) 
plt.show() 
 
dbscan = DBSCAN(eps=0.4, min_samples=9)
dbscan.fit(X) 
label_pred = dbscan.labels_
 
# 繪制k-means結(jié)果
x0 = X[label_pred == 0]
x1 = X[label_pred == 1]
x2 = X[label_pred == 2]
plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='label0') 
plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='label1') 
plt.scatter(x2[:, 0], x2[:, 1], c="blue", marker='+', label='label2') 
plt.xlabel('sepal length') 
plt.ylabel('sepal width') 
plt.legend(loc=2) 
plt.show() 

運(yùn)行結(jié)果:

改變參數(shù)后:

四、結(jié)果分析

從上面三種實(shí)驗(yàn)截圖可以看出,k-means聚類和AGNES層次聚類分析結(jié)果差不多的三類,與DBSCAN的結(jié)果不一樣。為啥不一樣,這就取決于算法本身的優(yōu)缺點(diǎn)了。

k-means對于大型數(shù)據(jù)集也是簡單高效、時(shí)間復(fù)雜度、空間復(fù)雜度低。 最重要是數(shù)據(jù)集大時(shí)結(jié)果容易局部最優(yōu);需要預(yù)先設(shè)定K值,對最先的K個(gè)點(diǎn)選取很敏感;對噪聲和離群值非常敏感;只用于numerical類型數(shù)據(jù);不能解決非凸數(shù)據(jù)。

 DBSCAN對噪聲不敏感;能發(fā)現(xiàn)任意形狀的聚類。 但是聚類的結(jié)果與參數(shù)有很大的關(guān)系;DBSCAN用固定參數(shù)識別聚類,但當(dāng)聚類的稀疏程度不同時(shí),相同的判定標(biāo)準(zhǔn)可能會破壞聚類的自然結(jié)構(gòu),即較稀的聚類會被劃分為多個(gè)類或密度較大且離得較近的類會被合并成一個(gè)聚類。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 將pycharm配置為matlab或者spyder的用法說明

    將pycharm配置為matlab或者spyder的用法說明

    這篇文章主要介紹了將pycharm配置為matlab或者spyder的用法說明,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • pytorch中LN(LayerNorm)及Relu和其變相的輸出操作

    pytorch中LN(LayerNorm)及Relu和其變相的輸出操作

    這篇文章主要介紹了pytorch中LN(LayerNorm)及Relu和其變相的輸出操作,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • Python中matplotlib庫安裝失敗的經(jīng)驗(yàn)總結(jié)(附pycharm配置anaconda)

    Python中matplotlib庫安裝失敗的經(jīng)驗(yàn)總結(jié)(附pycharm配置anaconda)

    最近根據(jù)領(lǐng)導(dǎo)布置的學(xué)習(xí)任務(wù),開始學(xué)習(xí)python中的matplotlib,朋友告訴我這個(gè)很簡單,然而剛踏入安裝的門檻,就遇到了安裝不成功的問題,下面這篇文章主要給大家介紹了關(guān)于Python中matplotlib庫安裝失敗的經(jīng)驗(yàn)總結(jié),需要的朋友可以參考下
    2022-08-08
  • Python 高級教程之線程進(jìn)程和協(xié)程的代碼解析

    Python 高級教程之線程進(jìn)程和協(xié)程的代碼解析

    這篇文章主要介紹了Python 高級教程之線程進(jìn)程和協(xié)程的代碼解析,包括使用線程模塊的簡單示例,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-05-05
  • django2筆記之路由path語法的實(shí)現(xiàn)

    django2筆記之路由path語法的實(shí)現(xiàn)

    這篇文章主要介紹了django2筆記之路由path語法的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Python的randrange()方法使用教程

    Python的randrange()方法使用教程

    這篇文章主要介紹了Python的randrange()方法使用教程,是Python學(xué)習(xí)中的基礎(chǔ)知識,需要的朋友可以參考下
    2015-05-05
  • PyQt5 QSerialPort子線程操作的實(shí)現(xiàn)

    PyQt5 QSerialPort子線程操作的實(shí)現(xiàn)

    這篇文章主要介紹了PyQt5 QSerialPort子線程操作的實(shí)現(xiàn),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2018-04-04
  • 深入了解Python 方法之類方法 & 靜態(tài)方法

    深入了解Python 方法之類方法 & 靜態(tài)方法

    這篇文章主要介紹了Python類方法 & 靜態(tài)方法的相關(guān)資料,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-08-08
  • 在CentOS 7中使用Python 3執(zhí)行系統(tǒng)命令的詳細(xì)教程

    在CentOS 7中使用Python 3執(zhí)行系統(tǒng)命令的詳細(xì)教程

    使用os.system()這個(gè)方法簡單直接,但它不返回命令的輸出,只返回命令的退出狀態(tài),如果你只需要知道命令是否成功執(zhí)行,這個(gè)方法就足夠了,這篇文章主要介紹了在CentOS 7中使用Python 3執(zhí)行系統(tǒng)命令的詳細(xì)教程,需要的朋友可以參考下
    2024-02-02
  • python中List添加與刪除元素的幾種方法實(shí)例

    python中List添加與刪除元素的幾種方法實(shí)例

    列表基本上是?Python?中最常用的數(shù)據(jù)結(jié)構(gòu)之一了,并且刪除操作也是經(jīng)常使用的,下面這篇文章主要給大家介紹了關(guān)于python中List添加與刪除元素的相關(guān)資料,需要的朋友可以參考下
    2022-09-09

最新評論