欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python聚類算法選擇方法實(shí)例

 更新時(shí)間:2021年07月30日 08:34:52   作者:小妮淺淺  
在本篇文章里小編給大家整理的是一篇關(guān)于python聚類算法選擇方法實(shí)例,有需要的朋友們可以學(xué)習(xí)參考下。

說(shuō)明

1、如果數(shù)據(jù)集是高維度的,選擇譜聚類是子空間的一種。

2、如果數(shù)據(jù)量是中小型的,比如在100W條以內(nèi),K均值會(huì)是更好的選擇;如果數(shù)據(jù)量超過(guò)100W條,可以考慮使用MiniBatchKMeans。

3、如果數(shù)據(jù)集中有噪聲(離群點(diǎn)),使用基于密度的DBSCAN可以有效解決這個(gè)問(wèn)題。

4、若追求更高的分類準(zhǔn)確性,則選擇譜聚類比K均值準(zhǔn)確性更好。

實(shí)例

import numpy as np
import matplotlib.pyplot as plt
 
 
# 數(shù)據(jù)準(zhǔn)備
raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 導(dǎo)入數(shù)據(jù)文件
X = raw_data[:, :-1] # 分割要聚類的數(shù)據(jù)
y_true = raw_data[:, -1]
 
print(X)

知識(shí)點(diǎn)擴(kuò)充:

聚類算法

有許多類型的聚類算法。許多算法在特征空間中的示例之間使用相似度或距離度量,以發(fā)現(xiàn)密集的觀測(cè)區(qū)域。因此,在使用聚類算法之前,擴(kuò)展數(shù)據(jù)通常是良好的實(shí)踐。

聚類分析的所有目標(biāo)的核心是被群集的各個(gè)對(duì)象之間的相似程度(或不同程度)的概念。聚類方法嘗試根據(jù)提供給對(duì)象的相似性定義對(duì)對(duì)象進(jìn)行分組。

一些聚類算法要求您指定或猜測(cè)數(shù)據(jù)中要發(fā)現(xiàn)的群集的數(shù)量,而另一些算法要求指定觀測(cè)之間的最小距離,其中示例可以被視為“關(guān)閉”或“連接”。因此,聚類分析是一個(gè)迭代過(guò)程,在該過(guò)程中,對(duì)所識(shí)別的群集的主觀評(píng)估被反饋回算法配置的改變中,直到達(dá)到期望的或適當(dāng)?shù)慕Y(jié)果。scikit-learn 庫(kù)提供了一套不同的聚類算法供選擇。下面列出了10種比較流行的算法:

  • 親和力傳播
  • 聚合聚類
  • BIRCH
  • DBSCAN
  • K-均值
  • Mini-Batch K-均值
  • Mean Shift
  • OPTICS
  • 光譜聚類
  • 高斯混合

每個(gè)算法都提供了一種不同的方法來(lái)應(yīng)對(duì)數(shù)據(jù)中發(fā)現(xiàn)自然組的挑戰(zhàn)。沒(méi)有最好的聚類算法,也沒(méi)有簡(jiǎn)單的方法來(lái)找到最好的算法為您的數(shù)據(jù)沒(méi)有使用控制實(shí)驗(yàn)。在本教程中,我們將回顧如何使用來(lái)自 scikit-learn 庫(kù)的這10個(gè)流行的聚類算法中的每一個(gè)。這些示例將為您復(fù)制粘貼示例并在自己的數(shù)據(jù)上測(cè)試方法提供基礎(chǔ)。我們不會(huì)深入研究算法如何工作的理論,也不會(huì)直接比較它們。讓我們深入研究一下。

到此這篇關(guān)于python聚類算法選擇方法實(shí)例的文章就介紹到這了,更多相關(guān)python聚類算法如何選擇內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python開(kāi)發(fā)常用的一些開(kāi)源Package分享

    Python開(kāi)發(fā)常用的一些開(kāi)源Package分享

    這篇文章主要介紹了Python開(kāi)發(fā)常用的一些開(kāi)源Package分享,常用的開(kāi)源項(xiàng)目包括WEB開(kāi)發(fā)框架、工具包、數(shù)據(jù)庫(kù)操作包、網(wǎng)絡(luò)操作包等,需要的朋友可以參考下
    2015-02-02
  • python實(shí)現(xiàn)遍歷文件夾圖片并重命名

    python實(shí)現(xiàn)遍歷文件夾圖片并重命名

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)遍歷文件夾圖片并重命名,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • Python實(shí)現(xiàn)快速排序的方法詳解

    Python實(shí)現(xiàn)快速排序的方法詳解

    這篇文章主要介紹了Python實(shí)現(xiàn)快速排序的方法,結(jié)合實(shí)例形式詳細(xì)分析了快速排序的思路、原理及Python具體實(shí)現(xiàn)技巧與相關(guān)操作注意事項(xiàng),需要的朋友可以參考下
    2019-10-10
  • pycharm2022.2遠(yuǎn)程連接服務(wù)器調(diào)試代碼實(shí)現(xiàn)

    pycharm2022.2遠(yuǎn)程連接服務(wù)器調(diào)試代碼實(shí)現(xiàn)

    本文主要介紹了pycharm2022.2遠(yuǎn)程連接服務(wù)器調(diào)試代碼實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • Python實(shí)現(xiàn)郵件的批量發(fā)送的示例代碼

    Python實(shí)現(xiàn)郵件的批量發(fā)送的示例代碼

    下面小編就為大家分享一篇Python實(shí)現(xiàn)郵件的批量發(fā)送的示例代碼,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-01-01
  • 分享9個(gè)好用的Python技巧

    分享9個(gè)好用的Python技巧

    大家好,本篇文章主要講的是分享9個(gè)好用的Python技巧,感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話記得收藏一下,方便下次瀏覽
    2021-12-12
  • matplotlib之Font family [‘sans-serif‘] not found的問(wèn)題解決

    matplotlib之Font family [‘sans-serif‘] not&nbs

    本文主要介紹了matplotlib之Font family [‘sans-serif‘] not found的問(wèn)題解決,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • python內(nèi)打印變量之%和f的實(shí)例

    python內(nèi)打印變量之%和f的實(shí)例

    今天小編就為大家分享一篇python內(nèi)打印變量之%和f的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-02-02
  • Python入門教程之運(yùn)算符重載詳解

    Python入門教程之運(yùn)算符重載詳解

    運(yùn)算符重載意味著賦予超出其預(yù)定義的操作含義的擴(kuò)展含義。例如運(yùn)算符 + 用于添加兩個(gè)整數(shù)以及連接兩個(gè)字符串和合并兩個(gè)列表。本文將通過(guò)示例帶大家詳細(xì)了解Python的運(yùn)算符重載,感興趣的可以了解一下
    2022-09-09
  • Python使用pyserial進(jìn)行串口通信的實(shí)例

    Python使用pyserial進(jìn)行串口通信的實(shí)例

    今天小編就為大家分享一篇Python使用pyserial進(jìn)行串口通信的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-07-07

最新評(píng)論