sklearn中make_blobs的用法詳情
sklearn中的make_blobs函數(shù)主要是為了生成數(shù)據(jù)集的,具體如下:
1.調(diào)用make_blobs
from sklearn.datasets import make_blobs
2.make_blobs的用法
data, label = make_blobs(n_features=2, n_samples=100, centers=3, random_state=3, cluster_std=[0.8, 2, 5])
n_features
表示每一個(gè)樣本有多少特征值n_samples
表示樣本的個(gè)數(shù)centers
是聚類(lèi)中心點(diǎn)的個(gè)數(shù),可以理解為label的種類(lèi)數(shù)random_state
是隨機(jī)種子,可以固定生成的數(shù)據(jù)cluster_std
設(shè)置每個(gè)類(lèi)別的方差
下面舉例說(shuō)明:
'''創(chuàng)建訓(xùn)練的數(shù)據(jù)集''' from sklearn.datasets import make_blobs data, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=2019, cluster_std=[0.6,0.7] )
看看生成的數(shù)據(jù)集:
data
有2個(gè)特征(n_features=2
),樣本個(gè)數(shù)是100(n_samples=100)
再看看生成的label:
label只有0或者1(centers=2),維度是100
random_state
給定數(shù)值后,每次生成的數(shù)據(jù)集就是固定的,方便后期復(fù)現(xiàn),默認(rèn)的是每次隨機(jī)生成,要注意一下??!
好了,這樣我們就擁有了一個(gè)自己想要的數(shù)據(jù)集,然后就可以開(kāi)始后續(xù)的一些工作了!?。?!
到此這篇關(guān)于sklearn
中make_blobs
的用法詳情的文章就介紹到這了,更多相關(guān)sklearn
中make_blobs
的用法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決
這篇文章主要介紹了Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-06-06使用Python監(jiān)控文件內(nèi)容變化代碼實(shí)例
在python中文件監(jiān)控主要有兩個(gè)庫(kù),一個(gè)是pyinotify,一個(gè)是watchdog。pyinotify依賴于Linux平臺(tái)的inotify,今天我們就來(lái)探討下pyinotify.2018-06-06使用Pytorch Geometric進(jìn)行鏈接預(yù)測(cè)的實(shí)現(xiàn)代碼
PyTorch Geometric (PyG)是構(gòu)建圖神經(jīng)網(wǎng)絡(luò)模型和實(shí)驗(yàn)各種圖卷積的主要工具,在本文中我們將通過(guò)鏈接預(yù)測(cè)來(lái)對(duì)其進(jìn)行介紹,文中有詳細(xì)的代碼示例供大家參考,需要的朋友可以參考下2023-10-10使用Python的OpenCV模塊識(shí)別滑動(dòng)驗(yàn)證碼的缺口(推薦)
這篇文章主要介紹了使用Python的OpenCV模塊識(shí)別滑動(dòng)驗(yàn)證碼的缺口,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-05-05django 通過(guò)URL訪問(wèn)上傳的文件方法
今天小編就為大家分享一篇django 通過(guò)URL訪問(wèn)上傳的文件方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07Python機(jī)器學(xué)習(xí)應(yīng)用之基于線性判別模型的分類(lèi)篇詳解
線性判別分析(Linear?Discriminant?Analysis,?LDA)是一種監(jiān)督學(xué)習(xí)的降維方法,也就是說(shuō)數(shù)據(jù)集的每個(gè)樣本是有類(lèi)別輸出。和之前介紹的機(jī)器學(xué)習(xí)降維之主成分分析(PCA)方法不同,PCA是不考慮樣本類(lèi)別輸出的無(wú)監(jiān)督學(xué)習(xí)方法2022-01-01Python棧的實(shí)現(xiàn)方法示例【列表、單鏈表】
這篇文章主要介紹了Python棧的實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了Python基于列表、單鏈表定義棧的相關(guān)操作技巧,需要的朋友可以參考下2020-02-02python通過(guò)微信發(fā)送郵件實(shí)現(xiàn)電腦關(guān)機(jī)
這篇文章主要為大家詳細(xì)介紹了python通過(guò)微信發(fā)送郵件實(shí)現(xiàn)電腦關(guān)機(jī),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-06-06