sklearn中make_blobs的用法詳情
sklearn中的make_blobs函數(shù)主要是為了生成數(shù)據(jù)集的,具體如下:
1.調(diào)用make_blobs
from sklearn.datasets import make_blobs
2.make_blobs的用法
data, label = make_blobs(n_features=2, n_samples=100, centers=3, random_state=3, cluster_std=[0.8, 2, 5])
n_features
表示每一個樣本有多少特征值n_samples
表示樣本的個數(shù)centers
是聚類中心點的個數(shù),可以理解為label的種類數(shù)random_state
是隨機種子,可以固定生成的數(shù)據(jù)cluster_std
設(shè)置每個類別的方差
下面舉例說明:
'''創(chuàng)建訓(xùn)練的數(shù)據(jù)集''' from sklearn.datasets import make_blobs data, label = make_blobs(n_features=2, n_samples=100, centers=2, random_state=2019, cluster_std=[0.6,0.7] )
看看生成的數(shù)據(jù)集:
data
有2個特征(n_features=2
),樣本個數(shù)是100(n_samples=100)
再看看生成的label:
label只有0或者1(centers=2),維度是100
random_state
給定數(shù)值后,每次生成的數(shù)據(jù)集就是固定的,方便后期復(fù)現(xiàn),默認(rèn)的是每次隨機生成,要注意一下!!
好了,這樣我們就擁有了一個自己想要的數(shù)據(jù)集,然后就可以開始后續(xù)的一些工作了?。。?!
到此這篇關(guān)于sklearn
中make_blobs
的用法詳情的文章就介紹到這了,更多相關(guān)sklearn
中make_blobs
的用法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決
這篇文章主要介紹了Jupyter Notebook/VSCode導(dǎo)出PDF中文不顯示的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-06-06使用Python監(jiān)控文件內(nèi)容變化代碼實例
在python中文件監(jiān)控主要有兩個庫,一個是pyinotify,一個是watchdog。pyinotify依賴于Linux平臺的inotify,今天我們就來探討下pyinotify.2018-06-06使用Pytorch Geometric進行鏈接預(yù)測的實現(xiàn)代碼
PyTorch Geometric (PyG)是構(gòu)建圖神經(jīng)網(wǎng)絡(luò)模型和實驗各種圖卷積的主要工具,在本文中我們將通過鏈接預(yù)測來對其進行介紹,文中有詳細(xì)的代碼示例供大家參考,需要的朋友可以參考下2023-10-10使用Python的OpenCV模塊識別滑動驗證碼的缺口(推薦)
這篇文章主要介紹了使用Python的OpenCV模塊識別滑動驗證碼的缺口,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-05-05Python機器學(xué)習(xí)應(yīng)用之基于線性判別模型的分類篇詳解
線性判別分析(Linear?Discriminant?Analysis,?LDA)是一種監(jiān)督學(xué)習(xí)的降維方法,也就是說數(shù)據(jù)集的每個樣本是有類別輸出。和之前介紹的機器學(xué)習(xí)降維之主成分分析(PCA)方法不同,PCA是不考慮樣本類別輸出的無監(jiān)督學(xué)習(xí)方法2022-01-01python通過微信發(fā)送郵件實現(xiàn)電腦關(guān)機
這篇文章主要為大家詳細(xì)介紹了python通過微信發(fā)送郵件實現(xiàn)電腦關(guān)機,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-06-06