python sklearn中tsne算法降維結(jié)果不一致問題的解決方法
背景
最近在做一個(gè)文本聚類的分析,在對(duì)文本數(shù)據(jù)embedding后,想著看下數(shù)據(jù)的分布,于是用sklearn的TSNE算法來降維embedding后的數(shù)據(jù)結(jié)果。當(dāng)在多次執(zhí)行后,竟發(fā)現(xiàn)TSNE的結(jié)果竟然變了,而且每次都不一樣。
主要的邏輯就是用的下面兩行函數(shù):
tsne = TSNE(n_components=2) decomposition_data = tsne.fit_transform(embeddings)
解決流程
之前只是在網(wǎng)上隨便找了個(gè)做TSNE的博客,粘了這兩行代碼就跑結(jié)果了,出現(xiàn)了這個(gè)問題后,決定還是得好好看看sklearn中的官方文檔。官網(wǎng)鏈接:https://scikit-learn.org/0.16/modules/generated/sklearn.manifold.TSNE.html
sklearn的相關(guān)參數(shù)說明如下圖所示:

有一個(gè)參數(shù),"random_state", 我用紅框標(biāo)出了。TSNE在運(yùn)算的時(shí)候,會(huì)初始化一個(gè)隨機(jī)的種子點(diǎn),如果沒有指定該參數(shù)的話,默認(rèn)該參數(shù)為None,同時(shí)會(huì)使用mumpy.random隨機(jī)生成一個(gè)數(shù)作為種子點(diǎn)。這也是導(dǎo)致每次生成的TSE降維結(jié)果都是不一致的原因。
所以后面的解決方案就很簡(jiǎn)單了。將random_states隨便賦予一個(gè)固定值就好了。我這次就把random_state設(shè)置成了0了,將上述代碼改為:
tsne = TSNE(n_components=2, random_state=0) decomposition_data = tsne.fit_transform(embeddings)
問題解決。
以上就是python sklearn中tsne算法降維結(jié)果不一致問題的解決方法的詳細(xì)內(nèi)容,更多關(guān)于python tsne算法降維結(jié)果不一致的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python如何實(shí)現(xiàn)復(fù)制目錄到指定目錄
這篇文章主要為大家介紹了python如何實(shí)現(xiàn)復(fù)制目錄到指定目錄,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-02-02
Django權(quán)限設(shè)置及驗(yàn)證方式
這篇文章主要介紹了Django權(quán)限設(shè)置及驗(yàn)證方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-05-05
關(guān)于python的縮進(jìn)規(guī)則的知識(shí)點(diǎn)詳解
在本篇文章里小編給大家整理了關(guān)于python的縮進(jìn)規(guī)則的知識(shí)點(diǎn)詳解,有興趣的朋友們可以學(xué)習(xí)下。2020-06-06
PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比
這篇文章主要介紹了PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比,很多經(jīng)常會(huì)用到數(shù)據(jù)分析的伙伴會(huì)問有沒有一款便捷好用的工具!肯定有啊,Python的出現(xiàn)和普及,很容易就能改變這些窘境,需要的朋友可以參考下2019-07-07
解決Python3 控制臺(tái)輸出InsecureRequestWarning問題
這篇文章主要介紹了解決Python3 控制臺(tái)輸出InsecureRequestWarning的問題 ,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07
Python使用fastAPI如何實(shí)現(xiàn)一個(gè)流式傳輸接口
這篇文章主要介紹了Python使用fastAPI如何實(shí)現(xiàn)一個(gè)流式傳輸接口問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06
OpenCV+Python識(shí)別車牌和字符分割的實(shí)現(xiàn)
這篇文章主要介紹了OpenCV+Python識(shí)別車牌和字符分割的實(shí)現(xiàn),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2019-01-01
python實(shí)現(xiàn)自動(dòng)重啟本程序的方法
這篇文章主要介紹了python實(shí)現(xiàn)自動(dòng)重啟本程序的方法,涉及Python進(jìn)程操作的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-07-07

