python sklearn中tsne算法降維結(jié)果不一致問題的解決方法
背景
最近在做一個文本聚類的分析,在對文本數(shù)據(jù)embedding后,想著看下數(shù)據(jù)的分布,于是用sklearn的TSNE算法來降維embedding后的數(shù)據(jù)結(jié)果。當在多次執(zhí)行后,竟發(fā)現(xiàn)TSNE的結(jié)果竟然變了,而且每次都不一樣。
主要的邏輯就是用的下面兩行函數(shù):
tsne = TSNE(n_components=2) decomposition_data = tsne.fit_transform(embeddings)
解決流程
之前只是在網(wǎng)上隨便找了個做TSNE的博客,粘了這兩行代碼就跑結(jié)果了,出現(xiàn)了這個問題后,決定還是得好好看看sklearn中的官方文檔。官網(wǎng)鏈接:https://scikit-learn.org/0.16/modules/generated/sklearn.manifold.TSNE.html
sklearn的相關(guān)參數(shù)說明如下圖所示:
有一個參數(shù),"random_state", 我用紅框標出了。TSNE在運算的時候,會初始化一個隨機的種子點,如果沒有指定該參數(shù)的話,默認該參數(shù)為None,同時會使用mumpy.random隨機生成一個數(shù)作為種子點。這也是導(dǎo)致每次生成的TSE降維結(jié)果都是不一致的原因。
所以后面的解決方案就很簡單了。將random_states隨便賦予一個固定值就好了。我這次就把random_state設(shè)置成了0了,將上述代碼改為:
tsne = TSNE(n_components=2, random_state=0) decomposition_data = tsne.fit_transform(embeddings)
問題解決。
以上就是python sklearn中tsne算法降維結(jié)果不一致問題的解決方法的詳細內(nèi)容,更多關(guān)于python tsne算法降維結(jié)果不一致的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
關(guān)于python的縮進規(guī)則的知識點詳解
在本篇文章里小編給大家整理了關(guān)于python的縮進規(guī)則的知識點詳解,有興趣的朋友們可以學(xué)習下。2020-06-06PowerBI和Python關(guān)于數(shù)據(jù)分析的對比
這篇文章主要介紹了PowerBI和Python關(guān)于數(shù)據(jù)分析的對比,很多經(jīng)常會用到數(shù)據(jù)分析的伙伴會問有沒有一款便捷好用的工具!肯定有啊,Python的出現(xiàn)和普及,很容易就能改變這些窘境,需要的朋友可以參考下2019-07-07解決Python3 控制臺輸出InsecureRequestWarning問題
這篇文章主要介紹了解決Python3 控制臺輸出InsecureRequestWarning的問題 ,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-07-07Python使用fastAPI如何實現(xiàn)一個流式傳輸接口
這篇文章主要介紹了Python使用fastAPI如何實現(xiàn)一個流式傳輸接口問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-06-06OpenCV+Python識別車牌和字符分割的實現(xiàn)
這篇文章主要介紹了OpenCV+Python識別車牌和字符分割的實現(xiàn),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-01-01