快捷導(dǎo)航

python sklearn中tsne算法降維結(jié)果不一致問題的解決方法

更新時(shí)間：2023年10月17日 10:50:57 作者：菠蘿哥~

最近在做一個(gè)文本聚類的分析,在對(duì)文本數(shù)據(jù)embedding后,想著看下數(shù)據(jù)的分布,于是用sklearn的TSNE算法來降維embedding后的數(shù)據(jù)結(jié)果,當(dāng)在多次執(zhí)行后,竟發(fā)現(xiàn)TSNE的結(jié)果竟然變了,而且每次都不一樣,所以本文就給大家講講如何解決sklearn中tsne算法降維結(jié)果不一致的問題

背景

最近在做一個(gè)文本聚類的分析，在對(duì)文本數(shù)據(jù)embedding后，想著看下數(shù)據(jù)的分布，于是用sklearn的TSNE算法來降維embedding后的數(shù)據(jù)結(jié)果。當(dāng)在多次執(zhí)行后，竟發(fā)現(xiàn)TSNE的結(jié)果竟然變了，而且每次都不一樣。

主要的邏輯就是用的下面兩行函數(shù)：

tsne = TSNE(n_components=2)
decomposition_data = tsne.fit_transform(embeddings)

解決流程

之前只是在網(wǎng)上隨便找了個(gè)做TSNE的博客，粘了這兩行代碼就跑結(jié)果了，出現(xiàn)了這個(gè)問題后，決定還是得好好看看sklearn中的官方文檔。官網(wǎng)鏈接：https://scikit-learn.org/0.16/modules/generated/sklearn.manifold.TSNE.html

sklearn的相關(guān)參數(shù)說明如下圖所示：

有一個(gè)參數(shù)，"random_state", 我用紅框標(biāo)出了。TSNE在運(yùn)算的時(shí)候，會(huì)初始化一個(gè)隨機(jī)的種子點(diǎn)，如果沒有指定該參數(shù)的話，默認(rèn)該參數(shù)為None，同時(shí)會(huì)使用mumpy.random隨機(jī)生成一個(gè)數(shù)作為種子點(diǎn)。這也是導(dǎo)致每次生成的TSE降維結(jié)果都是不一致的原因。

所以后面的解決方案就很簡(jiǎn)單了。將random_states隨便賦予一個(gè)固定值就好了。我這次就把random_state設(shè)置成了0了，將上述代碼改為：

tsne = TSNE(n_components=2, random_state=0)
decomposition_data = tsne.fit_transform(embeddings)

問題解決。

以上就是python sklearn中tsne算法降維結(jié)果不一致問題的解決方法的詳細(xì)內(nèi)容，更多關(guān)于python tsne算法降維結(jié)果不一致的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

相關(guān)文章

python如何實(shí)現(xiàn)復(fù)制目錄到指定目錄
這篇文章主要為大家介紹了python如何實(shí)現(xiàn)復(fù)制目錄到指定目錄，文中示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2020-02-02
Django權(quán)限設(shè)置及驗(yàn)證方式
這篇文章主要介紹了Django權(quán)限設(shè)置及驗(yàn)證方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
關(guān)于python的縮進(jìn)規(guī)則的知識(shí)點(diǎn)詳解
在本篇文章里小編給大家整理了關(guān)于python的縮進(jìn)規(guī)則的知識(shí)點(diǎn)詳解，有興趣的朋友們可以學(xué)習(xí)下。
2020-06-06
Python+Pygame繪制小球的實(shí)例詳解
這篇文章主要為大家詳細(xì)介紹了如何利用Python?Pygame繪制小球（漸變大的小球、自由下落的小球、循環(huán)上下反彈的小球），感興趣的小伙伴可以了解一下
2022-10-10
PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比
這篇文章主要介紹了PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比，很多經(jīng)常會(huì)用到數(shù)據(jù)分析的伙伴會(huì)問有沒有一款便捷好用的工具！肯定有啊，Python的出現(xiàn)和普及，很容易就能改變這些窘境,需要的朋友可以參考下
2019-07-07
Python中函數(shù)的參數(shù)類型詳解
這篇文章主要介紹了Python中函數(shù)的參數(shù)類型詳解，文章圍繞主題展開詳細(xì)的內(nèi)容介紹，具有一定的參考價(jià)值，需要的小伙伴可以參考一下
2022-07-07
解決Python3 控制臺(tái)輸出InsecureRequestWarning問題
這篇文章主要介紹了解決Python3 控制臺(tái)輸出InsecureRequestWarning的問題，本文給大家介紹的非常詳細(xì)，具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
2019-07-07
Python使用fastAPI如何實(shí)現(xiàn)一個(gè)流式傳輸接口
這篇文章主要介紹了Python使用fastAPI如何實(shí)現(xiàn)一個(gè)流式傳輸接口問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
2024-06-06
OpenCV+Python識(shí)別車牌和字符分割的實(shí)現(xiàn)
這篇文章主要介紹了OpenCV+Python識(shí)別車牌和字符分割的實(shí)現(xiàn)，小編覺得挺不錯(cuò)的，現(xiàn)在分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧
2019-01-01
python實(shí)現(xiàn)自動(dòng)重啟本程序的方法
這篇文章主要介紹了python實(shí)現(xiàn)自動(dòng)重啟本程序的方法,涉及Python進(jìn)程操作的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
2015-07-07