使用Python實(shí)現(xiàn)正態(tài)分布、正態(tài)分布采樣
多元正態(tài)分布(多元高斯分布)
直接從多元正態(tài)分布講起。多元正態(tài)分布公式如下:
這就是多元正態(tài)分布的定義,均值好理解,就是高斯分布的概率分布值最大的位置,進(jìn)行采樣時(shí)也就是采樣的中心點(diǎn)。而協(xié)方差矩陣在多維上形式較多。
協(xié)方差矩陣
一般來(lái)說(shuō),協(xié)方差矩陣有三種形式,分別稱為球形、對(duì)角和全協(xié)方差。以二元為例:
為了方便展示不同協(xié)方差矩陣的效果,我們以二維為例。(書(shū)上截的圖,湊活著看吧,是在不想畫(huà)圖了)
其實(shí)從這個(gè)圖上可以很好的看出,協(xié)方差矩陣對(duì)正態(tài)分布的影響,也就很好明白了這三個(gè)協(xié)方差矩陣是哪里來(lái)的名字了??梢钥闯觯蛐螀f(xié)方差矩陣,會(huì)產(chǎn)生圓形(二維)或者球形(三維)的等高線,對(duì)角協(xié)方差矩陣和全協(xié)方差矩陣,會(huì)產(chǎn)生橢圓形的等高線。更一般地,在一個(gè)D維空間中,球形協(xié)方差矩陣,會(huì)產(chǎn)生一個(gè)D維球面等高線;對(duì)角協(xié)方差矩陣,會(huì)產(chǎn)生一個(gè)坐標(biāo)軸對(duì)其的橢球型等高線;全協(xié)方差矩陣,會(huì)在任意位置產(chǎn)生一個(gè)坐標(biāo)軸對(duì)其的橢球型等高線。
當(dāng)協(xié)方差矩陣是球形的或者是對(duì)角的,單獨(dú)的變量之間是獨(dú)立的
協(xié)方差分解
時(shí)間不足,具體解釋以后再補(bǔ)
下面是協(xié)方差分解的原理圖
變量的線性變換(正態(tài)分布采樣原理)
python實(shí)現(xiàn)
多元正態(tài)分布在python的numpy庫(kù)中有很方便一個(gè)函數(shù):
np.random.multivariate_normal(mean=mean, cov=conv, size=N)
這個(gè)函數(shù)中,mean代表均值,是在每個(gè)維度中的均值。cov代表協(xié)方差矩陣,就像上面講的那種形式,協(xié)方差矩陣值的大小將決定采樣范圍的大小。size代表需要采樣生成的點(diǎn)數(shù),此時(shí)輸出大小為(N*D)的坐標(biāo)矩陣。
另外,其他參數(shù)包括:check_valid,這個(gè)參數(shù)用于決定當(dāng)cov即協(xié)方差矩陣不是半正定矩陣時(shí)程序的處理方式,它一共有三個(gè)值:warn,raise以及ignore。當(dāng)使用warn作為傳入的參數(shù)時(shí),如果cov不是半正定的程序會(huì)輸出警告但仍舊會(huì)得到結(jié)果;當(dāng)使用raise作為傳入的參數(shù)時(shí),如果cov不是半正定的程序會(huì)報(bào)錯(cuò)且不會(huì)計(jì)算出結(jié)果;當(dāng)使用ignore時(shí)忽略這個(gè)問(wèn)題即無(wú)論cov是否為半正定的都會(huì)計(jì)算出結(jié)果
tol:檢查協(xié)方差矩陣奇異值時(shí)的公差,float類型。
下面是一個(gè)小demo
import numpy as np import matplotlib.pyplot as plt mean = np.array([2,1]) # 均值 conv = np.array([[0.5, 0.0], # 協(xié)方差矩陣 [0.0, 0.5]]) axis = np.random.multivariate_normal(mean=mean, cov=conv, size=200) x, y = np.random.multivariate_normal(mean=mean, cov=conv, size=1000).T # print(axis[:]) plt.plot(axis[:, 0], axis[:, 1], 'ro') plt.show() plt.plot(x, y, 'ro') plt.show()
注意,單獨(dú)取出每個(gè)坐標(biāo)軸的坐標(biāo)數(shù)組時(shí),需要在最后加上.T,否則會(huì)報(bào)錯(cuò) 效果展示:
協(xié)方差值的大小對(duì)采樣的影響:
mean = np.array([2,1]) # 均值 conv = np.array([[0.5, 0.0], # 協(xié)方差矩陣 [0.0, 0.5]]) conv2 = np.array([[10, 0.0], # 協(xié)方差矩陣 [0.0, 10]]) axis = np.random.multivariate_normal(mean=mean, cov=conv, size=200) x, y = np.random.multivariate_normal(mean=mean, cov=conv2, size=200).T # print(axis[:]) plt.plot(axis[:, 0], axis[:, 1], 'ro') plt.show() plt.plot(x, y, 'ro') plt.show()
效果如下:
這里沒(méi)有設(shè)定隨機(jī)種子店,每次隨機(jī)數(shù)會(huì)有所不同。
以上這篇使用Python實(shí)現(xiàn)正態(tài)分布、正態(tài)分布采樣就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
簡(jiǎn)單掌握Python中g(shù)lob模塊查找文件路徑的用法
glob模塊遵循Unix的shell規(guī)則來(lái)匹配文件名進(jìn)行文件查找,下面我們結(jié)合匹配相關(guān)的字符區(qū)間與通配符知識(shí),來(lái)簡(jiǎn)單掌握Python中g(shù)lob模塊查找文件路徑的用法2016-07-07Pycharm下載pyinstaller報(bào)錯(cuò):You?should?consider?upgrading?via
這篇文章主要給大家介紹了關(guān)于Pycharm下載pyinstaller報(bào)錯(cuò):You?should?consider?upgrading?via?the?'python?-m?pip?install?--upgrade?pip'?command的解決方法,需要的朋友可以參考下2022-02-02Django request.META.get()獲取不到header頭的原因分析
這篇文章主要介紹了Django request.META.get()獲取不到header頭的原因分析,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04詳解在python操作數(shù)據(jù)庫(kù)中游標(biāo)的使用方法
這篇文章主要介紹了在python操作數(shù)據(jù)庫(kù)中游標(biāo)的使用方法,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-11-11Python中4種實(shí)現(xiàn)數(shù)值的交換方式
這篇文章主要介紹了Python中4種實(shí)現(xiàn)數(shù)值的交換方式,文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-08-08python 時(shí)間 T 去掉 帶上ms 毫秒 時(shí)間格式的操作
這篇文章主要介紹了python 時(shí)間 T 去掉 帶上ms 毫秒 時(shí)間格式的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04Python中10個(gè)常用的內(nèi)置函數(shù)詳解
這篇文章主要為大家介紹了Python常用的內(nèi)置函數(shù),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助2021-12-12