欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實現(xiàn)從概率分布中隨機采樣

 更新時間:2021年12月07日 08:56:37   作者:orion-orion  
這篇文章主要介紹了通過幾個機器學(xué)習(xí)中最常用的概率分布為例,來看看如何從一個概率分布中采樣,文章中的代碼對我們的工作或?qū)W習(xí)具有一定價值,感興趣的朋友可以了解一下

在上一篇博文《Python中的隨機采樣和概率分布(一)》中,我們介紹了Python中最簡單的隨機采樣函數(shù)。接下來我們更進一步,來看看如何從一個概率分布中采樣,我們以幾個機器學(xué)習(xí)中最常用的概率分布為例。

1. 二項(binomial)/伯努利(Bernoulli)分布

1.1 概率質(zhì)量函數(shù)(pmf)

當n=1時,則取到下列極限情況,是為參數(shù)為p的二項分布:

二項分布P(X=x; n, p)可以表示進行獨立重復(fù)試驗n次,每次有兩成功和失敗可能結(jié)果(分別對應(yīng)概率p和1?p),共成功x次的概率。

1.2 函數(shù)原型

random.binomial(n, p, size=None)

參數(shù):

n: int or array_like of ints ? 對應(yīng)分布函數(shù)中的參數(shù) n,>=0,浮點數(shù)會被截斷為整形。

p: float or array_like of floats ? 對應(yīng)分布函數(shù)參數(shù)p, >=0并且<=1。

size: int or tuple of ints, optional ? 如果給定形狀為(m,n,k),那么m×n×k個隨機樣本會從中抽取。默認為None,即返回一個一個標量隨機樣本。

返回:

out: ndarray or scalar? 從帶參數(shù)的概率分布中采的隨機樣本,每個樣本表示獨立重復(fù)實驗n次中成功的次數(shù)。

1.3 使用樣例

設(shè)進行獨立重復(fù)實驗10次,每次成功概率為0.5,采樣樣本表示總共的成功次數(shù)(相當于扔10次硬幣,正面朝上的次數(shù))??偣膊?0個樣本。

import numpy as np
n, p = 10, .5  
s = np.random.binomial(n, p, 20)
print(s) # [4 5 6 5 4 2 4 6 7 2 4 4 2 4 4 7 6 3 5 6]

可以粗略的看到,樣本幾乎都在5周圍上下波動。

我們來看一個有趣的例子。一家公司鉆了9口井,每口井成功的概率為0.1,所有井都失敗了,發(fā)生這種情況的概率是多少?

我們總共采樣2000次,來看下產(chǎn)生0結(jié)果的概率。

s = sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.
print(s) # 0.3823

可見,所有井失敗的概率為0.3823,這個概率還是蠻大的。

2. 多項(multinomial)分布

2.1 概率質(zhì)量函數(shù)(pmf)

當k=2時,則取到下列極限情況,是為參數(shù)為n, p的二項分布:

也就是說,多項分布式二項分布的推廣:仍然是獨立重復(fù)實驗n次,但每次不只有成功和失敗兩種結(jié)果,而是k種可能的結(jié)果,每種結(jié)果的概率為pi。多項分布是一個隨機向量的分布,x=(x1,x2,...,xk)意為第i種結(jié)果出現(xiàn)xi次,P(X=x; n, p)也就表示第i種結(jié)果出現(xiàn)xi次的概率。

2.2 函數(shù)原型

random.multinomial(n, pvals, size=None)

參數(shù):

n: int ? 對應(yīng)分布函數(shù)中的參數(shù) n。

pvals: sequence of floats ? 對應(yīng)分布函數(shù)參數(shù)p, 其長度等于可能的結(jié)果數(shù)k,并且有0?pi?1。

size: int or tuple of ints, optional ? 為輸出形狀大小,因為采出的每個樣本是一個隨機向量,默認最后一維會自動加上k,如果給定形狀為(m,n),那么m×n個維度為k的隨機向量會從中抽取。默認為None,即返回一個一個k維的隨機向量。

返回:

out: ndarray ? 從帶參數(shù)的概率分布中采的隨機向量,長度為可能的結(jié)果數(shù)k,如果沒有給定 size,則shape為 (k,)

2.3 使用樣例

設(shè)進行獨立重復(fù)實驗20次,每次情況的概率為1/6,采樣出的隨機向量表示每種情況出現(xiàn)次數(shù)(相當于扔20次六面骰子,點數(shù)為0, 1, 2, ..., 5出現(xiàn)的次數(shù))??偣膊?個樣本。

s = np.random.multinomial(20, [1/6.]*6, size=1)
print(s) # [[4 2 2 3 5 4]]

當然,如果不指定size,它直接就會返回一個一維向量了

s = np.random.multinomial(20, [1/6.]*6)
print(s) # [4 1 4 3 5 3]

如果像進行多次采樣,改變 size即可:

s = np.random.multinomial(20, [1/6.]*6, size=(2, 2))
print(s)
# [[[4 3 4 2 6 1]
#   [5 2 1 6 3 3]]

#  [[5 4 1 1 6 3]
#   [2 5 2 5 4 2]]]

這個函數(shù)在論文<sup>[1]</sup>的實現(xiàn)代碼<sup>[2]</sup>中用來設(shè)置每一個 client分得的樣本數(shù):

for cluster_id in range(n_clusters): 
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)
    # 一共扔clusters_sizes[cluster_id]次篩子,該函數(shù)返回骰子落在某個client上各多少次,也就對應(yīng)著該client應(yīng)該分得的樣本數(shù)

3.均勻(uniform)分布

3.1 概率密度函數(shù)(pdf)

均勻分布可用于隨機地從連續(xù)區(qū)間[a,b)內(nèi)進行采樣。

3.2 函數(shù)原型

random.uniform(low=0.0, high=1.0, size=None)

參數(shù):

low: float or array_like of floats, optional ? 對應(yīng)分布函數(shù)中的下界參數(shù) a,默認為0。

high: float or array_like of floats ? 對應(yīng)分布函數(shù)中的下界參數(shù) b,默認為1.0。

size: int or tuple of ints, optional ? 為輸出形狀大小,如果給定形狀為(m,n,k),那么m×n×k的樣本會從中抽取。默認為None,即返回一個單一標量。

返回:

out: ndarray or scalar ? 從帶參數(shù)的均勻分布中采的隨機樣本

3.3 使用樣例

s = np.random.uniform(-1,0,10)
print(s)
# [-0.9479594  -0.86158902 -0.63754099 -0.0883407  -0.92845644 -0.11148294
#  -0.19826197 -0.77396765 -0.26809953 -0.74734785]

4. 狄利克雷(Dirichlet)分布

4.1 概率密度函數(shù)(pdf)

4.2 函數(shù)原型

random.dirichlet(alpha, size=None)

參數(shù):

alpha: sequence of floats, length k ? 對應(yīng)分布函數(shù)中的參數(shù)向量 α,長度為k。

size: int or tuple of ints, optional ? 為輸出形狀大小,因為采出的每個樣本是一個隨機向量,默認最后一維會自動加上k,如果給定形狀為(m,n),那么m×n個維度為k的隨機向量會從中抽取。默認為None,即返回一個一個k維的隨機向量。

返回:

out: ndarray ? 采出的樣本,大小為(size,k)。

4.3 使用樣例

設(shè)α=(10,5,3)(意味著k=3),size=(2,2),則采出的樣本為2×2個維度為k=3的隨機向量。

s = np.random.dirichlet((10, 5, 3), size=(2, 2))
print(s)
# [[[0.82327647 0.09820451 0.07851902]
#   [0.50861077 0.4503409  0.04104833]]

#  [[0.31843167 0.22436547 0.45720285]
#   [0.40981943 0.40349597 0.1866846 ]]]

這個函數(shù)在論文[1]的實現(xiàn)代碼[2]中用來生成符合狄利克雷分布的權(quán)重向量

for cluster_id in range(n_clusters): 
    # 為每個client生成一個權(quán)重向量,文章中分布參數(shù)alpha每一維都相同
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)

參考文獻

[1] Marfoq O, Neglia G, Bellet A, et al. Federated multi-task learning under a mixture of distributions[J]. Advances in Neural Information Processing Systems, 2021, 34.

[2] https://github.com/omarfoq/FedEM

[3] https://www.python.org/

[4] https://numpy.org/

到此這篇關(guān)于Python實現(xiàn)從概率分布中隨機采樣的文章就介紹到這了,更多相關(guān)Python 概率分布 隨機采樣內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python面向?qū)ο笾惡蛯ο髮傩缘脑鰟h改查操作示例

    Python面向?qū)ο笾惡蛯ο髮傩缘脑鰟h改查操作示例

    這篇文章主要介紹了Python面向?qū)ο笾惡蛯ο髮傩缘脑鰟h改查操作,結(jié)合實例形式分析了Python面向?qū)ο笙嚓P(guān)的類與對象屬性常見操作技巧,需要的朋友可以參考下
    2018-12-12
  • GoReplay中間件python版本使用教程

    GoReplay中間件python版本使用教程

    GoReplay 是一個用于網(wǎng)絡(luò)流量錄制和回放的工具,它可以用于測試和優(yōu)化分布式系統(tǒng),這篇文章主要介紹了GoReplay中間件python版本使用教程,需要的朋友可以參考下
    2024-02-02
  • Ubuntu20下的Django安裝的方法步驟

    Ubuntu20下的Django安裝的方法步驟

    這篇文章主要介紹了Ubuntu20下的Django安裝的方法步驟,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • python基礎(chǔ)教程之udp端口掃描

    python基礎(chǔ)教程之udp端口掃描

    開發(fā)一個程序,用于獲取局域網(wǎng)中開啟snmp服務(wù)的主機ip地址列表,并寫入相應(yīng)文件以便其它程序使用。下面是實現(xiàn)方法
    2014-02-02
  • python通過txt文件批量安裝依賴包的實現(xiàn)步驟

    python通過txt文件批量安裝依賴包的實現(xiàn)步驟

    今天小編就為大家分享一篇python通過txt文件批量安裝依賴包的實現(xiàn)步驟,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • 解決Python傳遞中文參數(shù)的問題

    解決Python傳遞中文參數(shù)的問題

    這篇文章主要介紹了解決Python傳遞中文參數(shù)的問題的相關(guān)資料,需要的朋友可以參考下
    2015-08-08
  • Scrapy爬蟲Response子類在應(yīng)用中的問題解析

    Scrapy爬蟲Response子類在應(yīng)用中的問題解析

    這篇文章主要為大家介紹了Scrapy爬蟲Response它的子類(TextResponse、HtmlResponse、XmlResponse)在應(yīng)用問題解析
    2023-05-05
  • tensorflow estimator 使用hook實現(xiàn)finetune方式

    tensorflow estimator 使用hook實現(xiàn)finetune方式

    今天小編就為大家分享一篇tensorflow estimator 使用hook實現(xiàn)finetune方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • 詳解Python中的多線程編程

    詳解Python中的多線程編程

    這篇文章主要介紹了詳解Python中的多線程編程,Python中的多線程一直是Python學(xué)習(xí)中的重點和難點,要反復(fù)鞏固!需要的朋友可以參考下
    2015-04-04
  • Python基于sklearn庫的分類算法簡單應(yīng)用示例

    Python基于sklearn庫的分類算法簡單應(yīng)用示例

    這篇文章主要介紹了Python基于sklearn庫的分類算法,結(jié)合簡單實例形式分析了Python使用sklearn庫封裝樸素貝葉斯、K近鄰、邏輯回歸、SVM向量機等常見機器學(xué)習(xí)算法的分類調(diào)用相關(guān)操作技巧,需要的朋友可以參考下
    2018-07-07

最新評論