python簡單批量梯度下降代碼
簡單批量梯度下降代碼
其中涉及到公式
alpha表示超參數(shù),由外部設定。過大則會出現(xiàn)震蕩現(xiàn)象,過小則會出現(xiàn)學習速度變慢情況,因此alpha應該不斷的調(diào)整改進。
注意1/m前正負號的改變
Xj的意義為j個維度的樣本。
下面為代碼部分
import numpy as np #該處數(shù)據(jù)和linear_model中數(shù)據(jù)相同 x = np.array([4,8,5,10,12]) y = np.array([20,50,30,70,60]) #一元線性回歸 即 h_theta(x)= y= theta0 +theta1*x #初始化系數(shù),最開始要先初始化theta0 和theta1 theta0,theta1 = 0,0 #最開始梯度下降法中也有alpha 為超參數(shù),提前初始化為0.01 alpha = 0.01 #樣本的個數(shù) ,在梯度下降公式中有x m = len(x) #設置停止條件,即梯度下降到滿足實驗要求時即可停止。 # 方案1:設置迭代次數(shù),如迭代5000次后停止。 #(此處為2)方案2:設置epsilon,計算mse(均方誤差,線性回歸指標之一)的誤差,如果mse的誤差《= epsilon,即停止 #在更改epsilon的次數(shù)后,越小,迭代次數(shù)會越多,結(jié)果更加準確。 epsilon = 0.00000001 #設置誤差 error0,error1 = 0,0 #計算迭代次數(shù) cnt = 0 def h_theta_x(x): return theta0+theta1*x #接下來開始各種迭代 #"""用while 迭代""" while True: cnt+=1 diff=[0,0] #該處為梯度,設置了兩個梯度后再進行迭代,梯度每次都會清零后再進行迭代 for i in range(m): diff[0]+=(y[i]-h_theta_x(x[i]))*1 diff[1]+=(y[i]-h_theta_x(x[i]))*x[i] theta0 = theta0 + alpha * diff[0] / m theta1 = theta1 + alpha * diff[1] / m #輸出theta值 # ”%s“表示輸出的是輸出字符串。格式化 print("theta0:%s,theta1:%s"%(theta0,theta1)) #計算mse for i in range(m): error1 +=(y[i]-h_theta_x(x[i]))**2 error1/=m if(abs(error1-error0)<=epsilon): break else: error0 = error1 print("迭代次數(shù):%s"%cnt) #線性回歸結(jié)果:5.714285714285713 1.4285714285714448 87.14285714285714 #批量梯度下降結(jié)果:theta0:1.4236238440026219,theta1:5.71483960227916 迭代次數(shù):3988 #在更改epsilon的次數(shù)后,越小,迭代次數(shù)會越多,結(jié)果更加準確。
在線性模型的代碼(代碼可參見另一條文章)中,得到運算結(jié)果a,b的值,與梯度下降后得到的結(jié)果theta0和theta1相近。增加實驗次數(shù)(如修改epsilon的次數(shù))可以得到更為相近的結(jié)果。
運行完畢后發(fā)現(xiàn)其實該處理方式并不理想
因為梯度下降開始后,theta數(shù)量會增加,即變量也會增加。每次增加都需要重新編寫其中的循環(huán)和函數(shù)。
因此可以將他們編寫成向量的形式
import numpy as np #X_b = np.array([[1,4],[1,8],[1,5],[1,10],[1,12]]) #y = np.array([20,50,30,70,60]) #改寫成向量形式 #運用random隨機生成100個樣本 np.random.seed(1) X = 2 * np.random.rand(100, 1) y = 4 + 3 * X + np.random.rand(100, 1) X_b = np.c_[np.ones((100, 1)), X] #print(X_b) #此處的learning_rate 就是alpha learning_rate = 0.01 #設置最大迭代次數(shù),避免學習時間過長 n_iterations = 10000 #樣本格數(shù) m = 100 #初始化thata, w0...wn,初始化兩個2*1 的隨機數(shù) theta = np.random.randn(2, 1) #不會設置閾值,直接設置超參數(shù),迭代次數(shù),迭代次數(shù)到了,我們就認為收斂了。先看結(jié)果,如果結(jié)果不好就去調(diào)參 for _ in range(n_iterations): #接著求梯度gradient,這兒的梯度是n個梯度。即x* (h_theta - y) #會得到一次迭代的n個theta值 gradients = 1/m * X_b.T.dot(X_b.dot(theta)-y) #應用公式調(diào)整theta的值,theta_t + 1 = theta_t - grad * learning_rate , 是一個向量 theta = theta - learning_rate * gradients print(theta)
到此這篇關于python簡單批量梯度下降代碼的文章就介紹到這了,更多相關python梯度下降內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
numpy ndarray 按條件篩選數(shù)組,關聯(lián)篩選的例子
今天小編就為大家分享一篇numpy ndarray 按條件篩選數(shù)組,關聯(lián)篩選的例子,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11Python實現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之鏈表詳解
這篇文章主要介紹了Python實現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之鏈表,詳細分析了鏈表的概念、定義及Python實現(xiàn)與使用鏈表的相關技巧,非常具有實用價值,需要的朋友可以參考下2015-04-04詳解Pandas中stack()和unstack()的使用技巧
當你在處理包含某種序列(例如時間序列數(shù)據(jù))的變量的數(shù)據(jù)集時,數(shù)據(jù)通常需要進行重塑。Pandas?提供了各種用于重塑?DataFrame?的內(nèi)置方法。其中,stack()?和?unstack()?是最流行的,本文總結(jié)了這兩個方法的7種使用技巧,需要的可以參考一下2022-03-03