Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)
摘要:
NumPy中包含大量的函數(shù),這些函數(shù)的設(shè)計(jì)初衷是能更方便地使用,掌握解這些函數(shù),可以提升自己的工作效率。這些函數(shù)包括數(shù)組元素的選取和多項(xiàng)式運(yùn)算等。下面通過實(shí)例進(jìn)行詳細(xì)了解。
前述通過對某公司股票的收盤價(jià)的分析,了解了某些Numpy的一些函數(shù)。通常實(shí)際中,某公司的股價(jià)被另外一家公司的股價(jià)緊緊跟隨,它們可能是同領(lǐng)域的競爭對手,也可能是同一公司下的不同的子公司??赡芤騼杉夜窘?jīng)營的業(yè)務(wù)類型相同,面臨同樣的挑戰(zhàn),需要相同的原料和資源,并且爭奪同類型的客戶。
實(shí)際中,有很多這樣的例子,如果要檢驗(yàn)一下它們是否真的存在關(guān)聯(lián)。一種方法就是看看兩個(gè)公司股票收益率的相關(guān)性,強(qiáng)相關(guān)性意味著它們之間存在一定的關(guān)聯(lián)性(特別是當(dāng)所用的數(shù)據(jù)不夠充足時(shí),誤差可能更大)
一、股票相關(guān)性分析
1、導(dǎo)出兩個(gè)相關(guān)的股票數(shù)據(jù)():
2、分別從CSV文件中讀入相關(guān)數(shù)據(jù)
close = np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True) new_close = np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)
3、協(xié)方差描述的是兩個(gè)變量共同變化的趨勢,其實(shí)就是歸一化前的相關(guān)系數(shù)。使用 cov 函數(shù)計(jì)算股票收益率的協(xié)方差矩陣,完整代碼如下:
import numpy as np from datetime import datetime import matplotlib.pyplot as plt def datestr2num(s): #定義一個(gè)函數(shù) return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday() close=np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True) #導(dǎo)入data036.csv數(shù)據(jù) new_close=np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)#導(dǎo)入data999.csv數(shù)據(jù) covariance = np.cov(close,new_close) #使用numpy.cov() 函數(shù)計(jì)算兩個(gè)數(shù)列的協(xié)方差矩陣 print(close.mean()) #求close的平均值 print(new_close.mean())#求new_close的平均值 print('covariance:','\n',covariance)
運(yùn)行結(jié)果:
48.40690476190476 18.85157142857143 covariance: [[30.46934553 1.5201865 ] [ 1.5201865 8.96031113]]
1)用 diagonal 函數(shù)查看矩陣對角線上的元素
print ("對角元素:", covariance.diagonal()) # diagonal查看對角上的元素
運(yùn)行結(jié)果:
對角元素: [30.46934553 8.96031113]
2)使用 trace 函數(shù)計(jì)算矩陣的跡,即對角線上元素之和
print("Covariance trace", covariance.trace()) #對角線上元素之和
3)兩個(gè)向量的相關(guān)系數(shù)被定義為協(xié)方差除以各自標(biāo)準(zhǔn)差的乘積。計(jì)算向量 a 和 b 的相關(guān)系數(shù)的公式:corr(a,b)=cov(a,b)/(std(a)*std(b))
covar = covariance/ (np.std(close) * np.std(new_close)) print("相關(guān)系數(shù)矩陣:", covar)
運(yùn)行結(jié)果:
相關(guān)系數(shù)矩陣: [[1.84843969 0.09222295] [0.09222295 0.54358223]]
注意:由于covariance是一個(gè)矩陣,因而得到的covar也是一個(gè)矩陣
相關(guān)系數(shù)是兩只股票的相關(guān)程度。相關(guān)系數(shù)的取值范圍在 -1 到 1 之間。根據(jù)定義,一組數(shù)值與自身的相關(guān)系數(shù)等于 1 ,numpy中使用 corrcoef 函數(shù)計(jì)算相關(guān)系數(shù)
closecorr = np.corrcoef(close,new_close) print("相關(guān)系數(shù):",'\n', closecorr )
運(yùn)行結(jié)果:
相關(guān)系數(shù): [[1. 0.09200338] [0.09200338 1. ]]
對角線上的元素即close和new_close與自身的相關(guān)系數(shù),因此均為1。相關(guān)系數(shù)矩陣是關(guān)于對角線對稱的,因此另外兩個(gè)元素的值相等,表示close和new_close的相關(guān)系數(shù)等于new_close和close的相關(guān)系數(shù)。
判斷兩只股票的價(jià)格走勢是否同步的要點(diǎn)是,它們的差值偏離了平均差值2倍于標(biāo)準(zhǔn)差的距離,則認(rèn)為這兩只股票走勢不同步。代碼如下:
difference = close - new_close avg = np.mean(difference) dev = np.std(difference) print ("Out of sync:", np.abs(difference[-1]-avg)>2*dev)
運(yùn)行結(jié)果:
Out of sync: False
二、多項(xiàng)式
微積分里有泰勒展開,也就是用一個(gè)無窮級數(shù)來表示一個(gè)可微的函數(shù)。實(shí)際上,任何可微的(從而也是連續(xù)的)函數(shù)都可以用一個(gè)N次多項(xiàng)式來估計(jì),而比N次冪更高階的部分為無窮小量可忽略不計(jì)。
NumPy中的 ployfit 函數(shù)可以用多項(xiàng)式去擬合一系列數(shù)據(jù)點(diǎn),無論這些數(shù)據(jù)點(diǎn)是否來自連續(xù)函數(shù)都適用。
繼續(xù)使用close和new_close的股票價(jià)格數(shù)據(jù)。用一個(gè)三次多項(xiàng)式去擬合兩只股票收盤價(jià)的差價(jià)。
t = np.arange(len(close)) #得到close數(shù)列的長度 poly = np.polyfit(t, close - new_close, 3) #利用長度t和兩只股票的價(jià)差,生成一個(gè)三項(xiàng)式,三項(xiàng)式有3個(gè)系數(shù)和一個(gè)常量 print("Polynomial fit", poly)
運(yùn)行結(jié)果:
Polynomial fit: [ 1.61308827e-07 -4.34114354e-04 1.84480028e-01 1.33680483e+01]
用我們剛剛得到的多項(xiàng)式對象以及 polyval 函數(shù),推斷下一個(gè)差值:
print ("Next value:", np.polyval(poly, t[-1] + 1)) #用生成的多項(xiàng)式擬合求下一個(gè)差值
print(difference[-1]) #打印最后一個(gè)實(shí)際的差值
運(yùn)行結(jié)果:
Next value: 26.222936287829654 26.21
在極限情況下,差值可以在某個(gè)點(diǎn)為0。使用 roots 函數(shù)找出擬合的多項(xiàng)式函數(shù)什么時(shí)候到達(dá)0值:
print( "Roots", np.roots(poly))#root返回多項(xiàng)式的根
運(yùn)行結(jié)果:
Roots [2138.21411788 615.9134063 -62.92728874]
三、求極值的知識
極值是函數(shù)的最大值或最小值。在高等代數(shù)微積分中,這些極值點(diǎn)位于函數(shù)的導(dǎo)數(shù)為0的位置,然后再求導(dǎo)數(shù)函數(shù)的根,即找出原多項(xiàng)式函數(shù)的極值點(diǎn)。
1)使用 polyder 函數(shù)對多項(xiàng)式函數(shù)求導(dǎo)
der = np.polyder(poly) print("Derivative", der)
2)求出導(dǎo)數(shù)函數(shù)的根,即找出原多項(xiàng)式函數(shù)的極值點(diǎn)
print( "Extremas", np.roots(der))
運(yùn)行后即得到如下:
Derivative: [ 4.83926482e-07 -8.68228709e-04 1.84480028e-01] Extremas [1547.84609151 246.28739879]
3)用 polyval 計(jì)算多項(xiàng)式函數(shù)的值,并用matplotlib顯示
vals = np.polyval(poly, t) print('vals:',vals) print('max value:', np.argmax(vals)) print('min value:', np.argmin(vals)) plt.plot(t,difference) plt.plot(t,vals) plt.show()
運(yùn)行結(jié)果如下:
以上就是Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)的詳細(xì)內(nèi)容,更多關(guān)于Python數(shù)據(jù)分析Numpy相關(guān)性函數(shù)的資料請關(guān)注腳本之家其它相關(guān)文章!
- Python數(shù)據(jù)分析numpy數(shù)組的3種創(chuàng)建方式
- 詳解python如何通過numpy數(shù)組處理圖像
- python中的Numpy二維數(shù)組遍歷與二維數(shù)組切片后遍歷效率比較
- Python中numpy數(shù)組的計(jì)算與轉(zhuǎn)置詳解
- python 將numpy維度不同的數(shù)組相加相乘操作
- Python 用NumPy創(chuàng)建二維數(shù)組的案例
- Python數(shù)據(jù)分析之NumPy常用函數(shù)使用詳解
- python數(shù)據(jù)分析Numpy庫的常用操作
- Python Numpy布爾數(shù)組在數(shù)據(jù)分析中的應(yīng)用小結(jié)
相關(guān)文章
xadmin使用formfield_for_dbfield函數(shù)過濾下拉表單實(shí)例
這篇文章主要介紹了xadmin使用formfield_for_dbfield函數(shù)過濾下拉表單實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04詳解使用Pytorch Geometric實(shí)現(xiàn)GraphSAGE模型
這篇文章主要為大家介紹了詳解使用Pytorch Geometric實(shí)現(xiàn)GraphSAGE模型示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-04-04PyTorch中flatten()?函數(shù)的用法實(shí)例小結(jié)
在PyTorch中,flatten函數(shù)的作用是將一個(gè)多維的張量轉(zhuǎn)換為一維的向量,它可以將任意形狀的張量轉(zhuǎn)換為一維,而不需要指定轉(zhuǎn)換后的大小,這篇文章主要介紹了PyTorch中flatten()?函數(shù)的用法,需要的朋友可以參考下2023-11-11python3實(shí)現(xiàn)點(diǎn)餐系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python3實(shí)現(xiàn)點(diǎn)餐系統(tǒng),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-01-01詳解Python如何查看一個(gè)函數(shù)的參數(shù)
inspect模塊提供了許多用于檢查對象的工具函數(shù),其中包括用于獲取函數(shù)參數(shù)信息的函數(shù),所以在Python中,大家可以使用inspect模塊來查看一個(gè)函數(shù)的參數(shù)信息,本文就來和大家講講具體操作吧2023-05-05詳解如何將Pandas運(yùn)行結(jié)果導(dǎo)出為CSV格式文件
在數(shù)據(jù)分析與處理的世界里,Pandas?是一個(gè)不可或缺的工具,它提供了強(qiáng)大的數(shù)據(jù)處理功能,讓我們能夠輕松地清洗、轉(zhuǎn)換和分析數(shù)據(jù),本文將帶領(lǐng)大家了解如何使用?Pandas?將運(yùn)行結(jié)果導(dǎo)出為?CSV?文件,并通過實(shí)際案例進(jìn)行深入探討2024-05-05