Python中的相關分析correlation analysis的實現(xiàn)
相關分析(correlation analysis)
研究兩個或兩個以上隨機變量之間相互依存關系的方向和密切程度的方法。
線性相關關系主要采用皮爾遜(Pearson)相關系數(shù)r來度量連續(xù)變量之間線性相關強度;
r>0,線性正相關;r<0,線性負相關;
r=0,兩個變量之間不存在線性關系,并不代表兩個變量之間不存在任何關系。
相關分析函數(shù)
DataFrame.corr()
Series.corr(other)
函數(shù)說明:
如果由數(shù)據(jù)框調(diào)用corr函數(shù),那么將會計算每個列兩兩之間的相似度
如果由序列調(diào)用corr方法,那么只是該序列與傳入的序列之間的相關度
返回值:
DataFrame調(diào)用;返回DataFrame
Series調(diào)用:返回一個數(shù)值型,大小為相關度
import numpy import pandas data = pandas.read_csv( 'C:/Users/ZL/Desktop/Python/5.4/data.csv' ) bins = [ min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1 ] labels = [ '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上' ] data['年齡分層'] = pandas.cut( data.年齡, bins, labels=labels ) ptResult = data.pivot_table( values=['年齡'], index=['年齡分層'], columns=['性別'], aggfunc=[numpy.size] File "<ipython-input-1-ae921a24967f>", line 25 aggfunc=[numpy.size] ^ SyntaxError: unexpected EOF while parsing import numpy import pandas data = pandas.read_csv( 'C:/Users/ZL/Desktop/Python/5.4/data.csv' ) bins = [ min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1 ] labels = [ '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上' ] data['年齡分層'] = pandas.cut( data.年齡, bins, labels=labels ) ptResult = data.pivot_table( values=['年齡'], index=['年齡分層'], columns=['性別'], aggfunc=[numpy.size] ) ptResult Out[4]: size 年齡 性別 女 男 年齡分層 20歲以及以下 111 1950 21歲到30歲 2903 43955 31歲到40歲 735 7994 41歲以上 567 886
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
使用python編寫批量卸載手機中安裝的android應用腳本
該腳本的功能是卸載android手機中安裝的所有第三方應用,主要是使用adb shell pm、adb uninstall 命令,需要的朋友可以參考下2014-07-07基于Python socket實現(xiàn)簡易網(wǎng)絡聊天室
本文主要介紹了基于Python socket實現(xiàn)簡易網(wǎng)絡聊天室,本文將通過pyqt5作為桌面應用框架,socket作為網(wǎng)絡編程的框架,從而實現(xiàn)包括客戶端和服務端的網(wǎng)絡聊天室的GUI應用,需要的可以參考一下2022-07-07Python OpenCV視頻截取并保存實現(xiàn)代碼
這篇文章主要介紹了Python OpenCV視頻截取并保存實現(xiàn)代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-11-11Python PyQt5模塊實現(xiàn)窗口GUI界面代碼實例
這篇文章主要介紹了Python PyQt5模塊實現(xiàn)窗口GUI界面代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-05-05