Python統(tǒng)計(jì)學(xué)一數(shù)據(jù)的概括性度量詳解
一、數(shù)據(jù)的概括性度量
1、統(tǒng)計(jì)學(xué)概括:
統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)的一個(gè)分支,主要通過利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。統(tǒng)計(jì)學(xué)主要又分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué)。給定一組數(shù)據(jù),統(tǒng)計(jì)學(xué)可以摘要并且描述這份數(shù)據(jù),這個(gè)用法稱作為描述統(tǒng)計(jì)學(xué)。另外,觀察者以數(shù)據(jù)的形態(tài)建立出一個(gè)用以解釋其隨機(jī)性和不確定性的數(shù)學(xué)模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統(tǒng)計(jì)學(xué)。
2、數(shù)據(jù)的概括性度量:
1)集中趨勢的度量:
眾數(shù):眾數(shù)(Mode),是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時(shí)眾數(shù)在一組數(shù)中有好幾個(gè)。用M表示。
中位數(shù):中位數(shù)(Median)是指將數(shù)據(jù)按大小順序排列起來,形成一個(gè)數(shù)列,居于數(shù)列中間位置的那個(gè)數(shù)據(jù)。中位數(shù)用Me表示。計(jì)算公式:
四分位數(shù):四分位數(shù)(Quartile)把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。QL=下四分位數(shù),即第25百分位數(shù)( n / 4);QU=上四分位數(shù),即第75百分位數(shù)( 3n / 4)。
平均數(shù):算術(shù)平均數(shù)(arithmetic mean)算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個(gè)數(shù)所得的商,簡稱平均數(shù)或均數(shù)。
2)離散趨勢的度量:
四分位差:四分位差(quartile deviation),也稱為內(nèi)距或四分間距(inter-quartile range),它是上四分位數(shù)(QU,即位于75%)與下四分位數(shù)(QL,即位于25%)的差。
極差:全距(Range),又稱極差,是用來表示統(tǒng)計(jì)資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距
方差:方差(variance)(樣本方差)是各個(gè)數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù),通常以σ2表示,方差的計(jì)算公式為:
標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差 (Standard Deviation),也稱均方差(Mean square error), 。
離散系數(shù):離散系數(shù)又稱變異系數(shù),CV(Coefficient of Variance)表示。CV(Coefficient of Variance):標(biāo)準(zhǔn)差與均值的比值。離散系數(shù)越小,數(shù)據(jù)的離散程度就越小,反之,亦然。
3)偏度與峰度的度量:
偏態(tài)系數(shù):偏度(Skewness)亦稱偏態(tài)、偏態(tài)系數(shù),偏度是統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計(jì)數(shù)據(jù)分布非對稱程度的數(shù)字特征。Sk>0時(shí),分布呈正偏態(tài)(右偏),Sk<0時(shí),分布呈負(fù)偏態(tài)(左偏)。
峰態(tài)系數(shù):(Kurtosis)峰度系數(shù)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo)。在正態(tài)分布情況下,峰度系數(shù)值是3。>3的峰度系數(shù)說明觀察量更集中,有比正態(tài)分布更短的尾部;<3的峰度系數(shù)說明觀測量不那么集中,有比正態(tài)分布更長的尾部,類似于矩形的均勻分布。峰度系數(shù)的標(biāo)準(zhǔn)誤用來判斷分布的正態(tài)性。峰度系數(shù)與其標(biāo)準(zhǔn)誤的比值用來檢驗(yàn)正態(tài)性。如果該比值絕對值大于2,將拒絕正態(tài)性。
3、Python代碼實(shí)現(xiàn):
<span style="font-family:Microsoft YaHei;font-size:12px;">#以下代碼基于Python3.5環(huán)境編寫 import numpy as np import stats as sts scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23, 32, 34, 43, 41, 21, 23, 26, 26, 34, 42, 43, 25, 24, 23, 24, 44, 23, 14, 52,32, 42, 44, 35, 28, 17, 21, 32, 42, 12, 34] #集中趨勢的度量 print('求和:',np.sum(scores)) print('個(gè)數(shù):',len(scores)) print('平均值:',np.mean(scores)) print('中位數(shù):',np.median(scores)) print('眾數(shù):',sts.mode(scores)) print('上四分位數(shù)',sts.quantile(scores,p=0.25)) print('下四分位數(shù)',sts.quantile(scores,p=0.75)) #離散趨勢的度量 print('最大值:',np.max(scores)) print('最小值:',np.min(scores)) print('極差:',np.max(scores)-np.min(scores)) print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25)) print('標(biāo)準(zhǔn)差:',np.std(scores)) print('方差:',np.var(scores)) print('離散系數(shù):',np.std(scores)/np.mean(scores)) #偏度與峰度的度量 print('偏度:',sts.skewness(scores)) print('峰度:',sts.kurtosis(scores))</span>
以上這篇Python統(tǒng)計(jì)學(xué)一數(shù)據(jù)的概括性度量詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python中編寫config文件并及時(shí)更新的方法
在pytorch或者其他深度學(xué)習(xí)框架中,有許多超參數(shù)需要調(diào)整,包括learning_rate,training_data_path等,因此編寫一個(gè)config文件統(tǒng)一存放這些參數(shù),方便調(diào)用/查看/修改還是很有必要,這篇文章主要介紹了python中一種編寫config文件并及時(shí)更新的方法,需要的朋友可以參考下2023-02-02Python lxml解析HTML并用xpath獲取元素的方法
今天小編就為大家分享一篇Python lxml解析HTML并用xpath獲取元素的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01Python?isdigit()函數(shù)判斷字符串是否全都是數(shù)字字符示例
這篇文章主要為大家介紹了Python判斷字符串是否全都是數(shù)字字符示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01如何使用python中的networkx來生成一個(gè)圖
這篇文章主要介紹了如何使用python中的networkx來生成一個(gè)圖,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12使用Python繪制臺(tái)風(fēng)軌跡圖的示例代碼
這篇文章主要介紹了使用Python繪制臺(tái)風(fēng)軌跡圖的示例代碼,幫助大家更好的理解和使用python繪制圖形,感興趣的朋友可以了解下2020-09-09Python接口自動(dòng)化淺析登錄接口測試實(shí)戰(zhàn)
本文主要接好了python接口自動(dòng)化的接口概念、接口用例設(shè)計(jì)及登錄,跟隨本文章來進(jìn)行一個(gè)接口用例設(shè)計(jì)及登錄接口測試實(shí)戰(zhàn),有需要的朋友可以參考下2021-08-08wxPython實(shí)現(xiàn)整點(diǎn)報(bào)時(shí)
這篇文章主要為大家詳細(xì)介紹了wxPython實(shí)現(xiàn)整點(diǎn)報(bào)時(shí),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-11-11