Seaborn數(shù)據(jù)分析NBA球員信息數(shù)據(jù)集
本案例使用 Jupyter Notebook進行案例演示,數(shù)據(jù)集為NBA球員信息數(shù)據(jù)集。本項目將進行完整的數(shù)據(jù)分析演示。
1. 數(shù)據(jù)介紹
- 數(shù)據(jù)集共有342個球員樣本,38個特征,即342行×38列。
- 數(shù)據(jù)集主要信息如下表所示:
球員姓名 | 位置 | 身高 | 體重 | 年齡 | 球齡 | 上場次數(shù) | 場均時間 | 進攻能力 | 防守能力 | 是否入選過全明星 | 球員薪金 |
---|
- 本數(shù)據(jù)集主要可以用來做數(shù)據(jù)處理以及數(shù)據(jù)挖掘,進行數(shù)據(jù)可視化。
- 本小結(jié),我們將對NBA球員數(shù)據(jù)集進行初步統(tǒng)計學分析,并且繪制出相關(guān)性熱力圖。
2. 案例演示
2.1 獲取數(shù)據(jù)
導入相關(guān)庫,并使用如下代碼進行本地數(shù)據(jù)集獲取。
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 獲取數(shù)據(jù)集 NBA = pd.read_csv("nba_2017_nba_players_with_salary.csv") NBA.head()
運行結(jié)果:
2.2 查看數(shù)據(jù)基本信息
先進行簡單的統(tǒng)計學分析,查看標準差、中位數(shù)、方差等等信息。
# 看一下數(shù)據(jù)有多少 NBA.shape # 查看基本統(tǒng)計信息 NBA.describe()
部分運行結(jié)果:
2.3 數(shù)據(jù)分析
2.3.1 效率值相關(guān)性分析
在眾多數(shù)據(jù)中,有一項名為RPM,表示球員的效率值。該數(shù)據(jù)反映球員在場時對球隊比賽獲勝的貢獻大小,最能反映球員的綜合實力。我們可以看一下它與其他數(shù)據(jù)的相關(guān)性。
首先,我們?nèi)〕鰩讉€有用的特征分析相關(guān)性,并繪制熱力圖。
# 2. 數(shù)據(jù)分析 ## 2.1 效率值相關(guān)性分析 NBA_1 = NBA.loc[:, ['RPM','AGE','SALARY_MILLIONS','ORB','DRB','TRB','AST','AST','STL','BLK','TOV','PF','POINTS','GP','MPG','ORPM','DRPM']] NBA_1.head()
然后,使用如下代碼計算出相關(guān)性表。
# 計算相關(guān)性 # 獲取兩列之間的相關(guān)性 corr = NBA_1.corr() corr
部分運行結(jié)果如下圖所示:
最后,使用剛才的相關(guān)性表,繪制出相關(guān)性關(guān)系熱力圖
# 調(diào)用熱力圖繪制相關(guān)性關(guān)系 plt.figure(figsize=(20,20),dpi=120) sns.heatmap(corr, square=True, linewidths=0.1, annot=True) # 保存圖像 plt.savefig("./test.png") # 顏色越深:相關(guān)性越弱 # 顏色越淺:相關(guān)性越強
運行結(jié)果如下圖所示:
以上就是Seaborn數(shù)據(jù)分析NBA球員信息數(shù)據(jù)集的詳細內(nèi)容,更多關(guān)于Seaborn數(shù)據(jù)分析的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
簡單瞅瞅Python vars()內(nèi)置函數(shù)的實現(xiàn)
這篇文章主要介紹了簡單瞅瞅Python vars()內(nèi)置函數(shù)的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-09-09Python爬取網(wǎng)易云歌曲評論實現(xiàn)詞云圖
這篇文章主要為大家介紹了Python爬取網(wǎng)易云歌曲評論實現(xiàn)詞云分析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-06-06