python利用pandas分析學生期末成績實例代碼
安裝Pandas
Pandas是構建在Python編程語言之上的一個快速、強大、靈活且易于使用的開源數(shù)據(jù)分析和操作工具。Pandas是基于Numpy的專業(yè)數(shù)據(jù)分析工具,可以靈活高效的處理各種數(shù)據(jù)集。
我們使用pip進行安裝(如果沒有可自行查詢如何安裝pip)安裝panda最簡單的方法是將其作為Anaconda的一部分安裝,Anaconda主要用于數(shù)據(jù)分析和科學計算。還提供源代碼、PyPI、ActivePython、各種Linux發(fā)行版或開發(fā)版本進行安裝的說明。
當然,最為基礎的Python環(huán)境還是少不了的,如果你是Linux或使用的Mac就不用安裝Python了。
pip install pandas
分析過程
1.從excel文件中讀出本班同學的成績冊,并處理好缺失值。
2.根據(jù)‘加分'和‘減分'兩列統(tǒng)計出平時成績。
3.將實驗報告成績從ABCD轉換為百分制,統(tǒng)計出實驗成績。A為90分,B為75分,C為60分,D為40分。
4.隨機生成假設的期末成績,取值區(qū)間為40-100分。將自己的期末成績改成你覺得可能考到的分數(shù)。
5.按照平時成績20%,實驗成績30%,期末成績50%的比例計算綜合成績。
6.輸出你自己的平時成績,實驗成績,期末成績和綜合成績。
7.統(tǒng)計全班綜合成績[90,100],[80,89],[70,79],[60-69],[0,59]各段成績的人數(shù),并畫餅圖。
8.將完整的成績保存到score.xlsx文件中,打開excel檢查輸出是否正確。
完整實例
準備工作:導入需要用到的模塊
import pandas as pd import numpy as np import random from matplotlib import pyplot as plt
(1)從excel文件中讀出本班同學的成績冊,并處理好缺失值。
df=pd.read_csv("4班平時成績.csv",encoding="gbk") df=df.rename(columns={"ID":"學號"})#將列名ID重命名 df.set_index("姓名",inplace=True)#將姓名作為index df=df.fillna(method="backfill")#處理缺失值
(2)根據(jù)‘加分'和‘減分'兩列統(tǒng)計出平時成績。
df["平時成績"]=df["平時成績"]-df["減分"] df=df.drop("減分",axis=1)#刪除列
(3)將實驗報告成績從ABCD轉換為百分制,統(tǒng)計出實驗成績。A為90分,B為75分,C為60分,D為40分。
def m(x):#2 將ABCD轉化為對應的分數(shù) if x=="A": return 90 if x=="B": return 75 if x=="C": return 60 if x=="D": return 40 df["第一次實驗報告"]=df.第一次實驗報告.map(m) df["第二次實驗報告"]=df.第二次實驗報告.map(m) df["第三次實驗報告"]=df.第三次實驗報告.map(m)
(4)隨機生成假設的期末成績,取值區(qū)間為40-100分。將自己的期末成績改成你覺得可能考到的分數(shù)。
def cj(x): return random.randint(40,100) df["期末成績"]="" df["期末成績"]=df.期末成績.map(cj) df
(5)按照平時成績20%,實驗成績30%,期末成績50%的比例計算綜合成績。
df["綜合成績"]=df["期末成績"]*0.5+df["平時成績"]*0.2+df["第一次實驗報告"]*0.1+\ df["第二次實驗報告"]*0.1+df["第三次實驗報告"]*0.1 df
(6)輸出你自己的平時成績,實驗成績,期末成績和綜合成績。
df[df.姓名=='只為你220']
(7)統(tǒng)計全班綜合成績[90,100],[80,89],[70,79],[60-69],[0,59]各段成績的人數(shù),并畫餅圖。
y=pd.cut(df['綜合成績'],bins=[0,60,70,80,90,100],\ labels=['0-59','60-69','70-79','80-89','90-100'])#分區(qū)間 a=y.value_counts()#統(tǒng)計區(qū)間人數(shù) print(a)
plt.rcParams['font.sans-serif']=['SimHei'] a.plot(kind='pie',title='學生成績區(qū)間統(tǒng)計圖')
(8)將完整的成績保存到score.xlsx文件中,打開excel檢查輸出是否正確。
將結果保存為.xlsx文件
df.to_excel(excel_writer="score.xlsx",index=False,encoding='utf-8')
將剛剛保存的.xlsx文件打開,查看結果是否正確
pd.read_excel("score.xlsx")
總結
到此這篇關于python利用pandas分析學生期末成績碼的文章就介紹到這了,更多相關pandas分析期末成績內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python+OpenCV實現(xiàn)圖像基本操作的示例詳解
這篇文章主要為大家詳細介紹了Python通過OpenCV實現(xiàn)圖像的一些基本處理操作的方法,文中的示例代碼簡潔易懂,具有一定的參考價值,感興趣的可以學習一下2023-04-04Python多線程threading join和守護線程setDeamon原理詳解
這篇文章主要介紹了Python多線程threading join和守護線程setDeamon原理詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-03-03Python中用format函數(shù)格式化字符串的用法
這篇文章主要介紹了Python中用format函數(shù)格式化字符串的用法,格式化字符串是Python學習當中的基礎知識,本文主要針對Python2.7.x版本,需要的朋友可以參考下2015-04-04