python語言中pandas字符串分割str.split()函數(shù)
前言
為了介紹python語言中pandas庫在數(shù)據(jù)分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021賽季常規(guī)賽個人數(shù)據(jù)為例對pandas相關(guān)函數(shù)進(jìn)行詳細(xì)說明。利用爬蟲技術(shù),在知名籃球網(wǎng)站虎撲爬取了勒布朗詹姆斯的數(shù)據(jù),稍后會將數(shù)據(jù)上傳至csdn,以供大家下載。
這篇文章,詳細(xì)介紹了pandas字符串分割函數(shù)---str.split()的用法。
DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默認(rèn)為空格。
n:用于指定需要分割的次數(shù),默認(rèn)為-1。其中,None,0和-1都被解釋為返回所有分割的字符串。
expand:將拆分的字符串展開為單獨的列,默認(rèn)為False。True:返回DataFrame / MultiIndex;
False:返回包含字符串列表的Series / Index。
1、常規(guī)賽數(shù)據(jù)格式
勒布朗詹姆斯2020-2021賽季常規(guī)賽個人數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)如下:
日期 | 對手 | 比分 | 時間 | 投籃 | ... |
05/17 | 鵜鶘 | 110-98(勝) | 27 | 11-22 | ... |
05/16 | 步行者 | 122-115(勝) | 28 | 11-22 | ... |
... | ... | ... | ... | ... | ... |
2、計算詹姆斯常規(guī)賽命中率
勒布朗詹姆斯2020-2021賽季常規(guī)賽個人數(shù)據(jù)中只有每場比賽的命中率,數(shù)據(jù)的第4列為每場比賽的投籃數(shù)和命中數(shù),格式為"命中數(shù)-投籃數(shù)"。如果想要計算詹姆斯整個常規(guī)賽的命中率,則需要算出他常規(guī)賽的投籃數(shù)和命中數(shù)。此時,需要用到pandas分割字符串函數(shù)str.split()。
import numpy as np import pandas as pd df = pd.read_csv(“l(fā)bj-2020-2021-regular.csv”,encoding="gbk") df0 = df['投籃'].str.split("-",expand=True) df0.columns = ['命中數(shù)','投籃數(shù)']
DataFrame類型的df0即為詹姆斯常規(guī)賽的命中數(shù)和投籃數(shù),如下所示:
0 | 命中數(shù) | 投籃數(shù) |
1 | 11 | 22 |
2 | 11 | 22 |
... | ... | ... |
因為要分別求取命中數(shù)和投籃數(shù)的總和,所以需要將df0的列轉(zhuǎn)化為整型,繼而可得到詹姆斯整個常規(guī)賽的命中率。
df0['命中數(shù)'] = df0['命中數(shù)'].astype('int') df0['投籃數(shù)'] = df0['投籃數(shù)'].astype('int') ShootRate = df0['命中數(shù)'].sum() / df0['投籃數(shù)'].sum()
計算得到,詹姆斯2020-2021常規(guī)賽投籃命中率為51.34%,還是很不錯的水平。
總結(jié)
到此這篇關(guān)于python語言中pandas字符串分割str.split()函數(shù)的文章就介紹到這了,更多相關(guān)pandas字符串分割str.split()函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Django ORM多對多查詢方法(自定義第三張表&ManyToManyField)
今天小編就為大家分享一篇Django ORM多對多查詢方法(自定義第三張表&ManyToManyField),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08Django rest framework工具包簡單用法示例
這篇文章主要介紹了Django rest framework工具包簡單用法,結(jié)合匿名訪問控制的具體實例分析了Django rest framework工具包的注冊、路由設(shè)置、視圖、權(quán)限控制、配置等相關(guān)操作技巧,需要的朋友可以參考下2018-07-07基于CentOS搭建Python Django環(huán)境過程解析
這篇文章主要介紹了基于CentOS搭建Python Django環(huán)境過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-08-08Python使用SQLite和Excel操作進(jìn)行數(shù)據(jù)分析
這篇文章主要介紹了Python使用SQLite和Excel操作進(jìn)行數(shù)據(jù)分析,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-01-01