欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas庫之DataFrame使用的學習筆記

 更新時間:2019年06月21日 11:55:21   作者:敗北桑  
這篇文章主要介紹了Pandas庫之DataFrame使用的學習筆記,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

1 簡介

DataFrame是Python中Pandas庫中的一種數(shù)據(jù)結構,它類似excel,是一種二維表。

或許說它可能有點像matlab的矩陣,但是matlab的矩陣只能放數(shù)值型值(當然matlab也可以用cell存放多類型數(shù)據(jù)),DataFrame的單元格可以存放數(shù)值、字符串等,這和excel表很像。

同時DataFrame可以設置列名columns與行名index,可以通過像matlab一樣通過位置獲取數(shù)據(jù)也可以通過列名和行名定位,具體方法在后面細說。

2 創(chuàng)建DataFrame

首先聲明一下,以下都是使用的Python 3.6.5版本為例,Python2應該也差不多吧(大概

在所有操作之前當然要先import必要的pandas庫,因為pandas常與numpy一起配合使用,所以也一起import吧。

import pandas as pd
import numpy as np

如果還沒安裝直接在cmd里pip安裝吧,如果有版本選擇問題,參看之前的帖子。

pip install pandas
pip install numpy

2.1 直接創(chuàng)建

可以直接使用pandas的DataFrame函數(shù)創(chuàng)建,比如接下來我們隨機創(chuàng)建一個4*4的DataFrame。

df1=pd.DataFrame(np.random.randn(4,4),index=list('ABCD'),columns=list('ABCD'))

其中第一個參數(shù)是存放在DataFrame里的數(shù)據(jù),第二個參數(shù)index就是之前說的行名(或者應該叫索引?),第三個參數(shù)columns是之前說的列名。

后兩個參數(shù)可以使用list輸入,但是注意,這個list的長度要和DataFrame的大小匹配,不然會報錯。當然,這兩個參數(shù)是可選的,你可以選擇不設置。

而且發(fā)現(xiàn),這兩個list是可以一樣的,但是每行每列的名字在index或columns里要是唯一的。

使用python自己的shell展示創(chuàng)建的結果是這樣的:

或者在jupyter里面更酷點的樣子,接下來都使用jupyter輸出展示吧。

當然,如果你的數(shù)據(jù)量賊小,也可以自己輸入創(chuàng)建,類似這樣。

df2=pd.DataFrame([[1,2,3,4],[2,3,4,5],
         [3,4,5,6],[4,5,6,7]],
         index=list('ABCD'),columns=list('ABCD'))

這樣也可以得到這樣子的DataFrame:

2.2 使用字典創(chuàng)建

仍然是使用DataFrame這個函數(shù),但是字典的每個key的value代表一列,而key是這一列的列名。比如這樣。

dic1={'name':['小明','小紅','狗蛋','鐵柱'],'age':[17,20,5,40],'gender':['男','女','女','男']}
df3=pd.DataFrame(dic1)

輸出結果是這樣的

3 查看與篩選數(shù)據(jù)

python沒有matlab的工作區(qū)直接查看變量與內(nèi)容,這大概是python科學計算的一個缺點。所以需要格外的代碼來查看,最基本的直接寫變量名與print就不說了。

3.1 查看列的數(shù)據(jù)類型

使用dtypes方法可以查看各列的數(shù)據(jù)類型,比如說剛剛的df3。

df3.dtypes

輸出的結果是這樣:

3.2 查看DataFrame的頭尾

使用head可以查看前幾行的數(shù)據(jù),默認的是前5行,不過也可以自己設置。

使用tail可以查看后幾行的數(shù)據(jù),默認也是5行,參數(shù)可以自己設置。

比如隨意設置一個6*6的數(shù)據(jù),只看前5行。

df4=pd.DataFrame(np.random.randn(6,6))
df4.head()

比如只看前3行。

df4.head(3)

比如看后5行。

df4.tail()

比如只看后2行。

df4.tail(2)

3.3 查看行名與列名

使用index查看行名,columns查看列名。具體由例子感受吧。

查看行名。

df1.index

查看列名。

df3.columns

3.4 查看數(shù)據(jù)值

使用values可以查看DataFrame里的數(shù)據(jù)值,返回的是一個數(shù)組。

比如說查看所有的數(shù)據(jù)值。

df3.values

比如說查看某一列所有的數(shù)據(jù)值。

df3['name'].values

還有另一種操作,使用loc或者iloc查看數(shù)據(jù)值(但是好像只能根據(jù)行來查看?)。區(qū)別是loc是根據(jù)行名,iloc是根據(jù)數(shù)字索引(也就是行號)。

比如說這樣。

df1.loc['A']

或者這樣。

df1.iloc[0]

按列進行索引查看數(shù)據(jù)還能直接使用列名,但這種方法對行索引不適用。

df3['name']

3.5 查看行列數(shù)

使用shape查看行列數(shù),參數(shù)為0表示查看行數(shù),參數(shù)為1表示查看列數(shù)。

df3.shape[0]

df3.shape[1]

4 基本操作

DataFrame有些方法可以直接進行數(shù)據(jù)統(tǒng)計,矩陣計算之類的基本操作。

4.1 轉置

直接字母T,線性代數(shù)上線。

比如說把之前的df2轉置一下。

df3.T

4.2 描述性統(tǒng)計

使用describe可以對數(shù)據(jù)根據(jù)列進行描述性統(tǒng)計。

比如說對df1進行描述性統(tǒng)計。

df1.describe()

如果有的列是非數(shù)值型的,那么就不會進行統(tǒng)計。

如果想對行進行描述性統(tǒng)計,請參看4.1(轉置后進行describe呀?。?/p>

4.3 計算

使用sum默認對每列求和,sum(1)為對每行求和。比如

df3.sum()

可以發(fā)現(xiàn)就算元素是字符串,使用sum也會加起來。

df3.sum(1)

而一行中,有字符串有數(shù)值則只計算數(shù)值。

數(shù)乘運算使用apply,比如。

df2.apply(lambda x:x*2)

如果元素是字符串,則會把字符串再重復一遍。

乘方運算跟matlab類似,直接使用兩個*,比如。

df2**2

乘方運算如果有元素是字符串的話,就會報錯。

4.4 新增

擴充列可以直接像字典一樣,列名對應一個list,但是注意list的長度要跟index的長度一致。

df2['E']=['999','999','999','999']df2

還可以使用insert,使用這個方法可以指定把列插入到第幾列,其他的列順延。

df2['E']=['999','999','999','999']
df2

4.5 合并

使用join可以將兩個DataFrame合并,但只根據(jù)行列名合并,并且以作用的那個DataFrame的為基準。如下所示,新的df7是以df2的行號index為基準的。

df6=pd.DataFrame(['my','name','is','a'],index=list('ACDH'),columns=list('G'))
df6
df7=df2.join(df6)
df7

但是,join這個方法還有how這個參數(shù)可以設置,合并兩個DataFrame的交集或并集。參數(shù)為'inner'表示交集,'outer'表示并集。

df6=pd.DataFrame(['my','name','is','a'],index=list('ACDH'),columns=list('G'))
df6
df7=df2.join(df6)
df7

如果要合并多個Dataframe,可以用list把幾個Dataframe裝起來,然后使用concat轉化為一個新的Dataframe。

df6=pd.DataFrame(['my','name','is','a'],index=list('ACDH'),columns=list('G'))
df6
df7=df2.join(df6)
df7

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • Python3之簡單搭建自帶服務器的實例講解

    Python3之簡單搭建自帶服務器的實例講解

    今天小編就為大家分享一篇Python3之簡單搭建自帶服務器的實例講解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-06-06
  • 快速進修Python指南之文件操作

    快速進修Python指南之文件操作

    這篇文章主要為大家介紹了Java開發(fā)者快速進修Python指南之文件操作示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-12-12
  • Pandas時間序列基礎詳解(轉換,索引,切片)

    Pandas時間序列基礎詳解(轉換,索引,切片)

    今天小編就為大家分享一篇Pandas時間序列基礎詳解(轉換,索引,切片),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • pytorch中如何使用DataLoader對數(shù)據(jù)集進行批處理的方法

    pytorch中如何使用DataLoader對數(shù)據(jù)集進行批處理的方法

    這篇文章主要介紹了pytorch中如何使用DataLoader對數(shù)據(jù)集進行批處理的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-08-08
  • python plotly繪制直方圖實例詳解

    python plotly繪制直方圖實例詳解

    這篇文章主要介紹了python plotly繪制直方圖實例詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-07-07
  • python實現(xiàn)求最長回文子串長度

    python實現(xiàn)求最長回文子串長度

    最長回文子串問題:給定一個字符串,求它的最長回文子串長度。如果一個字符串正著讀和反著讀是一樣的,那它就是回文串。今天我們就來探討下這個問題
    2018-01-01
  • python中列表添加元素的幾種方式(+、append()、extend())

    python中列表添加元素的幾種方式(+、append()、extend())

    本文主要介紹了python中列表添加元素的幾種方式(+、append()、extend()),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2022-08-08
  • 只需7行Python代碼玩轉微信自動聊天

    只需7行Python代碼玩轉微信自動聊天

    今天小編就為大家分享一篇關于只需7行Python代碼玩轉微信自動聊天,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-01-01
  • 一起來看看五條Python中的隱含特性

    一起來看看五條Python中的隱含特性

    這篇文章主要為大家詳細介紹了Python中的隱含特性,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-01-01
  • 詳解python里使用正則表達式的全匹配功能

    詳解python里使用正則表達式的全匹配功能

    這篇文章主要介紹了詳解python里使用正則表達式的全匹配功能的相關資料,希望通過本文能幫助到大家,需要的朋友可以參考下
    2017-10-10

最新評論