欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python數(shù)據(jù)分析23種Pandas核心操作方法總結(jié)

 更新時間:2022年05月18日 09:34:40   作者:Python?學(xué)習(xí)者  
在本文中,作者從基本數(shù)據(jù)集讀寫、數(shù)據(jù)處理和?DataFrame?操作三個角度展示了?23?個?Pandas?核心方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

Pandas 是一個 Python 軟件庫,它提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。一般而言,Pandas 是使 Python 成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。

Pandas 是基于 NumPy 構(gòu)建的庫,在數(shù)據(jù)處理方面可以把它理解為 NumPy 加強(qiáng)版,同時 Pandas 也是一項開源項目。它基于 Cython,因此讀取與處理數(shù)據(jù)非??欤⑶疫€能輕松處理浮點數(shù)據(jù)中的缺失數(shù)據(jù)(表示為 NaN)以及非浮點數(shù)據(jù)。

本文中,基本數(shù)據(jù)集操作主要介紹了 CSV 與 Excel 的讀寫方法,基本數(shù)據(jù)處理主要介紹了缺失值及特征抽取,最后的 DataFrame 操作則主要介紹了函數(shù)和排序等方法。

基本數(shù)據(jù)集操作

1.讀取 CSV 格式的數(shù)據(jù)集

pd.DataFrame.from_csv(“csv_file”)

或者:

pd.read_csv(“csv_file”)

2.讀取 Excel 數(shù)據(jù)集

pd.read_excel("excel_file")

3.將 DataFrame 直接寫入 CSV 文件

如下采用逗號作為分隔符,且不帶索引:

df.to_csv("data.csv", sep=",", index=False)

4.基本的數(shù)據(jù)集特征信息

df.info()

5.基本的數(shù)據(jù)集統(tǒng)計信息

print(df.describe())

6.Print data frame in a table

將 DataFrame 輸出到一張表:

print(tabulate(print_table, headers=headers))

當(dāng)「print_table」是一個列表,其中列表元素還是新的列表,「headers」為表頭字符串組成的列表。

7.列出所有列的名字

df.columns

基本數(shù)據(jù)處理

8.刪除缺失數(shù)據(jù)

df.dropna(axis=0, how='any')

返回一個 DataFrame,其中刪除了包含任何 NaN 值的給定軸,選擇 how=「all」會刪除所有元素都是 NaN 的給定軸。

9.替換缺失數(shù)據(jù)

df.replace(to_replace=None, value=None)

使用 value 值代替 DataFrame 中的 to_replace 值,其中 value 和 to_replace 都需要我們賦予不同的值。

10.檢查空值 NaN

pd.isnull(object)

檢查缺失值,即數(shù)值數(shù)組中的 NaN 和目標(biāo)數(shù)組中的 None/NaN。

11.刪除特征

df.drop('feature_variable_name', axis=1)

axis 選擇 0 表示行,選擇表示列。

12.將目標(biāo)類型轉(zhuǎn)換為浮點型

pd.to_numeric(df["feature_name"], errors='coerce')

將目標(biāo)類型轉(zhuǎn)化為數(shù)值從而進(jìn)一步執(zhí)行計算,在這個案例中為字符串。

13.將 DataFrame 轉(zhuǎn)換為 NumPy 數(shù)組

df.as_matrix()

14.取 DataFrame 的前面「n」行

df.head(n)

15.通過特征名取數(shù)據(jù)

df.loc[feature_name]

DataFrame 操作

16.對 DataFrame 使用函數(shù)

該函數(shù)將令 DataFrame 中「height」行的所有值乘上 2:

df["height"].apply(*lambda* height: 2 * height)

或:

def multiply(x): return x * 2df["height"].apply(multiply)

17.重命名行

下面代碼會重命名 DataFrame 的第三行為「size」:

df.rename(columns = {<!--{C}%3C!%2D%2D%20%2D%2D%3E-->df.columns[2]:'size'}, inplace=True)

18.取某一行的唯一實體

下面代碼將取「name」行的唯一實體:

df["name"].unique()

19.訪問子 DataFrame

以下代碼將從 DataFrame 中抽取選定了的行「name」和「size」:

new_df = df[["name", "size"]]

20.總結(jié)數(shù)據(jù)信息

# Sum of values in a data frame
df.sum()
# Lowest value of a data frame
df.min()
# Highest value
df.max()
# Index of the lowest value
df.idxmin()
# Index of the highest value
df.idxmax()
# Statistical summary of the data frame, with quartiles, median, etc.
df.describe()
# Average values
df.mean()
# Median values
df.median()
# Correlation between columns
df.corr()
# To get these values for only one column, just select it like this#
df["size"].median()

21.給數(shù)據(jù)排序

df.sort_values(ascending = False)

22.布爾型索引

以下代碼將過濾名為「size」的行,并僅顯示值等于 5 的行:

df[df["size"] == 5]

23.選定特定的值

以下代碼將選定「size」列、第一行的值:

df.loc([0], ['size'])

以上就是Python數(shù)據(jù)分析23種Pandas核心操作方法總結(jié)的詳細(xì)內(nèi)容,更多關(guān)于Python Pandas數(shù)據(jù)分析的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python設(shè)計模式中的備忘錄模式

    Python設(shè)計模式中的備忘錄模式

    這篇文章主要為大家詳細(xì)介紹了Python設(shè)計模式中的備忘錄模式,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-02-02
  • Python機(jī)器學(xué)習(xí)入門(一)序章

    Python機(jī)器學(xué)習(xí)入門(一)序章

    這篇文章主要介紹了Python機(jī)器學(xué)習(xí)入門知識,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-08-08
  • python3 tkinter實現(xiàn)添加圖片和文本

    python3 tkinter實現(xiàn)添加圖片和文本

    這篇文章主要為大家詳細(xì)介紹了python3 tkinter實現(xiàn)添加圖片和文本,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-11-11
  • Python實現(xiàn)獲取漢字偏旁部首的方法示例【測試可用】

    Python實現(xiàn)獲取漢字偏旁部首的方法示例【測試可用】

    這篇文章主要介紹了Python實現(xiàn)獲取漢字偏旁部首的方法,涉及Python基于第三方模塊進(jìn)行漢字處理的相關(guān)操作技巧,需要的朋友可以參考下
    2018-12-12
  • Python標(biāo)準(zhǔn)庫pickle的簡單使用

    Python標(biāo)準(zhǔn)庫pickle的簡單使用

    本文主要介紹了Python標(biāo)準(zhǔn)庫pickle的簡單使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-05-05
  • python中print輸出有空格如何解決

    python中print輸出有空格如何解決

    這篇文章主要介紹了python中print輸出有空格的解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • python實現(xiàn)模擬器爬取抖音評論數(shù)據(jù)的示例代碼

    python實現(xiàn)模擬器爬取抖音評論數(shù)據(jù)的示例代碼

    這篇文章主要介紹了python實現(xiàn)模擬器爬取抖音評論數(shù)據(jù)的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • Python機(jī)器學(xué)習(xí)之Kmeans基礎(chǔ)算法

    Python機(jī)器學(xué)習(xí)之Kmeans基礎(chǔ)算法

    這篇文章主要介紹了Python機(jī)器學(xué)習(xí)之Kmeans基礎(chǔ)算法,文中有非常詳細(xì)的代碼示例,對正在學(xué)習(xí)python的小伙伴們有非常好的幫助,需要的朋友可以參考下
    2021-04-04
  • python使用threading.Condition交替打印兩個字符

    python使用threading.Condition交替打印兩個字符

    這篇文章主要為大家詳細(xì)介紹了python使用threading.Condition交替打印兩個字符,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-05-05
  • IDA Pro 6.0使用Qt框架實現(xiàn)了跨平臺的UI界面

    IDA Pro 6.0使用Qt框架實現(xiàn)了跨平臺的UI界面

    通過本文帶領(lǐng)大家學(xué)習(xí)如何使用PySide使用IDAPython為 IDA Pro 創(chuàng)建 UI 界面,對IDA Pro 6.0使用Qt 框架實現(xiàn)了跨平臺的UI相關(guān)知識感興趣的朋友一起看看吧
    2021-07-07

最新評論