快捷導(dǎo)航

Python中Pandas庫的數(shù)據(jù)處理與分析

更新時間：2023年07月10日 08:50:03 作者：小小張說故事

Python的Pandas庫是數(shù)據(jù)科學(xué)領(lǐng)域中非常重要的一個庫，它使數(shù)據(jù)清洗和分析工作變得更快更簡單，Pandas結(jié)合了NumPy的高性能數(shù)組計(jì)算功能以及電子表格和關(guān)系型數(shù)據(jù)庫（如SQL）的靈活數(shù)據(jù)處理能力,需要的朋友可以參考下

一、Pandas的數(shù)據(jù)結(jié)構(gòu)

Pandas主要有兩種數(shù)據(jù)結(jié)構(gòu)：Series和DataFrame。

1. Series

Series是一種類似于一維數(shù)組的對象，它由一組數(shù)據(jù)和一組與之相關(guān)的數(shù)據(jù)標(biāo)簽（即索引）組成。

import pandas as pd
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)

2. DataFrame

DataFrame是一種二維的表格型數(shù)據(jù)結(jié)構(gòu)，每列可以是不同的值類型（數(shù)值、字符串、布爾值等）。DataFrame既有行索引也有列索引，它可以被看做由Series組成的字典（共用同一個索引）。

import pandas as pd
data = {'Country': ['Belgium', 'India', 'Brazil'],
        'Capital': ['Brussels', 'New Delhi', 'Brasília'],
        'Population': [11190846, 1303171035, 207847528]}
df = pd.DataFrame(data, columns=["Country", "Capital", "Population"])
print(df)

二、數(shù)據(jù)讀取與寫入

Pandas提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對象的函數(shù)，支持多種格式的數(shù)據(jù)，如csv、excel、json、html、sql等。

import pandas as pd
# 從CSV文件中讀取數(shù)據(jù)
df = pd.read_csv('file.csv')
# 將數(shù)據(jù)寫入CSV文件中
df.to_csv('file.csv')

三、數(shù)據(jù)選擇與操作

Pandas提供了多種方式進(jìn)行數(shù)據(jù)的選擇與操作。

import pandas as pd
# 創(chuàng)建一個數(shù)據(jù)集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom'],
        'Age': [20, 21, 19, 20],
        'Country':['US', 'UK', 'US', 'UK']}
df = pd.DataFrame(data)
# 選擇'Name'列
df['Name']
# 選擇第0行
df.iloc[0]
# 選擇滿足條件的行
df[df.Age > 20]
# 對'Age'列進(jìn)行求和
df['Age'].sum()
# 對'Country'列進(jìn)行計(jì)數(shù)
df['Country'].value_counts()

Pandas的功能遠(yuǎn)不止這些，還包括合并、分組、缺失數(shù)據(jù)處理、數(shù)據(jù)透視表等高級功能，為數(shù)據(jù)處理和分析提供了強(qiáng)大的工具。

到此這篇關(guān)于Python中Pandas庫的數(shù)據(jù)處理與分析的文章就介紹到這了,更多相關(guān)Python Pandas庫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: