Python中Pandas庫提供的函數(shù)pd.DataFrame的基本用法
一、DataFrame 的基本概念
pd.DataFrame是 Pandas 庫中的一個類,用于創(chuàng)建和操作數(shù)據(jù)框(DataFrame)。DataFrame 是 Pandas 的核心數(shù)據(jù)結(jié)構(gòu),用于以表格形式和處理數(shù)據(jù),類似提供電子表格或數(shù)據(jù)庫表格。類了創(chuàng)建pd.DataFrame數(shù)據(jù)框、訪問數(shù)據(jù)、進行數(shù)據(jù)操作和分析的方法和屬性。
二、DataFrame 的重要特點
表格形式:DataFrame是一個二維表格,其中包含了多行和多列的數(shù)據(jù)。每個列可以有不同的數(shù)據(jù)類型,例如整數(shù)、浮點數(shù)、字符串等。
標簽:DataFrame的行和列都有標簽(Label),行標簽稱為索引(Index),列標簽通常是字段名或特征名。
數(shù)據(jù)操作:DataFrame提供了豐富的數(shù)據(jù)操作方法,包括數(shù)據(jù)篩選、切片、合并、分組、聚合、排序等。
數(shù)據(jù)查看:您可以使用
.head()
方法來查看DataFrame的前幾行數(shù)據(jù),以了解數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容。數(shù)據(jù)統(tǒng)計:DataFrame提供了
.describe()
方法,用于生成數(shù)據(jù)的統(tǒng)計摘要信息,包括均值、標準差、簡單、頂點等。數(shù)據(jù)過濾:你可以使用條件表達式來過濾數(shù)據(jù),例如選擇滿足特定條件的行。
數(shù)據(jù)可視化:Pandas 與其他數(shù)據(jù)可視化庫(如 Matplotlib 和 Seaborn)結(jié)合使用,可以輕松創(chuàng)建各種圖表和可視化,以探索和傳輸數(shù)據(jù)。
數(shù)據(jù)導入和導出:DataFrame可以從各種數(shù)據(jù)源導入數(shù)據(jù),如CSV文件、Excel表格、SQL數(shù)據(jù)庫等,并且可以將數(shù)據(jù)導出為不同格式的文件。
數(shù)據(jù)恢復處理:DataFrame提供了處理數(shù)據(jù)中的恢復值的方法,如刪除恢復值或恢復恢復值。
數(shù)據(jù)索引:DataFrame可以使用行索引和列標簽來訪問特定的數(shù)據(jù)元素。
數(shù)據(jù)轉(zhuǎn)換:您可以對DataFrame進行各種數(shù)據(jù)轉(zhuǎn)換操作,如數(shù)據(jù)類型轉(zhuǎn)換、列重命名、數(shù)據(jù)透視表等。
三、DataFrame 的具體代碼操作
1.創(chuàng)建空的數(shù)據(jù)框:
import pandas as pd df = pd.DataFrame() print(df) # 運行結(jié)果 ''' Empty DataFrame Columns: [] Index: [] '''
這將創(chuàng)建一個空的數(shù)據(jù)框,可以在后續(xù)添加數(shù)據(jù)。
2.從創(chuàng)建列表數(shù)據(jù)框:
import pandas as pd data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]] df = pd.DataFrame(data, columns=['Name', 'Age']) print(df) # 運行結(jié)果 ''' Name Age 0 Alice 25 1 Bob 30 2 Charlie 35 '''
這將創(chuàng)建一個包含姓名和年齡列的數(shù)據(jù)框。
3.從字典創(chuàng)建數(shù)據(jù)框:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) print(df) # 運行結(jié)果 ''' Name Age 0 Alice 25 1 Bob 30 2 Charlie 35 '''
這將創(chuàng)建一個與上述示例相同的數(shù)據(jù)框。
4.訪問數(shù)據(jù):
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) a = df['Name'] # 獲取 'Name' 列的數(shù)據(jù) b = df.loc[0] # 獲取第一行的數(shù)據(jù) print(a) print(b) # 運行結(jié)果 ''' 0 Alice 1 Bob 2 Charlie Name: Name, dtype: object Name Alice Age 25 Name: 0, dtype: object '''
5.數(shù)據(jù)操作:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) a = df['Age'].mean() # 計算 'Age' 列的平均值 b = df.sort_values(by='Age', ascending=False) # 按 'Age' 列排序,ascending=True是從小到大,ascending=False是從大到小 print(a) print(b) # 運行結(jié)果 ''' 30.0 Name Age 2 Charlie 35 1 Bob 30 0 Alice 25 '''
6.數(shù)據(jù)查看:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) a = df.head(2) # 查看前幾行數(shù)據(jù),df.head()默認為前5行 b = df.tail(2) # 查看后3行數(shù)據(jù) print(a) print(b) # 運行結(jié)果 ''' Name Age 0 Alice 25 1 Bob 30 Name Age 1 Bob 30 2 Charlie 35 '''
7.數(shù)據(jù)統(tǒng)計:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) c=df.describe() # 生成數(shù)據(jù)的統(tǒng)計摘要信 print(c) # 運行結(jié)果 ''' Age count 3.0 mean 30.0 std 5.0 min 25.0 25% 27.5 50% 30.0 75% 32.5 max 35.0 '''
這些是一些常見的最有效pd.DataFrame示例,Pandas 提供了豐富的高效方法和功能,使你能夠進行數(shù)據(jù)處理和分析。數(shù)據(jù)科學、機器學習、統(tǒng)計分析等領域中經(jīng)常使用 Pandas 數(shù)據(jù)框來處理和分析數(shù)據(jù)。
總結(jié)
到此這篇關于Python中Pandas庫提供的函數(shù)pd.DataFrame基本用法的文章就介紹到這了,更多相關Pandas庫函數(shù)pd.DataFrame用法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python 窗體(tkinter)下拉列表框(Combobox)實例
這篇文章主要介紹了Python 窗體(tkinter)下拉列表框(Combobox)實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-03-03Ubuntu 下 vim 搭建python 環(huán)境 配置
這篇文章主要介紹了Ubuntu 下 vim 搭建python環(huán)境配置,需要的朋友可以參考下2017-06-06Python實現(xiàn)求兩個數(shù)組交集的方法示例
這篇文章主要介紹了Python實現(xiàn)求兩個數(shù)組交集的方法,涉及Python數(shù)組遍歷、排序、判斷、追加等相關操作技巧,需要的朋友可以參考下2019-02-02