Python使用pandas導入csv文件內容的示例代碼
使用pandas導入csv文件內容
1. 默認導入
在Python中導入.csv文件用的方法是read_csv()。
使用read_csv()進行導入時,指定文件名即可
import pandas as pd df = pd.read_csv(r'G:\test.csv') print(df)
2. 指定分隔符
read_csv()默認文件中的數據都是以逗號分開的,但是有的文件不是用逗號分開的,這個時候就需要人為指定分隔符號,否則就會報錯。
分隔符通過sep參數指定。常見的分隔符除了逗號,還有空格以及制表符(\t)等
import pandas as pd df = pd.read_csv(r'G:\test.csv', sep=',') print(df)
3. 指定讀取行數
假設現在有一個幾百兆的文件,你想了解一下這個文件里有哪些數據,那么這個時候你就沒必要把全部數據都導入,你只要看到前面幾行即可,因此只要設置 nrows參數即可。
import pandas as pd df = pd.read_csv(r'G:\test.csv', sep=',', nrows=2) print(df)
4. 指定編碼格式
每個文件都是有編碼格式的,常用的編碼格式有utf-8和gbk等。有的時候兩個文件看起來一樣,它們的文件名一樣,格式也一樣,但如果它們的編碼格式不一樣,也是不一樣的文件,比如當你把一個Excel文件另存為保存時會出現兩個選項,雖然都是.csv文件,但是這兩種格式代表兩種不同的文件
Python用得比較多的兩種編碼格式是UTF-8和gbk,默認編碼格式是UTF-8。我們要根據導入文件本身的編碼格式進行設置,通過設置參數encoding來設置導入的編碼格式。
如果我們不指定encoding參數, 默認是使用utf-8編碼格式。
import pandas as pd df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8') print(df)
如果是CSV(逗號分隔) (*.csv)格式的文件,那么在導入的時候就需要把編碼格式更改為gbk,如果使用UTF-8就會報錯。
5. 列標題與數據對齊
因為我們的表格中有中文,中文占用的字符和英文、數字占用的字符不一樣,因此需要調用pd.set_option()使表格對齊顯示。如果你是使用 Jupyter 來運行代碼的,Jupyter 會自動渲染出一個表格,則無需這個設置。
import pandas as pd #處理數據的列標題與數據無法對齊的情況 pd.set_option('display.unicode.ambiguous_as_wide', True) #無法對齊主要是因為列標題是中文 pd.set_option('display.unicode.east_asian_width', True) df = pd.read_csv(r'G:\test.csv', sep=',', nrows=3, encoding='utf-8') print(df)
對齊后的效果:
到此這篇關于Python使用pandas導入csv文件內容的文章就介紹到這了,更多相關Python導入csv文件內容內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!