欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas DataFrame創(chuàng)建方法的方式

 更新時(shí)間:2019年08月02日 11:19:25   作者:蒙面的普羅米修斯  
這篇文章主要介紹了pandas DataFrame創(chuàng)建方法的方式,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

在pandas里,DataFrame是最經(jīng)常用的數(shù)據(jù)結(jié)構(gòu),這里總結(jié)生成和添加數(shù)據(jù)的方法:

①、把其他格式的數(shù)據(jù)整理到DataFrame中;
②在已有的DataFrame中插入N列或者N行。

1. 字典類(lèi)型讀取到DataFrame(dict to DataFrame)

假如我們?cè)谧鰧?shí)驗(yàn)的時(shí)候得到的數(shù)據(jù)是dict類(lèi)型,為了方便之后的數(shù)據(jù)統(tǒng)計(jì)和計(jì)算,我們想把它轉(zhuǎn)換為DataFrame,存在很多寫(xiě)法,這里簡(jiǎn)單介紹常用的幾種:

方法一:直接使用pd.DataFrame(data=test_dict)即可,括號(hào)中的data=寫(xiě)不寫(xiě)都可以,具體如下:

test_dict = {'id':[1,2,3,4,5,6],'name':['Alice','Bob','Cindy','Eric','Helen','Grace '],'math':[90,89,99,78,97,93],'english':[89,94,80,94,94,90]}
#[1].直接寫(xiě)入?yún)?shù)test_dict
test_dict_df = pd.DataFrame(test_dict)
#[2].字典型賦值
test_dict_df = pd.DataFrame(data=test_dict)

那么,我們就得到了一個(gè)DataFrame,如下:

應(yīng)該就是這個(gè)樣子了。

方法二:使用from_dict方法:

test_dict_df = pd.DataFrame.from_dict(test_dict)

結(jié)果是一樣的,不再重復(fù)貼圖。

其他方法:如果你的dict變量很小,例如{'id':1,'name':'Alice'},你想直接寫(xiě)到括號(hào)里:

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'}) # wrong style

這樣是不行的,會(huì)報(bào)錯(cuò)ValueError: If using all scalar values, you must pass an index,是因?yàn)槿绻闾峁┑氖且粋€(gè)標(biāo)量,必須還得提供一個(gè)索引Index,所以你可以這么寫(xiě):

test_dict_df = pd.DataFrame({'id':1,'name':'Alice'},pd.Index(range(1)))

后面的可以寫(xiě)多個(gè)pd.Index(range(3),就會(huì)生成三行一樣的,是因?yàn)榍懊娴膁ict型變量只有一組值,如果有多個(gè),后面的Index必須跟前面的數(shù)據(jù)組數(shù)一致,否則會(huì)報(bào)錯(cuò):

pd.DataFrame({'id':[1,2],'name':['Alice','Bob']},pd.Index(range(2))) #must be 2 in range function.

關(guān)于選擇列,有些時(shí)候我們只需要選擇dict中部分的鍵當(dāng)做DataFrame的列,那么我們可以使用columns參數(shù),例如我們只選擇'id','name'列:

test_dict_df = pd.DataFrame(data=test_dict,columns=['id','name']) #only choose 'id' and 'name' columns

這里就不在多寫(xiě)了,后續(xù)變更顏色添加內(nèi)容。

2. csv文件構(gòu)建DataFrame(csv to DataFrame)

我們實(shí)驗(yàn)的時(shí)候數(shù)據(jù)一般比較大,而csv文件是文本格式的數(shù)據(jù),占用更少的存儲(chǔ),所以一般數(shù)據(jù)來(lái)源是csv文件,從csv文件中如何構(gòu)建DataFrame呢? txt文件一般也能用這種方法。

方法一:最常用的應(yīng)該就是pd.read_csv('filename.csv')了,用 sep指定數(shù)據(jù)的分割方式,默認(rèn)的是','

df = pd.read_csv('./xxx.csv')

如果csv中沒(méi)有表頭,就要加入head參數(shù)

3. 在已有的DataFrame中,增加N列或者N行

加入我們已經(jīng)有了一個(gè)DataFrame,如下圖:

3.1 添加列

此時(shí)我們又有一門(mén)新的課physics,我們需要為每個(gè)人添加這門(mén)課的分?jǐn)?shù),按照Index的順序,我們可以使用insert方法,如下:

new_columns = [92,94,89,77,87,91]
test_dict_df.insert(2,'pyhsics',new_columns)
#test_dict_df.insert(2,'pyhsics',new_columns,allow_duplicates=True)

此時(shí),就得到了添加好的DataFrame,需要注意的是DataFrame默認(rèn)不允許添加重復(fù)的列,但是在insert函數(shù)中有參數(shù)allow_duplicates=True,設(shè)置為T(mén)rue后,就可以添加重復(fù)的列了,列名也是重復(fù)的:

3.2 添加行

此時(shí)我們又來(lái)了一位新的同學(xué)Iric,需要在DataFrame中添加這個(gè)同學(xué)的信息,我們可以使用loc方法:

new_line = [7,'Iric',99]
test_dict_df.loc[6]= new_line

但是十分注意的是,這樣實(shí)際是改的操作,如果loc[index]中的index已經(jīng)存在,則新的值會(huì)覆蓋之前的值。

當(dāng)然也可以把這些新的數(shù)據(jù)構(gòu)建為一個(gè)新的DataFrame,然后兩個(gè)DataFrame拼起來(lái)??梢杂胊ppend方法,不過(guò)不太會(huì)用,提供一種方法:

test_dict_df.append(pd.DataFrame([new_line],columns=['id','name','physics']))

本想一口氣把CURD全寫(xiě)完,沒(méi)想到寫(xiě)到這里就好累。。。其他后續(xù)新開(kāi)篇章在寫(xiě)吧。

相關(guān)代碼:(https://github.com/dataSnail/blogCode/blob/master/python_curd/python_curd_create.ipynb)(在DataFrame中刪除N列或者N行)(在DataFrame中查詢(xún)某N列或者某N行)(在DataFrame中修改數(shù)據(jù))

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • VsCode中超好用的8個(gè)python插件推薦

    VsCode中超好用的8個(gè)python插件推薦

    本人日常使用vscode進(jìn)行開(kāi)發(fā),并且比較喜歡折騰vscode,會(huì)到處找這一些好玩的插件,于是越攢越多,下面這篇文章主要給大家介紹了關(guān)于VsCode中超好用的8個(gè)python擴(kuò)展插件的相關(guān)資料,需要的朋友可以參考下
    2022-12-12
  • python發(fā)qq消息轟炸虐狗好友思路詳解(完整代碼)

    python發(fā)qq消息轟炸虐狗好友思路詳解(完整代碼)

    因?yàn)槲业哪硞€(gè)好友在情人節(jié)的時(shí)候秀恩愛(ài),所以我靈光一閃制作了qq消息轟炸并記錄了下來(lái)。本文給大家分享python發(fā)qq消息轟炸虐狗好友思路詳解,感興趣的朋友一起看看吧
    2020-02-02
  • python基礎(chǔ)之局部變量和全局變量

    python基礎(chǔ)之局部變量和全局變量

    這篇文章主要介紹了python局部變量和全局變量,實(shí)例分析了Python中返回一個(gè)返回值與多個(gè)返回值的方法,需要的朋友可以參考下
    2021-10-10
  • python變量賦值機(jī)制踩坑記錄

    python變量賦值機(jī)制踩坑記錄

    這篇文章主要介紹了python變量賦值機(jī)制踩坑記錄,我們都知道python有深拷貝和淺拷貝,但變量賦值又是什么機(jī)制呢?這是個(gè)容易被忽略卻又極易踩坑的點(diǎn),下面我們來(lái)一探究竟,需要的朋友可以參考一下
    2022-02-02
  • 詳解操作python容器的內(nèi)置通用函數(shù)

    詳解操作python容器的內(nèi)置通用函數(shù)

    這篇文章主要為大家介紹了操作python容器的內(nèi)置通用函數(shù),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助
    2021-12-12
  • Apache,wsgi,django 程序部署配置方法詳解

    Apache,wsgi,django 程序部署配置方法詳解

    這篇文章主要介紹了Apache,wsgi,django 程序部署配置方法,結(jié)合實(shí)例形式詳細(xì)分析了Linux環(huán)境下Apache,wsgi,django程序部署配置的相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下
    2019-07-07
  • Python 實(shí)現(xiàn) T00ls 自動(dòng)簽到腳本代碼(郵件+釘釘通知)

    Python 實(shí)現(xiàn) T00ls 自動(dòng)簽到腳本代碼(郵件+釘釘通知)

    這篇文章主要介紹了Python 實(shí)現(xiàn) T00ls 自動(dòng)簽到腳本(郵件+釘釘通知),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-07-07
  • python 自動(dòng)化辦公之批量修改文件名實(shí)操

    python 自動(dòng)化辦公之批量修改文件名實(shí)操

    這篇文章主要介紹了python 自動(dòng)化辦公之批量修改文件名實(shí)操,文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-07-07
  • python利用插值法對(duì)折線(xiàn)進(jìn)行平滑曲線(xiàn)處理

    python利用插值法對(duì)折線(xiàn)進(jìn)行平滑曲線(xiàn)處理

    這篇文章主要為大家詳細(xì)介紹了python利用插值法對(duì)折線(xiàn)進(jìn)行平滑曲線(xiàn)處理,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-12-12
  • Pytorch之?dāng)U充tensor的操作

    Pytorch之?dāng)U充tensor的操作

    這篇文章主要介紹了Pytorch之?dāng)U充tensor的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2021-03-03

最新評(píng)論