欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

從列表或字典創(chuàng)建Pandas的DataFrame對象的方法

 更新時間:2019年07月06日 10:47:10   作者:everfight  
這篇文章主要介紹了從列表或字典創(chuàng)建Pandas的DataFrame對象的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

介紹

每當(dāng)我使用pandas進(jìn)行分析時,我的第一個目標(biāo)是使用眾多可用選項(xiàng)中的一個將數(shù)據(jù)導(dǎo)入Pandas的DataFrame 。
對于絕大多數(shù)情況下,我使用的 read_excel , read_csv 或 read_sql 。

但是,有些情況下我只需要幾行數(shù)據(jù)或包含這些數(shù)據(jù)里的一些計(jì)算。

在這些情況下,了解如何從標(biāo)準(zhǔn)python列表或字典創(chuàng)建DataFrames會很有幫助。

基本過程并不困難,但因?yàn)橛袔追N不同的選擇,所以有助于理解每種方法的工作原理。

我永遠(yuǎn)記不住我是否應(yīng)該使用 from_dict , from_records , from_items 或默認(rèn)的 DataFrame 構(gòu)造函數(shù)。

通常情況下,通過一些反復(fù)試驗(yàn)和錯誤,我能搞定它。但由于它仍然讓我感到困惑,我想我會通過以下幾個例子來澄清這些不同的方法。

在本文的最后,我簡要介紹了在生成Excel報(bào)表時如何使用它。

從Python的數(shù)據(jù)結(jié)構(gòu)中生成DataFrame

您可以使用多種方法來獲取標(biāo)準(zhǔn)python數(shù)據(jù)結(jié)構(gòu)并創(chuàng)建Pandas的DataFrame。

出于這些示例的目的,我將為3個虛構(gòu)公司創(chuàng)建一個包含3個月銷售信息的DataFrame。

字典

在展示下面的示例之前,我假設(shè)已執(zhí)行以下導(dǎo)入:

import pandas as pd
from collections import OrderedDict
from datetime import date

從python創(chuàng)建DataFrame的“默認(rèn)”方式是使用字典列表。在這種情況下,每個字典鍵用于列標(biāo)題。將自動創(chuàng)建默認(rèn)索引:

sales = [{'account': 'Jones LLC', 'Jan': 150, 'Feb': 200, 'Mar': 140},
     {'account': 'Alpha Co', 'Jan': 200, 'Feb': 210, 'Mar': 215},
     {'account': 'Blue Inc', 'Jan': 50, 'Feb': 90, 'Mar': 95 }]
df = pd.DataFrame(sales)


如您所見,這種方法非常“面向行”。如果您想以“面向列”的方式創(chuàng)建DataFrame,您可以使用 from_dict

sales = {'account': ['Jones LLC', 'Alpha Co', 'Blue Inc'],
     'Jan': [150, 200, 50],sheng cheng
     'Feb': [200, 210, 90],
     'Mar': [140, 215, 95]}
df = pd.DataFrame.from_dict(sales)

使用此方法,您可以獲得與上面相同的結(jié)果。需要考慮的關(guān)鍵點(diǎn)是哪種方法更容易理解您獨(dú)特的使用場景。

有時,以面向行的方式獲取數(shù)據(jù)更容易,而其他時候以列為導(dǎo)向的則更容易。

了解這些選項(xiàng)將有助于使您的代碼更簡單,更易于理解,以滿足您的特定需求。

大多數(shù)人會注意到列的順序看起來不對。這個問題出現(xiàn)的原因是標(biāo)準(zhǔn)的python字典不保留其鍵的順序。

如果要控制列順序,則有兩種方式。

第一種,您可以手動重新排序列:

df = df[['account', 'Jan', 'Feb', 'Mar']]

或者你可以使用python中的OrderedDict 創(chuàng)建你的有序字典 。

sales = OrderedDict([ ('account', ['Jones LLC', 'Alpha Co', 'Blue Inc']),
     ('Jan', [150, 200, 50]),
     ('Feb', [200, 210, 90]),
     ('Mar', [140, 215, 95]) ] )
df = pd.DataFrame.from_dict(sales)

這兩種方法都會按照您可能期望的順序?yàn)槟峁┙Y(jié)果。


由于我在下面概述的原因,我傾向于專門重新排序我的列,盡管使用OrderedDict一直是一個很好理解的選項(xiàng)。

列表

從python創(chuàng)建DataFrame的另一個選擇是將數(shù)據(jù)包含在列表結(jié)構(gòu)中。
第一種方法是使用pandas進(jìn)行面向行的方法 from_records 。此方法類似于字典方法,但您需要顯式調(diào)出列標(biāo)簽。

sales = [('Jones LLC', 150, 200, 50),
     ('Alpha Co', 200, 210, 90),
     ('Blue Inc', 140, 215, 95)]
labels = ['account', 'Jan', 'Feb', 'Mar']
df = pd.DataFrame.from_records(sales, columns=labels)

第二種方法是 from_items 面向列的,實(shí)際上看起來類似于 OrderedDict 上面的例子。

sales = [('account', ['Jones LLC', 'Alpha Co', 'Blue Inc']),
     ('Jan', [150, 200, 50]),
     ('Feb', [200, 210, 90]),
     ('Mar', [140, 215, 95]),
     ]
df = pd.DataFrame.from_items(sales)

這兩個示例都將生成以下DataFrame:

各種選項(xiàng)的直觀總結(jié)

為了保持各種選項(xiàng)在我的腦海中清晰,我將這個簡單的圖形放在一起,以顯示字典與列表選項(xiàng)以及行與列導(dǎo)向的方法。

這是一個2X2的網(wǎng)格,所以我希望所有來詢問的人都留下深刻的印象!

為簡單起見,我沒有展示 OrderedDict 方法,因?yàn)檫@種 from_items 方法可能更像是一個現(xiàn)實(shí)世界的解決方案。

如果這有點(diǎn)難以閱讀,您也可以獲得PDF版本。

簡單的例子

對于一個簡單的概念,這似乎有很多解釋。

但是,我經(jīng)常使用這些方法來構(gòu)建小型DataFrame,并將其與更復(fù)雜的分析結(jié)合起來。

舉一個例子,假設(shè)我們要保存我們的DataFrame并包含一個頁腳,以便我們知道它何時被創(chuàng)建以及它是由誰創(chuàng)建的。
如果我們填充DataFrame并將其寫入Excel比我們嘗試將單個單元格寫入Excel更容易。

拿我們現(xiàn)有的DataFrame:

sales = [('account', ['Jones LLC', 'Alpha Co', 'Blue Inc']),
     ('Jan', [150, 200, 50]),
     ('Feb', [200, 210, 90]),
     ('Mar', [140, 215, 95]),
     ]
df = pd.DataFrame.from_items(sales)

現(xiàn)在構(gòu)建一個頁腳(以列為導(dǎo)向):

from datetime import date

create_date = "{:%m-%d-%Y}".format(date.today())
created_by = "CM"
footer = [('Created by', [created_by]), ('Created on', [create_date]), ('Version', [1.1])]
df_footer = pd.DataFrame.from_items(footer)


合并進(jìn)入一個Excel中的一個sheet:

writer = pd.ExcelWriter('simple-report.xlsx', engine='xlsxwriter')
df.to_excel(writer, index=False)
df_footer.to_excel(writer, startrow=6, index=False)
writer.save()


這里的秘訣是使用 startrow 在銷售數(shù)據(jù)框架下面寫入頁腳DataFrame。還有一個相應(yīng)的startcol,所以你可以控制成為你想要的列布局。

這使得基本 to_excel 功能具有很大的靈活性。

總結(jié)

大多數(shù)Pandas用戶很快就熟悉了電子表格,CSV和SQL數(shù)據(jù)的攝取。

但是,有時您會在基本列表或字典中包含數(shù)據(jù)并希望填充DataFrame。

Pandas提供了幾種選擇,但可能并不總是立即明確何時使用哪種選擇。

沒有一種方法是“最好的”,它實(shí)際上取決于您的需求。

我傾向于喜歡基于列表的方法,因?yàn)槲彝ǔjP(guān)心排序,列表確保我保留順序。

最重要的是要知道這些選項(xiàng)是可用的,這樣您就可以聰明地使用最簡單的選項(xiàng)來滿足您的特定情況。

從表面上看,這些代碼樣例看似簡單,但我發(fā)現(xiàn)使用這些方法生成快速的信息片非常常見,他們可以增加或澄清更復(fù)雜的分析。

DataFrame中數(shù)據(jù)的好處在于它很容易轉(zhuǎn)換為其他格式,如Excel,CSV, HTML,LaTeX等。

這種靈活性對于臨時報(bào)告生成非常方便。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python制作爬蟲抓取美女圖

    Python制作爬蟲抓取美女圖

    本文主要介紹了Python制作爬蟲抓取美女圖,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2016-01-01
  • 深入理解python中的閉包和裝飾器

    深入理解python中的閉包和裝飾器

    下面小編就為大家?guī)硪黄钊肜斫鈖ython中的閉包和裝飾器。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-06-06
  • Python中文編碼知識點(diǎn)

    Python中文編碼知識點(diǎn)

    在本篇文章里小編給大家分享了關(guān)于Python中文編碼的相關(guān)知識點(diǎn)以及對應(yīng)實(shí)例內(nèi)容,有興趣的朋友們學(xué)習(xí)下。
    2019-02-02
  • Python實(shí)現(xiàn)的讀取/更改/寫入xml文件操作示例

    Python實(shí)現(xiàn)的讀取/更改/寫入xml文件操作示例

    這篇文章主要介紹了Python實(shí)現(xiàn)的讀取/更改/寫入xml文件操作,涉及Python針對xml文件的讀取、節(jié)點(diǎn)操作、寫入等相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下
    2018-08-08
  • python 利用zmail庫發(fā)送郵件

    python 利用zmail庫發(fā)送郵件

    這篇文章主要介紹了python 如何利用zmail庫發(fā)送郵件,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-09-09
  • python Zmail模塊簡介與使用示例

    python Zmail模塊簡介與使用示例

    這篇文章主要介紹了python Zmail模塊簡介與使用示例,幫助大家利用python收發(fā)郵件,感興趣的朋友可以了解下
    2020-12-12
  • Python 如何將字符串每兩個用空格隔開

    Python 如何將字符串每兩個用空格隔開

    這篇文章主要介紹了Python Python 如何將字符串每兩個用空格隔開的實(shí)現(xiàn)方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • Python標(biāo)準(zhǔn)庫inspect的具體使用方法

    Python標(biāo)準(zhǔn)庫inspect的具體使用方法

    本篇文章主要介紹了Python標(biāo)準(zhǔn)庫inspect的具體使用方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-12-12
  • 詳解Python中Addict模塊的使用方法

    詳解Python中Addict模塊的使用方法

    Addit是一個Python模塊,除了提供標(biāo)準(zhǔn)的字典語法外,Addit 生成的字典的值既可以使用屬性來獲取,也可以使用屬性進(jìn)行設(shè)置。本文將詳細(xì)講講它的使用方法,需要的可以參考一下
    2022-05-05
  • Python中使用logging模塊代替print(logging簡明指南)

    Python中使用logging模塊代替print(logging簡明指南)

    這篇文章主要介紹了Python中使用logging模塊代替print的好處說明,主旨是logging模塊簡明指南,logging模塊的使用方法介紹,需要的朋友可以參考下
    2014-07-07

最新評論