欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas技巧分享之創(chuàng)建測試數(shù)據(jù)

 更新時間:2023年07月04日 09:14:42   作者:databook  
學習pandas的過程中,為了嘗試pandas提供的各類功能強大的函數(shù),常常需要花費很多時間去創(chuàng)造測試數(shù)據(jù),本篇介紹了一些快速創(chuàng)建測試數(shù)據(jù)的方法,需要的可以參考一下

學習pandas的過程中,為了嘗試pandas提供的各類功能強大的函數(shù),常常需要花費很多時間去創(chuàng)造測試數(shù)據(jù)。

pandas中,快速創(chuàng)建測試數(shù)據(jù)可以更快的評估 pandas 函數(shù)。

通過生成一組測試數(shù)據(jù),可以評估例如 read_csv、read_excel、groupby等函數(shù),以確保這些函數(shù)在處理不同數(shù)據(jù)格式和結(jié)構(gòu)時都能正常工作。

本篇介紹一些快速創(chuàng)建測試數(shù)據(jù)的方法,提高學習pandas的效率。

1. 一般方法

一般創(chuàng)建測試數(shù)據(jù)的有兩種:

  • 一種是直接創(chuàng)建每行每列的數(shù)據(jù)
  • 用 numpy 隨機生成二維數(shù)組

1.1. 直接創(chuàng)建數(shù)據(jù)

這種方式之前的視頻中已經(jīng)多次使用,直接創(chuàng)建數(shù)據(jù)雖然麻煩,但好處是每個數(shù)據(jù)都可控,不論是數(shù)據(jù)類型還是值都高度可控。

import pandas as pd
df = pd.DataFrame(
    {
        "數(shù)學": [100, 88, 94, 76, 84],
        "語文": [98, 80, 86, 76, 90],
        "英語": [95, 91, 86, 95, 83],
    },
    index=["小紅", "小明", "小汪", "小李", "小張"],
)
df

1.2. 隨機二維數(shù)組

隨機生成二維數(shù)組需要用到numpy庫,通過 numpy生成隨機二維數(shù)據(jù),然后將其轉(zhuǎn)換為pandasDataFrame

比如,下面生成一個3行4列的隨機數(shù)據(jù):

pd.DataFrame(np.random.rand(3, 4))

上面的數(shù)據(jù)是隨機的,每次運行產(chǎn)生的結(jié)果會不一樣。

隨機創(chuàng)建數(shù)據(jù)時,也可以設(shè)置索引和列名。

pd.DataFrame(
    np.random.rand(3, 4),
    index=["row1", "row2", "row3"],
    columns=["col1", "col2", "col3", "col4"],
)

2. 特殊技巧

上面介紹隨機生成數(shù)據(jù)的方法只能生成浮點型數(shù)據(jù),而且索引和列名都只能是默認的自增數(shù)字,數(shù)據(jù)的多樣性不夠。

下面介紹pandas自身提供的一些隨機生成數(shù)據(jù)方法,可以生成不同類型的隨機數(shù)據(jù)。

2.1. makeDataFrame

makeDataFrame() 方法會隨機創(chuàng)建一個 30x4 的數(shù)據(jù)集。

df = pd.util.testing.makeDataFrame()
print(df.shape)
df.head()

索引是隨機字符串。

2.2. makeMissingDataFrame

makeMissingDataFrame() 方法會隨機創(chuàng)建一個 30x4 包含缺失值的數(shù)據(jù)集,缺失值的位置也是隨機的。

df = pd.util.testing.makeMissingDataframe()
print(df.shape)
df.head()

2.3. makeTimeDataFrame

makeTimeDataFrame() 方法會隨機創(chuàng)建一個 30x4 包含的數(shù)據(jù)集,索引是自增的日期。

df = pd.util.testing.makeTimeDataFrame()
print(df.shape)
df.head()

2.4. makeMixedDataFrame

makeMixedDataFrame()方法會隨機創(chuàng)建一個 5x4的數(shù)據(jù)集,其中列的類型是多樣的,有字符串,日期和數(shù)值。

df = pd.util.testing.makeMixedDataFrame()
print(df.shape)
df

3. 補充

上面介紹的方法生成的數(shù)據(jù)集不大,如果需要生成數(shù)據(jù)量較大的數(shù)據(jù)集的話,可以循環(huán)生成DataFrame,然后再拼接在一起。

上面介紹的方法,每次生成的數(shù)據(jù)集的值是隨機的,不用擔心拼接后全是重復的數(shù)據(jù)。

此外,除了上面介紹的方法之外,pd.util.testing 還有其他一些創(chuàng)建數(shù)據(jù)的方法,歡迎大家去探索,使用。

到此這篇關(guān)于Pandas技巧分享之創(chuàng)建測試數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Pandas創(chuàng)建測試數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python二叉樹類以及其4種遍歷方法實例

    python二叉樹類以及其4種遍歷方法實例

    二叉樹是一種特殊的樹,最直觀地體現(xiàn)于它的每個節(jié)點至多有兩個子節(jié)點,二叉樹是非常實用的一種數(shù)據(jù)結(jié)構(gòu),常常用于實現(xiàn)二叉查找樹及二叉堆等,下面這篇文章主要給大家介紹了關(guān)于python二叉樹類以及其4種遍歷方法的相關(guān)資料,需要的朋友可以參考下
    2022-05-05
  • python+openCV對視頻進行截取的實現(xiàn)

    python+openCV對視頻進行截取的實現(xiàn)

    這篇文章主要介紹了python+openCV對視頻進行截取的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-11-11
  • Python中with...as...的使用方法

    Python中with...as...的使用方法

    with是從Python2.5引入的一個新的語法,它是一種上下文管理協(xié)議,目的在于從流程圖中把 try,except 和finally 關(guān)鍵字和資源分配釋放相關(guān)代碼統(tǒng)統(tǒng)去掉,簡化try….except….finlally的處理流程。具體內(nèi)容請看下面小編詳細的介紹
    2021-09-09
  • python腳本實現(xiàn)查找webshell的方法

    python腳本實現(xiàn)查找webshell的方法

    這篇文章主要介紹了python腳本實現(xiàn)查找webshell的方法,是很實用的一個功能,需要的朋友可以參考下
    2014-07-07
  • 如何修改新版Python的pip默認安裝路徑

    如何修改新版Python的pip默認安裝路徑

    pip安裝的第三方庫默認存放在C盤中,為了便于管理和不過度占用C盤空間所以想修改默認的pip路徑,這篇文章主要介紹了修改新版Python的pip默認安裝路徑的過程,需要的朋友可以參考下
    2024-03-03
  • 對python產(chǎn)生隨機的二維數(shù)組實例詳解

    對python產(chǎn)生隨機的二維數(shù)組實例詳解

    今天小編就為大家分享一篇對python產(chǎn)生隨機的二維數(shù)組實例詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12
  • Python利用jmespath模塊進行json數(shù)據(jù)處理

    Python利用jmespath模塊進行json數(shù)據(jù)處理

    jmespath是python的第三方模塊,是需要額外安裝的。它在python原有的json數(shù)據(jù)處理上做出了很大的貢獻。本文將詳細介紹如何利用jmespath實現(xiàn)json數(shù)據(jù)處理,需要的可以參考一下
    2022-03-03
  • Pycharm最常用的快捷鍵及使用技巧

    Pycharm最常用的快捷鍵及使用技巧

    這篇文章主要介紹了Pycharm常用的快捷鍵及使用技巧,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-03-03
  • Python中jieba庫的介紹與使用

    Python中jieba庫的介紹與使用

    使用jieba庫對一段文本進行詞頻的統(tǒng)計是一件非常有意思的事,我們只需要使用這第三方庫,就可以在不閱讀文本的情況下,得到該文本的高頻率詞匯,這篇文章主要介紹了Python中jieba庫的介紹與使用,需要的朋友可以參考下
    2023-03-03
  • Python全棧之學習HTML

    Python全棧之學習HTML

    這篇文章主要為大家介紹了Python全棧之HTML,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-01-01

最新評論