欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas自定義shift與DataFrame求差集的小技巧

 更新時(shí)間:2022年02月28日 09:51:09   作者:小小明-代碼實(shí)體  
Python是進(jìn)行數(shù)據(jù)分析的一種出色語(yǔ)言,主要是因?yàn)橐詳?shù)據(jù)為中心的python軟件包具有奇妙的生態(tài)系統(tǒng),下面這篇文章主要給大家介紹了關(guān)于Pandas自定義shift與DataFrame求差集的相關(guān)資料,需要的朋友可以參考下

大家好,我是小小明。今天分享兩個(gè)小技巧:

Pandas的高級(jí)shift偏移

有很多玩量化的朋友經(jīng)常碰到類(lèi)似這樣的問(wèn)題:

image-20210719013514514

其中有位量化大佬居然在半年后的今天又問(wèn)了我一遍怎么實(shí)現(xiàn)這樣的效果,他居然忘了我之前給他寫(xiě)過(guò)實(shí)現(xiàn)。為了避免有人再碰到類(lèi)似的問(wèn)題,特別寫(xiě)下此文。

我們知道Pandas默認(rèn)的API是不支持這樣的操作的,這個(gè)只能自己想辦法實(shí)現(xiàn)。下面我借助數(shù)值索引實(shí)現(xiàn)這樣的功能,并封裝起來(lái)。

最終我們封裝的方法如下:

import numpy as np
import pandas as pd

def adv_shift(s, n, na_value=pd.NA):
    t = np.arange(s.shape[0])-n
    t[t < 0] = s.shape[0]
    tmp = s.append(pd.Series(na_value))
    return pd.Series(tmp.iloc[t].values, index=s.index)

然后生成測(cè)試數(shù)據(jù)完成這個(gè)需求:

df = pd.DataFrame({"a": [200, 300, 500, 800, 600], "b": [1, 1, 1, 2, 1]})
df['c'] = df.a-adv_shift(df.a, df.b, 0)
df
 abc
02001200
13001100
25001200
38002500
46001-200

可以看到結(jié)果完全滿足要求。

如果你希望直接給DataFrame對(duì)象增加高級(jí)偏移adv_shift方法,則可以這樣寫(xiě):

def adv_shift(self, field, n, na_value=pd.NA):
    t = np.arange(self.shape[0])-self[n]
    s = self[field]
    t[t < 0] = s.shape[0]
    tmp = s.append(pd.Series(na_value))
    return pd.Series(tmp.iloc[t].values, index=s.index)

pd.DataFrame.adv_shift = adv_shift

調(diào)用方式:

df['c'] = df.a-df.adv_shift("a", "b", 0)
df
 abc
02001200
13001100
25001200
38002500
46001-200

最終結(jié)果與上述一致。

Datafream對(duì)象求差集

下面我們?cè)倏纯慈绾吻蠼釪atafream對(duì)象的交集、并集和差集:

import pandas as pd

df1 = pd.DataFrame([[1, 11], [2, 22], [3, 33]],
                   columns=['a', 'b'])
df2 = pd.DataFrame([[0, 0], [1, 11], [2, 22], [4, 44]], columns=['a', 'b'])
display(df1)
display(df2)

image-20210719014818463

交集和并集一般的實(shí)現(xiàn)都是使用merge方法。

取交集:

df1.merge(df2)

去并集:

df1.merge(df2, how='outer')

關(guān)于取差集,我采用的是去重法。思路是,將df1與df2拼接,然后將重復(fù)的都去掉不保留,為了將df2全部去掉,將df2拼接兩次,這樣所有df2的數(shù)據(jù)都會(huì)產(chǎn)生重新而被刪除,df1存在于與df2一致的數(shù)據(jù)也會(huì)被刪除。

代碼為:

pd.concat([df1, df2, df2]).drop_duplicates(keep=False)

測(cè)試結(jié)果:

image-20210719020032890

總結(jié) 

到此這篇關(guān)于Pandas自定義shift與DataFrame求差集的文章就介紹到這了,更多相關(guān)Pandas shift與DataFrame求差集內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python實(shí)戰(zhàn)之Scrapy框架爬蟲(chóng)爬取微博熱搜

    python實(shí)戰(zhàn)之Scrapy框架爬蟲(chóng)爬取微博熱搜

    前面講解了Scrapy中各個(gè)模塊基本使用方法以及代理池、Cookies池。接下來(lái)我們以一個(gè)反爬比較強(qiáng)的網(wǎng)站新浪微博為例,來(lái)實(shí)現(xiàn)一下Scrapy的大規(guī)模爬取。
    2021-09-09
  • Python簡(jiǎn)單刪除列表中相同元素的方法示例

    Python簡(jiǎn)單刪除列表中相同元素的方法示例

    這篇文章主要介紹了Python簡(jiǎn)單刪除列表中相同元素的方法,結(jié)合具體實(shí)例形式分析了Python使用list、set方法針對(duì)列表元素的去重與排序操作實(shí)現(xiàn)技巧,非常簡(jiǎn)單實(shí)用,需要的朋友可以參考下
    2017-06-06
  • python的pip安裝以及使用教程

    python的pip安裝以及使用教程

    這篇文章主要為大家詳細(xì)介紹了python的pip安裝以及使用教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-09-09
  • 使用Pyparsing處理復(fù)雜文本實(shí)現(xiàn)過(guò)程

    使用Pyparsing處理復(fù)雜文本實(shí)現(xiàn)過(guò)程

    這篇文章主要為大家介紹了使用Pyparsing處理復(fù)雜文本的實(shí)現(xiàn)過(guò)程詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-05-05
  • python中json格式處理和字典的關(guān)系

    python中json格式處理和字典的關(guān)系

    今天我們先講一下編寫(xiě)python腳本處理json的核心功能,有些散亂,后期在進(jìn)行整體腳本的編寫(xiě),對(duì)python?json字典關(guān)系相關(guān)知識(shí)感興趣的朋友一起看看吧
    2022-06-06
  • Python 中省略號(hào)對(duì)象的使用

    Python 中省略號(hào)對(duì)象的使用

    作為一名經(jīng)驗(yàn)豐富的 Python 開(kāi)發(fā)人員,您可能遇到過(guò) Python 中的三個(gè)點(diǎn)…省略號(hào)對(duì)象, 如果您嘗試在 Python 解釋器中打印此內(nèi)容,它將顯示一個(gè)省略號(hào),本篇文章將介紹 Python 中省略號(hào)對(duì)象的使用,感興趣的朋友跟隨小編一起看看吧
    2023-10-10
  • Python 列表推導(dǎo)式與字典推導(dǎo)式的實(shí)現(xiàn)

    Python 列表推導(dǎo)式與字典推導(dǎo)式的實(shí)現(xiàn)

    本文主要介紹了Python 列表推導(dǎo)式與字典推導(dǎo)式的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-12-12
  • Python單元測(cè)試工具doctest和unittest使用解析

    Python單元測(cè)試工具doctest和unittest使用解析

    這篇文章主要介紹了Python單元測(cè)試工具doctest和unittest使用解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-09-09
  • 我就是這樣學(xué)習(xí)Python中的列表

    我就是這樣學(xué)習(xí)Python中的列表

    這篇文章主要給大家介紹了關(guān)于我是如何學(xué)習(xí)Python中的列表的,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06
  • 在python里協(xié)程使用同步鎖Lock的實(shí)例

    在python里協(xié)程使用同步鎖Lock的實(shí)例

    今天小編就為大家分享一篇在python里協(xié)程使用同步鎖Lock的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-02-02

最新評(píng)論