欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas的AB BA類型數(shù)據(jù)框去重復(fù)

 更新時間:2023年05月25日 10:09:46   作者:Victor  
這篇文章主要為大家介紹了Pandas的AB BA類型數(shù)據(jù)框去重復(fù)實(shí)現(xiàn)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

正文

從string-db下載蛋白質(zhì)相互作用的信息,在處理時發(fā)現(xiàn)蛋白A與B互作被記錄了兩次比如下邊的例子(即AB、BA)

df.drop_duplicates()
# Symbol1  Symbol2
# Gnai3  Pdcl2
# Pdcl2  Gnai3
# Gm4340  Gm3376
# Gm3376  Gm4340

而且drop_duplicates不能去除重復(fù),因?yàn)樗麄冊诓煌牧?,因此可以想個方法,新建一列。

字符串的比較大小

字符串的比較大小是根據(jù)字符串按位比較,兩個字符串第一位字符的ascii碼誰大,字符串就大,不再比較后面的,比如

"Gnai3">"Pdcl2"
# False

axis=1是對每一行循環(huán),總是把大的放在前邊。

df.loc[:,"temp"]=df.apply(lambda x: f"{x[0]}-{x[1]}" if x[0]>x[1] else f"{x[1]}-{x[0]}",axis=1)
# Symbol1 Symbol2 temp
# Gnai3  Pdcl2 Pdcl2-Gnai3
# Pdcl2  Gnai3 Pdcl2-Gnai3
# Gm4340 Gm3376 Gm4340-Gm3376
# Gm3376 m4340 Gm4340-Gm3376

對temp的行去重復(fù)

這個時候再對temp的行去重復(fù),就可以了

df.drop_duplicates(subset="temp")
# Symbol1 Symbol2 temp
# Pdcl2 Gnai3 Pdcl2-Gnai3
# Gm4340 Gm3376 Gm4340-Gm3376

最后再刪除temp列

df.drop_duplicates(subset="temp").drop(columns="temp")
# Symbol1  Symbol2
# Gnai3  Pdcl2
# Gm4340  Gm3376

以上就是Pandas的AB BA類型數(shù)據(jù)框去重復(fù)的詳細(xì)內(nèi)容,更多關(guān)于Pandas數(shù)據(jù)框去重復(fù)的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python利用PaddleOCR制作個搜題小工具

    Python利用PaddleOCR制作個搜題小工具

    PaddleOCR是一個基于百度飛槳的OCR工具庫,單模型支持中英文數(shù)字組合識別、豎排文本識別、長文本識別。本文將利用PaddleOCR開發(fā)一個搜題小工具,感興趣的可以了解一下
    2022-06-06
  • python cs架構(gòu)實(shí)現(xiàn)簡單文件傳輸

    python cs架構(gòu)實(shí)現(xiàn)簡單文件傳輸

    這篇文章主要為大家詳細(xì)介紹了python cs架構(gòu)實(shí)現(xiàn)簡單文件傳輸,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-07-07
  • Python標(biāo)準(zhǔn)庫內(nèi)置函數(shù)complex介紹

    Python標(biāo)準(zhǔn)庫內(nèi)置函數(shù)complex介紹

    這篇文章主要介紹了Python標(biāo)準(zhǔn)庫內(nèi)置函數(shù)complex介紹,本文先是講解了complex的作用和使用注意,然后給出了使用示例,需要的朋友可以參考下
    2014-11-11
  • PyCharm配置anaconda環(huán)境的步驟詳解

    PyCharm配置anaconda環(huán)境的步驟詳解

    PyCharm是一款很好用很流行的python編輯器。Anaconda通過管理工具包、開發(fā)環(huán)境、Python版本,大大簡化了你的工作流程。今天通過本文給大家分享PyCharm配置anaconda環(huán)境,感興趣的朋友一起看看吧
    2020-07-07
  • plt.figure()參數(shù)使用詳解及運(yùn)行演示

    plt.figure()參數(shù)使用詳解及運(yùn)行演示

    這篇文章主要介紹了plt.figure()參數(shù)使用詳解及運(yùn)行演示,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • Flask接收上傳圖片方法實(shí)現(xiàn)

    Flask接收上傳圖片方法實(shí)現(xiàn)

    本文主要介紹了Flask接收上傳圖片方法實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-07-07
  • Pandas 中的 drop_duplicates()詳解

    Pandas 中的 drop_duplicates()詳解

    Pandas 中的 drop_duplicates() 函數(shù)用于從 DataFrame 中刪除重復(fù)的行,該函數(shù)有一些參數(shù),允許你進(jìn)行不同方式的重復(fù)行處理,本文給大家介紹Pandas 中的 drop_duplicates(),感興趣的朋友跟隨小編一起看看吧
    2023-09-09
  • Python+Appium實(shí)現(xiàn)自動搶微信紅包

    Python+Appium實(shí)現(xiàn)自動搶微信紅包

    不知從何時開始微信紅包橫空出世,對于網(wǎng)速和手速慢的人只能在一旁觀望,做為python的學(xué)習(xí)者就是要運(yùn)用編程解決生活和工作上的事情。于是我用python解決我們的手速問題python實(shí)現(xiàn)自動搶微信紅包,至于網(wǎng)速慢得那就只能自己花錢提升了。
    2021-05-05
  • Python編程實(shí)現(xiàn)tail-n查看日志文件的方法

    Python編程實(shí)現(xiàn)tail-n查看日志文件的方法

    這篇文章主要介紹了Python編程實(shí)現(xiàn)tail-n查看日志文件的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • 超級詳細(xì)實(shí)用的pycharm常用快捷鍵

    超級詳細(xì)實(shí)用的pycharm常用快捷鍵

    本文詳細(xì)總結(jié)了Pycharm的常用快捷鍵,下文介紹使用方法和場景, 并不需要記憶這些快捷鍵, 你只需要知道有這些快捷鍵, 再需要用的時候查看一下, 用的多了自然也就記住了,需要的朋友可以參考下
    2021-05-05

最新評論