Pandas 同元素多列去重的實(shí)例
有一些問(wèn)題可能會(huì)遇到同元素多列去重問(wèn)題,下面介紹一種非常簡(jiǎn)單效率也很快的做法,用pandas來(lái)實(shí)現(xiàn)。
首先我們看一下數(shù)據(jù)類(lèi)型:
G1 G2 a b b a c d d c e f
對(duì)這樣的兩列數(shù)據(jù)進(jìn)行同元素去重,最終得到結(jié)果為:
G1 G2 a b c d e f
代碼如下:
#-*- coding: utf-8 -*- data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']} data = pd.DataFrame(data) data['G3'] = data['G1'] + '|' + data['G2'] p = [] for i in data['G3'].tolist(): tmp = sorted(i.split('|')) # The most important part,sort p.append(tmp[0] + '|' + tmp[1]) data['G3'] = pd.Series(p) data = data.drop_duplicates('G3')
以上這篇Pandas 同元素多列去重的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
opencv實(shí)現(xiàn)圖像旋轉(zhuǎn)效果
這篇文章主要為大家詳細(xì)介紹了opencv實(shí)現(xiàn)圖像旋轉(zhuǎn)效果,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-03-03Django框架會(huì)話(huà)技術(shù)實(shí)例分析【Cookie與Session】
這篇文章主要介紹了Django框架會(huì)話(huà)技術(shù),結(jié)合實(shí)例形式分析了Django框架Cookie與Session相關(guān)使用技巧與注意事項(xiàng),需要的朋友可以參考下2019-05-05python實(shí)現(xiàn)dijkstra最短路由算法
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)dijkstra最短路由算法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-01-01Python實(shí)現(xiàn)簡(jiǎn)單石頭剪刀布游戲
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)簡(jiǎn)單的石頭剪刀布的游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-01-01Python實(shí)現(xiàn)上下班搶個(gè)順風(fēng)單腳本
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)上下班搶個(gè)順風(fēng)單腳本,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-02-02python+os根據(jù)文件名自動(dòng)生成文本
這篇文章主要為大家詳細(xì)介紹了python+os根據(jù)文件名自動(dòng)生成文本,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-03-03基于Python實(shí)現(xiàn)一鍵找出磁盤(pán)里所有貓照
最近在整理我磁盤(pán)上的照片,發(fā)現(xiàn)不少貓照,突然覺(jué)得若能把這些貓照都挑出來(lái),觀察它們的成長(zhǎng)軌跡也是一件不錯(cuò)的事情。一張一張的找實(shí)在是太費(fèi)勁了,能不能自動(dòng)化地找出來(lái)呢?本文將詳細(xì)為大家講講,需要的可以參考一下2022-05-05