欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

分享python數(shù)據(jù)統(tǒng)計(jì)的一些小技巧

 更新時(shí)間:2016年07月21日 09:44:37   投稿:daisy  
今天這些小技巧在處理python的一些數(shù)據(jù)方面還是很有幫助的,希望能幫到在這方面有需要的童鞋~

最近在用python做數(shù)據(jù)統(tǒng)計(jì),這里總結(jié)了一些最近使用時(shí)查找和總結(jié)的一些小技巧,希望能幫助在做這方面時(shí)的一些童鞋。有些技巧是很平常的用法,平時(shí)我們沒有注意,但是在特定場(chǎng)景,這些小方法還是能帶來(lái)很大的幫助。

1.在字典中將鍵映射到多個(gè)值上面

{'b': [4, 5, 6], 
'a': [1, 2, 3]}

有時(shí)候我們?cè)诮y(tǒng)計(jì)相同key值的時(shí)候,希望把所有相同key的條目添加到以key為鍵的一個(gè)字典中,然后再進(jìn)行各種操作,這時(shí)候我們就可以使用下面的代碼進(jìn)行操作:

from collections import defaultdict
d = defaultdict(list)
print(d)
d['a'].append(1)
d['a'].append(2)
d['a'].append(3)
d['b'].append(4)
d['b'].append(5)
d['b'].append(6)
print(d)
print(d.get("a"))
print(d.keys())
print([d.get(i) for i in d])

這里是使用了collections中的方法,這里面還擁有很多有用的方法,我們有時(shí)間在繼續(xù)進(jìn)行深入了解。

上面代碼運(yùn)行結(jié)果:

defaultdict(, {})
defaultdict(, {'b': [4, 5, 6], 'a': [1, 2, 3]})
[1, 2, 3]
dict_keys(['b', 'a'])
[[4, 5, 6], [1, 2, 3]]

我們將數(shù)據(jù)填入之后,相當(dāng)于進(jìn)行快速分組,然后遍歷每個(gè)組就可以統(tǒng)計(jì)一些我們需要的數(shù)據(jù)。

2.迅速轉(zhuǎn)換字典鍵值對(duì)

data = {...}
zip(data.values(), data.keys())

data是我們的格式數(shù)據(jù),使用zip后進(jìn)行快速鍵值轉(zhuǎn)換,然后可以使用max,min之類函數(shù)進(jìn)行數(shù)據(jù)操作。

3.通過公共鍵對(duì)字典進(jìn)行排序

from operator import itemgetter
data = [
  {'name': "bran", "uid": 101},
  {'name': "xisi", "uid": 102},
  {'name': "land", "uid": 103}
]
print(sorted(data, key=itemgetter("name")))
print(sorted(data, key=itemgetter("uid")))

數(shù)據(jù)格式就是data,我們想要對(duì)name或者uid進(jìn)行排序我們就是用代碼中的方法。
運(yùn)行結(jié)果:

[{'name': 'bran', 'uid': 101}, {'name': 'land', 'uid': 103}, {'name': 'xisi', 'uid': 102}]
[{'name': 'bran', 'uid': 101}, {'name': 'xisi', 'uid': 102}, {'name': 'land', 'uid': 103}]

正如我們期望中的一樣

4.對(duì)列表中的多個(gè)字典根據(jù)某一字段進(jìn)行分組

注意注意,在進(jìn)行分組前要首先對(duì)數(shù)據(jù)進(jìn)行排序處理,排序字段根據(jù)實(shí)際要求來(lái)選擇

即將處理的數(shù)據(jù):

rows = [
  {'name': "bran", "uid": 101, "class": 13},
  {'name': "xisi", "uid": 101, "class": 11},
  {'name': "land", "uid": 103, "class": 10}
]

期望處理結(jié)果:

{
101: [{'name': 'xisi', 'class': 11, 'uid': 101},{'name': 'bran', 'class': 13, 'uid': 101}],
103: [{'name': 'land', 'class': 10, 'uid': 103}]
}

我們按照uid進(jìn)行分組,這里只是演示,uid一般也不會(huì)重復(fù)。

這個(gè)比較復(fù)雜一點(diǎn),我們一部一步來(lái)分解

some = [('a', [1, 2, 3]), ('b', [4, 5, 6])]
print(dict(some))

結(jié)果:

{'b': [4, 5, 6], 'a': [1, 2, 3]}

這里我們的目的是將元組轉(zhuǎn)換成字典,這個(gè)很簡(jiǎn)單,應(yīng)該都能看懂。接著我們來(lái)下一步對(duì)待處理數(shù)據(jù)進(jìn)行排序:

data_one = sorted(rows, key=itemgetter("class"))
print(data_one)
data_two = sorted(rows, key=lambda x: (x["uid"], x["class"]))
print(data_two)

這里我們提供兩種排序方式原理相同,只是樣式稍有區(qū)別,第一種data_one是直接使用itemgetter,按照我們前面使用過得,直接按照某一字段進(jìn)行排序,可是有時(shí)候我們會(huì)有另一種要求:

先按照某一字段排序,當(dāng)?shù)谝蛔侄沃貜?fù)時(shí),再按照另一字段排序。

這時(shí)我們就用第二種方法,進(jìn)行多字段值排序。
排序結(jié)果如下:

[{'name': 'land', 'class': 10, 'uid': 103}, {'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}]
[{'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}, {'name': 'land', 'class': 10, 'uid': 103}]

結(jié)果大家慢慢看一下,還是略有差別。

接下來(lái)就進(jìn)行最后一步了,將我們剛才講的兩種方式結(jié)合起來(lái)使用:

data = dict([(g, list(k)) for g, k in groupby(data_two, key=lambda x: x["uid"])])
print(data)

我們對(duì)排序好的數(shù)據(jù)進(jìn)行分組,然后生成元組列表,最后將其轉(zhuǎn)換成字典,這里大功告成,我們成功將數(shù)據(jù)進(jìn)行分組。

python數(shù)據(jù)統(tǒng)計(jì)的一些小技巧就分享到這,有需要的可以參考學(xué)習(xí)。

相關(guān)文章

  • numpy.linspace函數(shù)具體使用詳解

    numpy.linspace函數(shù)具體使用詳解

    這篇文章主要介紹了numpy.linspace具體使用詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-05-05
  • certifi輕松地管理Python證書信任鏈保障網(wǎng)絡(luò)安全

    certifi輕松地管理Python證書信任鏈保障網(wǎng)絡(luò)安全

    在使用Python進(jìn)行網(wǎng)絡(luò)通信時(shí),我們通常需要使用第三方庫(kù)來(lái)處理HTTPS連接,其中,certifi庫(kù)是一個(gè)非常實(shí)用的庫(kù),可以幫助我們輕松地管理Python的證書信任鏈
    2024-01-01
  • python全局變量引用與修改過程解析

    python全局變量引用與修改過程解析

    這篇文章主要介紹了python全局變量引用與修改過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-01-01
  • 在Django的視圖(View)外使用Session的方法

    在Django的視圖(View)外使用Session的方法

    這篇文章主要介紹了在Django的視圖(View)外使用Session的方法,Django是最具人氣的Python web開發(fā)框架,需要的朋友可以參考下
    2015-07-07
  • python實(shí)現(xiàn)一般游戲的自動(dòng)點(diǎn)擊具體操作

    python實(shí)現(xiàn)一般游戲的自動(dòng)點(diǎn)擊具體操作

    這篇文章主要介紹了python實(shí)現(xiàn)一般游戲的自動(dòng)點(diǎn)擊,本文給大家分享具體操作代碼及需要的軟件,需要的朋友可以參考下
    2021-10-10
  • Flask中jinja2的繼承實(shí)現(xiàn)方法及實(shí)例

    Flask中jinja2的繼承實(shí)現(xiàn)方法及實(shí)例

    在本篇文章里小編給大家分享的是一篇關(guān)于Flask中jinja2的繼承實(shí)現(xiàn)方法及實(shí)例,有興趣的朋友們可以學(xué)習(xí)下。
    2021-03-03
  • vscode 與pycharm 配置 autopep8自動(dòng)格式化代碼

    vscode 與pycharm 配置 autopep8自動(dòng)格式化代碼

    autopep8是一個(gè)可以將Python代碼自動(dòng)排版為PEP8風(fēng)格第三方包,使用它可以輕松地排版出格式優(yōu)美整齊的代碼,這里就為大家分享一下具體的方法
    2023-09-09
  • 使用實(shí)現(xiàn)python連接hive數(shù)倉(cāng)的示例代碼

    使用實(shí)現(xiàn)python連接hive數(shù)倉(cāng)的示例代碼

    這篇文章主要為大家詳細(xì)介紹了使用實(shí)現(xiàn)python連接hive數(shù)倉(cāng)的相關(guān)知識(shí),文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2024-03-03
  • 詳解python中sort排序使用

    詳解python中sort排序使用

    這篇文章主要介紹了python中sort排序使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • 詳解在SpringBoot如何優(yōu)雅的使用多線程

    詳解在SpringBoot如何優(yōu)雅的使用多線程

    這篇文章主要帶大家快速了解一下@Async注解的用法,包括異步方法無(wú)返回值、有返回值,最后總結(jié)了@Async注解失效的幾個(gè)坑,感興趣的小伙伴可以了解一下
    2023-02-02

最新評(píng)論