欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pymongo中聚合查詢的使用方法

 更新時(shí)間:2019年03月22日 10:33:56   作者:楊彥星  
這篇文章主要給大家介紹了關(guān)于pymongo中聚合查詢的使用方法,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用pymongo具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧

前言

在使用mongo數(shù)據(jù)庫時(shí),簡單的查詢基本上可以滿足大多數(shù)的業(yè)務(wù)場景,但是試想一下,如果要統(tǒng)計(jì)某一薦在指定的數(shù)據(jù)中出現(xiàn)了多少次該怎么查詢呢?笨的方法是使用find 將數(shù)據(jù)查詢出來,再使用count() 方法進(jìn)行數(shù)據(jù)統(tǒng)計(jì),這個(gè)場景還好,但是如果要求其中某個(gè)字段的和呢?是不是就非得遍歷出相應(yīng)的數(shù)據(jù)然后再進(jìn)行求和運(yùn)算呢?

在mysql中我們經(jīng)常會(huì)用到count、group by 等查詢,在mongodb中我們也可以使用聚合查詢。

假設(shè)有這樣的一組數(shù)據(jù)


價(jià)格

里面記錄了每種水果的價(jià)格,現(xiàn)在我要統(tǒng)計(jì)一下,各種水果在這張表中出現(xiàn)的次數(shù),如果不用聚合查詢的話,思路應(yīng)該是這樣,先把表中所有的數(shù)據(jù)都取出來,然后初始化一個(gè)字典,然后再遍歷每一行的數(shù)據(jù),獲取它的fName ,然后再更新字典中的計(jì)數(shù),這種方法的時(shí)間復(fù)雜度是O(N)的,如果數(shù)據(jù)量很大的話不是很好,下面來看一下使用聚合是怎么查詢的。

聚合查詢使用的是aggregate函數(shù),它的參數(shù)是 pipeline 管道,管道的概念是用于將當(dāng)前命令的輸出結(jié)果作為下一個(gè)命令的參數(shù),管道是有順序的,比如通過第一個(gè)管道操作以后沒有符合的數(shù)據(jù)那么之后的管道操作也就不會(huì)有輸入,所以一定得要注意管道操作的順序。由于對于上述問題,我們要的是所的數(shù)據(jù)統(tǒng)計(jì),所以這里就不需要$match了

from pymongo import MongoClient

client = MongoClient(host=['%s:%s'%(mongoDBhost,mongoDBport)])
G_mongo = client[mongoDBname]['FruitPrice']

pipeline = [
 {'$group': {'_id': "$fName", 'count': {'$sum': 1}}},
 ]
for i in G_mongo['test'].aggregate(pipeline):
 print i

數(shù)據(jù)大家可以自已構(gòu)造,這里主要是看aggregate的用法。
得到的結(jié)果是

{u'count': 8, u'_id': u'banana'}
{u'count': 9, u'_id': u'pear'}
{u'count': 14, u'_id': u'apple'}

可以看到,一步操作就可以得到相應(yīng)的統(tǒng)計(jì)了。

如果想要獲取價(jià)格在50以上的各種統(tǒng)計(jì)呢?

這時(shí)有pipeline應(yīng)該再$group 之前加上$match 操作

pipeline = [
 {'$match':{'price':{'$gte':50}}},
 {'$group': {'_id': "$fName", 'count': {'$sum': 1}}},
 ]

一定要注意順序

$match里的條件其實(shí)就和使用find函數(shù)里是一樣的。

下面重點(diǎn)來說說$group操作,group意為分組,指數(shù)據(jù)根據(jù)哪個(gè)字段進(jìn)行分組,上面使用的{'$group': {'_id': "$fName", 'count': {'$sum': 1},_id為所要分的組,這里是以fName字段分的,后面的'count': {'$sum': 1},這里的$sum就是求和的意思,后面的值是1,也就是說每出現(xiàn)一次就加1,這樣就能達(dá)到計(jì)數(shù)的目的了,如果要計(jì)算價(jià)格 price 的和,那么這里就應(yīng)該寫成這樣

{'$group': {'_id': "$fName", 'count': {'$sum': '$price'}}}

注意這里的字段要有$ 的,如果我想要求價(jià)格的平均值呢?也就是先要求出價(jià)格的總數(shù),再除以商品的個(gè)數(shù),但是這里有一個(gè)$avg 操作

pipeline = [
 {'$match':{'price':{'$gte':50}}},
 {'$group': {'_id': "$fName", 'avg': {'$avg': '$price'}}},
 ]

得到的結(jié)果

{u'_id': u'banana', u'avg': 66.200000000000003}
{u'_id': u'pear', u'avg': 77.0}
{u'_id': u'apple', u'avg': 74.0}

類似于$ave的操作還有很多,比較常用的是$min(求最小值),$max(求最大值)

pipeline = [
 {'$match':{'price':{'$gte':50}}},
 {'$group': {'_id': "$fName",
  'count':{'$sum':1},
  'priceAll':{'$sum':'$price'},
  'avg': {'$avg': '$price'},
  'min': {'$min':'$price'},
  'max': {'$max':'$price'}
  }
 },
 ]
for i in G_mongo['test'].aggregate(pipeline):
 print i

所有支持的操作可以參考官方文檔:group 支持的操作

以哪個(gè)字段進(jìn)行分組時(shí)必須使用_id。

接下來看一下多鍵分組。

以上在使用group 進(jìn)行分組查詢的時(shí)候,用到的_id都是單一字段,比如我的數(shù)據(jù)庫中有如下數(shù)據(jù)


帶用戶的數(shù)據(jù)

帶有一個(gè)user 字段了,那如果我要根據(jù)user和fName進(jìn)行分組該如何操作呢?
這里可以傳一個(gè)字典進(jìn)去

pipeline = [
 {'$match':{'price':{'$gte':50}}},
 {'$group': {'_id': {'fName':'$fName','user':'$user'},
  'count':{'$sum':1},
  'priceAll':{'$sum':'$price'},
  'avg': {'$avg': '$price'},
  'min': {'$min':'$price'},
  'max': {'$max':'$price'}
  }
 },
 ]
for i in G_mongo['test2'].aggregate(pipeline):
 print i

得到的結(jié)果如下:

{u'count': 1, u'avg': 93.0, u'min': 93, u'max': 93, u'_id': {u'user': u'fanjieying', u'fName': u'pear'}, u'priceAll': 93}
{u'count': 2, u'avg': 88.0, u'min': 87, u'max': 89, u'_id': {u'user': u'yangyanxing', u'fName': u'banana'}, u'priceAll': 176}
{u'count': 2, u'avg': 70.0, u'min': 69, u'max': 71, u'_id': {u'user': u'yangyanxing', u'fName': u'pear'}, u'priceAll': 140}
{u'count': 2, u'avg': 65.5, u'min': 58, u'max': 73, u'_id': {u'user': u'fanjieying', u'fName': u'banana'}, u'priceAll': 131}
{u'count': 3, u'avg': 92.333333333333329, u'min': 86, u'max': 97, u'_id': {u'user': u'fantuan', u'fName': u'banana'}, u'priceAll': 277}
{u'count': 2, u'avg': 78.5, u'min': 73, u'max': 84, u'_id': {u'user': u'yangyanxing', u'fName': u'apple'}, u'priceAll': 157}
{u'count': 3, u'avg': 56.666666666666664, u'min': 51, u'max': 60, u'_id': {u'user': u'fantuan', u'fName': u'pear'}, u'priceAll': 170}
{u'count': 2, u'avg': 81.5, u'min': 73, u'max': 90, u'_id': {u'user': u'fanjieying', u'fName': u'apple'}, u'priceAll': 163}
{u'count': 2, u'avg': 69.5, u'min': 53, u'max': 86, u'_id': {u'user': u'fantuan', u'fName': u'apple'}, u'priceAll': 139}

這里的結(jié)果顯示出每個(gè)用戶買了哪個(gè)商品,一共花了多少錢,最大最小平均值等都可以一次性的展示了,如果要是使用for循環(huán)自已遍歷的話這種時(shí)間復(fù)雜度相當(dāng)高。

這里只是簡單的說了下$group和$match 的用法,聚合查詢支持很多種操作(稱為stages),可以通官方文檔進(jìn)行查看
pymongo 中pipeline中的stages

參考文章

pymongo 的 group by 方法

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對腳本之家的支持。

相關(guān)文章

  • 一篇文章徹底搞懂python正則表達(dá)式

    一篇文章徹底搞懂python正則表達(dá)式

    正則表達(dá)式是一個(gè)特殊的字符序列,它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配,Python 自1.5版本起增加了re模塊,這篇文章主要給大家介紹了如何通過一篇文章徹底搞懂python正則表達(dá)式的相關(guān)資料,需要的朋友可以參考下
    2021-09-09
  • python中GIL的原理及用法總結(jié)

    python中GIL的原理及用法總結(jié)

    在本篇文章里小編給大家整理的是一篇關(guān)于python中GIL的原理及用法總結(jié)內(nèi)容,有需要的朋友們可以學(xué)習(xí)參考下。
    2021-03-03
  • OpenCV利用python來實(shí)現(xiàn)圖像的直方圖均衡化

    OpenCV利用python來實(shí)現(xiàn)圖像的直方圖均衡化

    這篇文章主要介紹了OpenCV利用python來實(shí)現(xiàn)圖像的直方圖均衡化,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-10-10
  • Python實(shí)現(xiàn)發(fā)票自動(dòng)校核微信機(jī)器人的方法

    Python實(shí)現(xiàn)發(fā)票自動(dòng)校核微信機(jī)器人的方法

    這篇文章主要介紹了Python實(shí)現(xiàn)發(fā)票自動(dòng)校核微信機(jī)器人的方法,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-05-05
  • python中的eval函數(shù)使用實(shí)例

    python中的eval函數(shù)使用實(shí)例

    eval() 函數(shù)用來執(zhí)行一個(gè)字符串表達(dá)式,并返回表達(dá)式的值,這篇文章主要介紹了python中的eval函數(shù),需要的朋友可以參考下
    2022-11-11
  • Python計(jì)算機(jī)視覺SIFT尺度不變的圖像特征變換

    Python計(jì)算機(jī)視覺SIFT尺度不變的圖像特征變換

    這篇文章主要為大家介紹了Python計(jì)算機(jī)視覺SIFT尺度不變的圖像特征變換,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • python列表的常用操作方法小結(jié)

    python列表的常用操作方法小結(jié)

    這篇文章主要為大家詳細(xì)介紹了python字典的常用操作方法,主要內(nèi)容包含Python中列表(List)的詳解操作方法,包含創(chuàng)建、訪問、更新、刪除、其它操作等,需要的朋友可以參考下
    2016-05-05
  • python爬蟲設(shè)置每個(gè)代理ip的簡單方法

    python爬蟲設(shè)置每個(gè)代理ip的簡單方法

    在本篇文章里小編給大家整理了一篇關(guān)于python爬蟲設(shè)置每個(gè)代理ip的簡單方法,有興趣的朋友們可以學(xué)習(xí)參考下。
    2021-08-08
  • python實(shí)現(xiàn)圖片上添加圖片

    python實(shí)現(xiàn)圖片上添加圖片

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)圖片上添加圖片,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-11-11
  • python使用sessions模擬登錄淘寶的方式

    python使用sessions模擬登錄淘寶的方式

    這篇文章主要介紹了python使用sessions模擬登錄淘寶的方式,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值 ,需要的朋友可以參考下
    2019-08-08

最新評論