解決Pymongo insert時(shí)會(huì)自動(dòng)添加_id的問(wèn)題
在使用pymongo時(shí)遇到了一個(gè)小坑:
在Flask框架中,將字典插入mongodb后再返回就報(bào)錯(cuò)
@app.route('xxxx') def main(): ... data = { 'a':'a', 'b':'b' } mycol.insert_one(data) return data
Traceback (most recent call last): File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 2464, in __call__ return self.wsgi_app(environ, start_response) File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 2450, in wsgi_app response = self.handle_exception(e) File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 1867, in handle_exception reraise(exc_type, exc_value, tb) File "/home/xiang/.local/lib/python3.6/site-packages/flask/_compat.py", line 39, in reraise raise value File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 2447, in wsgi_app response = self.full_dispatch_request() File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 1953, in full_dispatch_request return self.finalize_request(rv) File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 1968, in finalize_request response = self.make_response(rv) File "/home/xiang/.local/lib/python3.6/site-packages/flask/app.py", line 2112, in make_response rv = jsonify(rv) File "/home/xiang/.local/lib/python3.6/site-packages/flask/json/__init__.py", line 370, in jsonify dumps(data, indent=indent, separators=separators) + "\n", File "/home/xiang/.local/lib/python3.6/site-packages/flask/json/__init__.py", line 211, in dumps rv = _json.dumps(obj, **kwargs) File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/__init__.py", line 412, in dumps **kw).encode(obj) File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/encoder.py", line 298, in encode chunks = list(chunks) File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/encoder.py", line 696, in _iterencode for chunk in _iterencode_dict(o, _current_indent_level): File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/encoder.py", line 652, in _iterencode_dict for chunk in chunks: File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/encoder.py", line 716, in _iterencode o = _default(o) File "/home/xiang/.local/lib/python3.6/site-packages/flask/json/__init__.py", line 100, in default return _json.JSONEncoder.default(self, o) File "/home/xiang/.local/lib/python3.6/site-packages/simplejson/encoder.py", line 273, in default o.__class__.__name__) TypeError: Object of type ObjectId is not JSON serializable
這是由于pymongo在進(jìn)行插入操作時(shí),如果字典中沒(méi)有‘_id',會(huì)自動(dòng)添加‘_id',而它的值為ObjectId實(shí)例,flask在對(duì)返回值進(jìn)行編碼時(shí)無(wú)法編碼ObjectId類(lèi)型實(shí)例,所以報(bào)錯(cuò),解決辦法就是去掉‘_id'或者mycol.insert_one(data.copy())
補(bǔ)充知識(shí):pymongo去重: 插入數(shù)據(jù)時(shí),不存在則插入,存在則不執(zhí)行
爬蟲(chóng)想把爬取的數(shù)據(jù)存入到mongoDB中, 這時(shí)候經(jīng)常遇到的一個(gè)需求就是插入的數(shù)據(jù)已經(jīng)存在數(shù)據(jù)庫(kù)中, 因此插入前去重就是一個(gè)經(jīng)常性的課題.
我的想法是:
如果數(shù)據(jù)庫(kù)中已經(jīng)存在這個(gè)數(shù)據(jù), 那么就什么也不操作
如果數(shù)據(jù)不存在, 則插入這個(gè)數(shù)據(jù)
為了實(shí)現(xiàn)這個(gè)想法, 查了很多文獻(xiàn), 發(fā)現(xiàn)使用update 可以實(shí)現(xiàn)
下面就是我測(cè)試的代碼
# 首先在數(shù)據(jù)中插入一條數(shù)據(jù) document = { 'p_id': 'f75046d73a0c4bf88f0b7342e60722c4', 'c_name': 'Ken', 'c_star': '5.0', 'bought': None, 'c_time': '2017年3月23日', 'c_userful': 13, 'c_comment': ['4歳になるトイプードル用に購(gòu)入。', '今までエサは床に食器直置きで與えていましたが、食後にむせていることがたびたび目撃されたので', '「もしかして食べづらいのでは?」と思い調(diào)べてみたところ、この商品にたどり著きました。', '足が長(zhǎng)いので食事中は頭が完全に下に向いており、胃や足腰に負(fù)擔(dān)がかかっていたと思われます。'], 'gmt_create': datetime.now().strftime('%Y-%m-%d %H:%M:%S'), } collection.insert(document)
通過(guò)mongoDB可視化工具查看數(shù)據(jù)庫(kù),發(fā)現(xiàn)數(shù)據(jù)已經(jīng)存在
要實(shí)現(xiàn)如果不存在就插入,如果存在就不插入的要求,我們需要用到 update的一個(gè)參數(shù):‘$setOnInsert'
通過(guò)閱讀官方文檔我們可以發(fā)現(xiàn) 與$setOnInsert方法想配合的最重要的參數(shù)就是 upsert:True
update源碼中的upsert參數(shù)默認(rèn)為False,只需要將update方法的upsert參數(shù)修改為T(mén)rue是否就能達(dá)到需要的效果呢?
現(xiàn)在我們執(zhí)行相同數(shù)據(jù)的插入看看效果
# 首先需要限定一個(gè)重復(fù)的條件,比如我們想除了gmt_create參數(shù)以外,全部不一樣就算不重復(fù), 先限定一個(gè)條件 result_find = { 'p_id': 'f75046d73a0c4bf88f0b7342e60722c4', 'c_name': 'Ken', 'c_star': '5.0', 'bought': None, 'c_time': '2017年3月23日', 'c_userful': 13, 'c_comment': ['4歳になるトイプードル用に購(gòu)入。', '今までエサは床に食器直置きで與えていましたが、食後にむせていることがたびたび目撃されたので', '「もしかして食べづらいのでは?」と思い調(diào)べてみたところ、この商品にたどり著きました。', '足が長(zhǎng)いので食事中は頭が完全に下に向いており、胃や足腰に負(fù)擔(dān)がかかっていたと思われます。'] } # 執(zhí)行 update collection.update( result_find, {'$setOnInsert': document}, upsert=True )
執(zhí)行完之后, 去數(shù)據(jù)庫(kù)中查看,發(fā)現(xiàn)還是原來(lái)的那條數(shù)據(jù), 并沒(méi)有多出一條來(lái), 說(shuō)明可以實(shí)現(xiàn) 如果存在就不操作的要求
那么能實(shí)現(xiàn) 如果不存在就插入的要求嗎?
我們?nèi)?shù)據(jù)庫(kù)可視化工具中 把數(shù)據(jù)庫(kù)中的數(shù)據(jù)刪除, 然后執(zhí)行下面操作
document = { 'p_id': 'f75046d73a0c4bf88f0b7342e60722c4', 'c_name': 'Ken', 'c_star': '5.0', 'bought': None, 'c_time': '2017年3月23日', 'c_userful': 13, 'c_comment': ['4歳になるトイプードル用に購(gòu)入。', '今までエサは床に食器直置きで與えていましたが、食後にむせていることがたびたび目撃されたので', '「もしかして食べづらいのでは?」と思い調(diào)べてみたところ、この商品にたどり著きました。', '足が長(zhǎng)いので食事中は頭が完全に下に向いており、胃や足腰に負(fù)擔(dān)がかかっていたと思われます。'], 'gmt_create': datetime.now().strftime('%Y-%m-%d %H:%M:%S'), } result_find = { 'p_id': 'f75046d73a0c4bf88f0b7342e60722c4', 'c_name': 'Ken', 'c_star': '5.0', 'bought': None, 'c_time': '2017年3月23日', 'c_userful': 13, 'c_comment': ['4歳になるトイプードル用に購(gòu)入。', '今までエサは床に食器直置きで與えていましたが、食後にむせていることがたびたび目撃されたので', '「もしかして食べづらいのでは?」と思い調(diào)べてみたところ、この商品にたどり著きました。', '足が長(zhǎng)いので食事中は頭が完全に下に向いており、胃や足腰に負(fù)擔(dān)がかかっていたと思われます。'] } # collection.insert(document) collection.update( result_find, {'$setOnInsert': document}, upsert=True )
然后我們發(fā)現(xiàn)數(shù)據(jù)中出現(xiàn)了我們想看到的這條數(shù)據(jù)
所以, 實(shí)現(xiàn)了我們的要求: 存在則不操作, 不存在則插入.
以上這篇解決Pymongo insert時(shí)會(huì)自動(dòng)添加_id的問(wèn)題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)讀取目錄所有文件的文件名并保存到txt文件代碼
這篇文章主要介紹了Python實(shí)現(xiàn)讀取目錄所有文件的文件名并保存到txt文件代碼,本文分別使用os.listdir和os.walk實(shí)現(xiàn)給出兩段實(shí)現(xiàn)代碼,需要的朋友可以參考下2014-11-11Python Selenium破解滑塊驗(yàn)證碼最新版(GEETEST95%以上通過(guò)率)
這篇文章主要介紹了Python Selenium破解滑塊驗(yàn)證碼最新版(GEETEST95%以上通過(guò)率),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01對(duì)Django項(xiàng)目中的ORM映射與模糊查詢的使用詳解
今天小編就為大家分享一篇對(duì)Django項(xiàng)目中的ORM映射與模糊查詢的使用詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07python3 下載網(wǎng)絡(luò)圖片代碼實(shí)例
這篇文章主要介紹了python3 下載網(wǎng)絡(luò)圖片代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08Python 循環(huán)讀取數(shù)據(jù)內(nèi)存不足的解決方案
這篇文章主要介紹了Python 循環(huán)讀取數(shù)據(jù)內(nèi)存不足的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05Python通過(guò)paramiko庫(kù)實(shí)現(xiàn)遠(yuǎn)程執(zhí)行l(wèi)inux命令的方法
這篇文章主要介紹了Python通過(guò)paramiko庫(kù)實(shí)現(xiàn)遠(yuǎn)程執(zhí)行l(wèi)inux命令,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-03-03python中利用隊(duì)列asyncio.Queue進(jìn)行通訊詳解
asyncio是Python 3.4版本引入的標(biāo)準(zhǔn)庫(kù),直接內(nèi)置了對(duì)異步IO的支持。 下面這篇文章主要給大家介紹了關(guān)于python中利用隊(duì)列asyncio.Queue進(jìn)行通訊的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下。2017-09-09python實(shí)現(xiàn)簡(jiǎn)易版學(xué)生成績(jī)管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)簡(jiǎn)易版學(xué)生成績(jī)管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-06-06