使用python解析json字段的3種方式實(shí)例
1、運(yùn)用re、json、jsonpath包解析json思路
(1)re:正則表達(dá)式,通過json的形式對癥下藥,寫表達(dá)式去解析json;
(2)json: 通過json中的json.loads()方法,將str類型轉(zhuǎn)為dict類型,運(yùn)用python字典的數(shù)據(jù)結(jié)構(gòu)特點(diǎn)去解析json;
(3)jsonpath:對比與json包,jsonpath可以根據(jù)路徑去解析json,比較適合用來解析json中帶“[ ]”的數(shù)據(jù)。
2、三種方式的json解析案例
#json數(shù)據(jù)樣式,本文采用帶[]的數(shù)據(jù)樣式 { "version": "version 1.0.12", "result": { "pages": 1314, "data": [ { "name": "大明", "IDcard": "440588190001015688", "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號", }, { "name": "二明", "IDcard": "440588190012317456", "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號", } ] } }
(1)運(yùn)用re正則表達(dá)式解析json
import re jsondata={ "version": "23231cimesfedkk", "result": { "pages": 1314, "data": [ { "name": "大明", "IDcard": "440588190001015688", "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號", }, { "name": "二明", "IDcard": "440588190012317456", "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號", } ] } } if __name__ == '__main__': name_list=re.findall(r"'name': '(\w*)'",str(jsondata)) IDcard_list=re.findall(r"'IDcard': '(\w{18})'", str(jsondata))#身份證18位數(shù)字和字母組合 address_list=re.findall(r"'address': '(\w*)'", str(jsondata))#地址 print(name_list) print(IDcard_list) print(address_list)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
(2)運(yùn)用字典的數(shù)據(jù)結(jié)構(gòu)性質(zhì)解析json
import json jsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",}]}} if __name__ == '__main__': # 若傳入的數(shù)據(jù)為str類型需要將它轉(zhuǎn)成dict類型 # result = json.loads(jsondata) jsondata = jsondata["result"]["data"] resultdata = jsondata namelist=[] idcardlist=[] addresslist=[] for data in resultdata: namelist.append(data['name']) idcardlist.append(data['IDcard']) addresslist.append(data['address']) print(namelist) print(idcardlist) print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
(3)運(yùn)用jsonpath的路徑解析json
import jsonpath jsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號",}]}} if __name__ == '__main__': namelist=[] idcardlist=[] addresslist=[] #運(yùn)用jsonpath.jsonpath(字典數(shù)據(jù), 路徑) namelist=jsonpath.jsonpath(jsondata, '$..name') idcardlist=jsonpath.jsonpath(jsondata, '$..IDcard') addresslist=jsonpath.jsonpath(jsondata, '$..address') print(namelist) print(idcardlist) print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號']
3、附錄:re正則表達(dá)式語法
附:python 處理非標(biāo)準(zhǔn) json 格式字符串
在寫爬蟲的時(shí)候,會發(fā)現(xiàn)很多數(shù)據(jù)都是通過 json 格式進(jìn)行傳輸?shù)?,?biāo)準(zhǔn)的 json 我們可以將其轉(zhuǎn)化為 Python 中的數(shù)據(jù)類型,進(jìn)行查詢,但對于一些類似于 json 但又非標(biāo)準(zhǔn) json 格式的字符,就會比較頭疼了,這里統(tǒng)計(jì)一些咱遇到的非標(biāo)準(zhǔn)的 json 格式,及相應(yīng)的解析方法。
字符串中 key 的值沒有被單引號包裹
類似于這種字符,看上去格式和 json 很像(眼尖的朋友可能發(fā)現(xiàn)了,這是 qq 的數(shù)據(jù) 嘿嘿),但仔細(xì)觀察會發(fā)現(xiàn),這其中的 key 沒有被單引號包裹起來,這就導(dǎo)致了它無法被簡單的解析為字典類型,因?yàn)榻馕龅臅r(shí)候 key 會被解析成相應(yīng)的變量而非字符,這些變量又都沒有定義,所以會報(bào)錯(cuò)。
那怎么辦呢?咱的第一反應(yīng)是利用正則去人為構(gòu)造成標(biāo)準(zhǔn)的格式,不過這個(gè)難度系數(shù)有點(diǎn)大,對正則的要求挺高,還費(fèi)腦子,明顯不符合咱的風(fēng)格。于是咱就去網(wǎng)上找了一下,有沒有現(xiàn)成的方法,還真有呢:
使用 demjson
首先安裝 demjson
pip install demjson
s = '{suggestion:[{query:"London",interpretation: \'abc\'}]}' dict1 = demjson.decode(s) print(dict1) {'suggestion': [{'interpretation': 'abc', 'query': 'London'}]}
總結(jié)
到此這篇關(guān)于使用python解析json字段的3種方式的文章就介紹到這了,更多相關(guān)python解析json字段內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 如何利用Python解析超大的json數(shù)據(jù)(GB級別)
- Python實(shí)現(xiàn)yaml與json文件批量互轉(zhuǎn)
- 關(guān)于Python中request發(fā)送post請求傳遞json參數(shù)的問題
- Python中json模塊load/loads方法實(shí)戰(zhàn)以及參數(shù)詳解
- Python中使用json.load()和json.loads()加載json數(shù)據(jù)的方法實(shí)例
- python中Requests發(fā)送json格式的post請求方法
- python轉(zhuǎn)換wrf輸出的數(shù)據(jù)為網(wǎng)頁可視化json格式
相關(guān)文章
Python寫的一個(gè)簡單監(jiān)控系統(tǒng)
這篇文章主要介紹了Python寫的一個(gè)簡單監(jiān)控系統(tǒng),本文講解了詳細(xì)的編碼步驟,并給給出相應(yīng)的實(shí)現(xiàn)代碼,需要的朋友可以參考下2015-06-06Python虛擬環(huán)境Virtualenv使用教程
這篇文章主要介紹了Python虛擬環(huán)境Virtualenv簡明教程,本文整合了兩篇關(guān)于Virtualenv的使用教程,相信大家有通過本文一定可以學(xué)會如何使用Virtualenv,需要的朋友可以參考下2015-05-05Python使用pickle模塊實(shí)現(xiàn)序列化功能示例
這篇文章主要介紹了Python使用pickle模塊實(shí)現(xiàn)序列化功能,結(jié)合實(shí)例形式分析了基于pickle模塊的序列化操作相關(guān)操作技巧,需要的朋友可以參考下2018-07-07小白學(xué)Python之實(shí)現(xiàn)OCR識別
將圖片翻譯成文字一般被稱為光學(xué)文字識別(Optical Character Recognition,OCR),這篇文章主要給大家介紹了關(guān)于Python實(shí)現(xiàn)OCR識別的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2021-08-08在pycharm中實(shí)現(xiàn)刪除bookmark
今天小編就為大家分享一篇在pycharm中實(shí)現(xiàn)刪除bookmark,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02使用tqdm顯示Python代碼執(zhí)行進(jìn)度功能
在使用Python執(zhí)行一些比較耗時(shí)的操作時(shí),為了方便觀察進(jìn)度,通常使用進(jìn)度條的方式來可視化呈現(xiàn)。這篇文章主要介紹了使用tqdm顯示Python代碼執(zhí)行進(jìn)度,需要的朋友可以參考下2019-12-12pycharm中連接mysql數(shù)據(jù)庫的步驟詳解
在進(jìn)行Python研發(fā)的時(shí)候,pycharm是一個(gè)很好的IDE,下面這篇文章主要給大家介紹了pycharm中連接mysql數(shù)據(jù)庫的步驟,文中通過圖文介紹的非常詳細(xì),對大家具有一定的參考價(jià)值,需要的朋友們下面來一起看看吧。2017-05-05Python中字符串轉(zhuǎn)換為列表的常用方法總結(jié)
本文將詳細(xì)介紹Python中將字符串轉(zhuǎn)換為列表的八種常用方法,每種方法都具有其獨(dú)特的用途和適用場景,文中的示例代碼講解詳細(xì),感興趣的可以了解下2023-11-11