腳本之家服務器常用軟件

快捷導航

軟件下載

android MAC 驅(qū)動下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

Python中優(yōu)雅處理JSON文件的方法實例

更新時間：2021年12月21日 11:28:28 作者：趙卓不凡

JSON是一種輕量級的數(shù)據(jù)交換格式,JSON采用完全獨立于語言的文本格式，但是也使用了類似于C語言家族的習慣,這篇文章主要給大家介紹了關于Python中優(yōu)雅處理JSON文件的相關資料,需要的朋友可以參考下

1. 引言

在本文中，我們將學習如何使用Python讀取、解析和編寫JSON文件。
我們將討論如何最好地處理簡單的JSON文件以及嵌套的JSON文件,當然我們也將討論如何訪問Json文件數(shù)據(jù)中的特定值。

2. 什么是JSON文件?

JSON（Java Script Object Notation）是一種流行的文件格式，主要用于在web應用程序中存儲和傳輸數(shù)據(jù)。如果我們經(jīng)常和數(shù)據(jù)打交道，那么一定或多或少遇到過JSON格式的文件，因此我們有必要來學習如何讀取和寫入JSON。

下圖為常見的JSON文件結(jié)構(gòu)的示例.

JSON結(jié)構(gòu)看起來和Python中的字典非常類似。需要注意的是，JSON格式通常是由key: 結(jié)對組成,其中key是字符串形式,value是字符串、數(shù)字、布爾值、數(shù)組、對象或null。

為了更直觀的進行說明,在下圖中我們以藍色突出顯示了所有的key,同時以橙色突出顯示了所有的value。請注意,以下每組key/value間均使用逗號進行區(qū)分。

3. 使用Python處理JSON文件

在Python中內(nèi)置了用于讀取JSON文件的函數(shù)。以下給出幾個如何將JSON文件解析為Python對象的示例。

3.1. 將JSON文件讀取為字典類型

首先我們需要導入 json庫, 接著我們使用open函數(shù)來讀取JSON文件,最后利用json.load()函數(shù)將JSON字符串轉(zhuǎn)化為Python字典形式.

就這么簡單,代碼如下:

import json
 
with open('superheroes.json') as f:
    superHeroSquad = json.load(f)
    
print(type(superHeroSquad))  # Output: dict
print(superHeroSquad.keys())
# Output: dict_keys(['squadName', 'homeTown', 'formed', 'secretBase', 'active', 'members'])

上述代碼很簡單很直觀啦,唯一需要注意的是json庫中有l(wèi)oad()和loads()兩個函數(shù).

函數(shù)load()作用為讀取JSON文件生成Python對象函數(shù)loads()作用為讀取JSON 字符串流生成Python對象

我們可以將loads()函數(shù)中的字符s的含義理解成 load for strings.

3.2. 將JSON文件讀取為Pandas類型

當然我們也可以使用Pandas庫中的 read_json函數(shù)來讀取對應的JSON文件,

代碼如下:

import pandas as pd
df = pd.read_json('superheroes.json')

運行結(jié)果如下:

需要注意的是使用Pandas庫不僅僅可以讀取電腦本地磁盤上的JSON文件,也可以通過URL讀取網(wǎng)絡上存放的文件.

代碼如下:

df1 = pd.read_json('https://mdn.github.io/learning-area/javascript/oojs/json/superheroes.json')

3.3. 使用Pandas讀取嵌套JSON類型

我們有時候遇到的JSON文件是嵌套的,這經(jīng)常會讓讀取工作變得有些困難. 其實嵌套JSON和Python中的嵌套字典思想類似,即字典中嵌套字典.

我們觀察上述例子中的member字段,其值也為字典類型,下圖中我們使用縮進來展示嵌套結(jié)構(gòu)。

設想一下，當我們將JSON文件加載到Pandas數(shù)據(jù)框架中時，members列如下所示。每行包含一個字典。

接下來我們討論兩種實現(xiàn)方法，這兩種方法中，我們可以解析數(shù)據(jù)，以便將每個鍵分解為單獨的一列。

方案一

我們可以在members這一列上使用apply方法，代碼如下：

df['members'].apply(pd.Series)

上述代碼執(zhí)行后，members列會被拆分為4個新列，如下所示：

當然如果你想將上述拆分后的結(jié)果和之前的結(jié)果進行合并，可以使用pd.concat函數(shù)，

代碼如下：

df = pd.concat([df['members'].apply(pd.Series), df.drop('members', axis = 1)], axis = 1)

方案二

在Pandas庫中還有一個函數(shù) json_normalize() ，它允許我們把嵌套的JSON展開。這是最簡單的方法來解析嵌套的JSON了。

代碼如下：

def test2():
    with open('superheroes.json') as f:
        superHeroSquad = json.load(f)
    out = pd.json_normalize(superHeroSquad, record_path=['members'],
                      meta=['squadName', 'homeTown', 'formed', 'secretBase', 'active'])
    print(out)

上述代碼中：

record_path為我們希望拆分的列的名字
meta為列名的list，為我們輸出的次序

運行結(jié)果如下：

最后我們需要注意的是，我們可以在上述函數(shù)json_normalize中添加參數(shù) meta_prefix，這樣可以讓我們對meta中的名字添加統(tǒng)一的前綴。

代碼如下：

pd.json_normalize(superHeroSquad, 
	record_path = ['members'], 
	meta = ['squadName', 'homeTown', 'formed', 'secretBase', 'active'], 
	meta_prefix = 'members_')

運行結(jié)果如下：

3.4. 訪問特定位置的數(shù)據(jù)

在Python中我們可以通過Key的名字或者下標來訪問JSON文件中任意位置的數(shù)據(jù)。

比如，假設我們想知道我們的第二個超級英雄的秘密身份。即在下圖中，需要訪問特定位置的數(shù)據(jù)在下圖中以紫色突出顯示。

為了得到這個值，我們可以直接使用以下語句：

superHeroSquad['members'][1]['secretIdentity']

從層次結(jié)構(gòu)的頂部開始，由上往下，我們需要的第一個key是'members'，因為它是我們需要訪問的值所在的父節(jié)點。

在‘members'對應的鍵值中，我們看中括號，然后下標1表示list中的第二個成員。接著我們來看字段'secretIdentity',如下所示：

將上述過程合并在一起，我們就可以得到我們特定位置出的值為'Jane Wilson'。

細心的同學可能已經(jīng)注意到，我在上面的JSON片段中突出顯示了兩個藍色的值。希望感興趣的同學們可以作為練習來嘗試訪問這些值。歡迎在文章后面的評論區(qū)中分享你的代碼。

3.5. 導出JSON

讓我們編輯一下我們最后一位超級英雄，將其secretIdentity從‘Unknow'更改為‘Will Smith'，接著將這個字典導出為JSON文件。這里我們將使用json.dump()函數(shù)將字典寫入文件。

代碼如下：

#update secret identity of Eternal Flame
superHeroSquad['members'][2]['secretIdentity'] = 'Will Smith'
with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file)

上述代碼運行后，我們打開文件superheroes.json，可以發(fā)現(xiàn)最后一名超級英雄的secretIdentity已經(jīng)由Unknow變?yōu)榱薟ill Smith.

當然，作為選擇，我們也可以使用Pandas中的to_json（）函數(shù)，完成上述功能。

df.to_json('superheroes.json')

3.6. 格式化輸出

我們有時候在終端直接打印json文件，通常會得到很不美觀的輸出，樣例如下：

為了讓其看起來更加美觀，我們這里可以在函數(shù)json.dump中采用參數(shù)indent參數(shù)來控制輸出格式，代碼如下：

with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file, indent = 4)

結(jié)果輸出如下，是不是看上去更加美觀啦。。。

3.7. 輸出字段排序

當然dump函數(shù)中含有字段sort_key，通過設置其值，可以控制輸出時是否對key進行排序。需要注意所有的key包括嵌套的key都會進行排序。

樣例如下：

with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file, indent = 4, sort_keys = True)

運行結(jié)果如下：

4.總結(jié)

最后，讓我們對本文做一下回顧，總結(jié)如下：

JSON文件通常由key:結(jié)對組成，這里key通常為字符串格式，value一般為字符串，數(shù)字，布爾，數(shù)組，對象或者null
Python有內(nèi)置函數(shù)可以方便的讀取JSON文件轉(zhuǎn)化為Python中的字典類型或者Pandas可以處理的類型
使用pd.read_json()來讀取簡單的JSON，使用pd.json_normalize()來讀取嵌套的JSON
我們可以通過key的名字或者下標來方便的獲取JSON文件中特定位置的值
Python對象可以轉(zhuǎn)化為JSON文件，同時可以對輸出進行格式化輸出以增加可讀性

5.參考

鏈接一

到此這篇關于Python中優(yōu)雅處理JSON文件的文章就介紹到這了,更多相關Python優(yōu)雅處理JSON文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

Python中優(yōu)雅處理JSON文件的方法實例

目錄

1. 引言

2. 什么是JSON文件?

3. 使用Python處理JSON文件

3.1. 將JSON文件讀取為字典類型

3.2. 將JSON文件讀取為Pandas類型

3.3. 使用Pandas讀取嵌套JSON類型

3.4. 訪問特定位置的數(shù)據(jù)

3.5. 導出JSON

3.6. 格式化輸出

3.7. 輸出字段排序

4.總結(jié)

5.參考

相關文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具