Python文件的應用之序列化與反序列化詳解
前面章節(jié)我們學些了文件對象的創(chuàng)建、寫入與讀取,并且針對 .py 文件 與 .txt 文件進行了有針對性的小練習。 通過前面的學習我們知道,文件對象的讀寫只能進行 字符串 或 byte 類型的操作,其他類型只能通過格式化存儲或者數(shù)據(jù)類型的轉(zhuǎn)換才能實現(xiàn)。
但無論是哪一種,從文件中讀取數(shù)據(jù)后都需要進行比較復雜的處理才能還原到原始的數(shù)據(jù)類型。為了簡化數(shù)據(jù)類型的寫入和獲取,今天我們來學習一個新的知識點 —> 序列化。
通過學習序列化,可以不必過分擔心寫入文件的數(shù)據(jù)類型是什么,并且讀取文件也可以非常輕松的還原數(shù)據(jù)類型。[比較討厭這種每章之前寫概述、摘要的短句。]
初識序列化與反序列化
什么是序列化?
通俗一點來說,序列化就是將 對象的信息 或者 數(shù)據(jù)結(jié)構(gòu)的信息 通過一定的規(guī)則進行轉(zhuǎn)換,可以達到 文件存儲 或 網(wǎng)絡傳輸 的效果。通過前面章節(jié)的學習,我們知道如果要進行存儲或網(wǎng)絡傳輸,最終的數(shù)據(jù)類型都是 字符串,而且這些字符串還需要是有一定規(guī)則的字符串。
而我們今天要學習的 內(nèi)置模塊 ---> json 可以用于文件存儲或者網(wǎng)絡傳輸,這也是序列化的作用。
而反序列化就是通過序列化規(guī)則生成的字符串再反轉(zhuǎn)為原始的數(shù)據(jù)類型,這就是反序列化。
這里我們可以引入 字符串 與 byte 之間的轉(zhuǎn)換來理解 序列化與反序列化, 字符串與 byte 類型之間互相轉(zhuǎn)換常用的 encode() 函數(shù)、與 decode() 函數(shù),分別代表著編碼與解碼,所以有編碼,就一定有解碼 。套用在序列化來理解,既然存在序列化,那么就肯定有對應的反序列化哈。
可序列化的數(shù)據(jù)類型
哪些數(shù)據(jù)類型是可以序列化,哪些又是不可以序列化的呢?
可序列化:number、str、list、tuple、dict [字典是最常用的序列化數(shù)據(jù)類型]
不可序列化:class 、def (函數(shù)與實例化對象)、set 是無法進行序列化的
Python 中的json
json模塊是一個通用的序列化模塊,通過它可以完成通用化的序列化與反序列化操作。為什么說是通用的,那是因為幾乎所有的編程語言都有json模塊,而且他們序列化與反序列化的規(guī)則是統(tǒng)一的。
所以我們在 Python 中序列化的內(nèi)容,在任意其他編程語言中都可以進行反序列化并使用原始的數(shù)據(jù),這就是通用的意思。
dumps() 與 loads() 函數(shù)
json 中最重要的函數(shù) - 就是 dumps() 與 loads() 函數(shù)
方法名 | 參數(shù) | 介紹 | 舉例 | 返回值 |
---|---|---|---|---|
dumps | obj | 對象序列化 | json.dumps([1, 2, 3]) | 字符串 |
loads | str | 反序列化 | Json.loads(’[1, 2, 3]’) | 原始數(shù)據(jù)類型 |
可序列化數(shù)據(jù)類型演示案例
演示案例如下:
import json int_test = 666 # 定義 整型、字符串、列表、元組、字典 五種數(shù)據(jù)類型 ,用于序列化測試 str_test = 'test_string' list_test = [1, 2, 3] tuple_test = (4, 5, 6) dict_test = {'Name': '托尼.史塔克', 'Sex': '男'} int_test_json = json.dumps(int_test) # 將上文中五種數(shù)據(jù)類型進行序列化操作 str_test_json = json.dumps(str_test) list_test_json = json.dumps(list_test) tuple_test_json = json.dumps(tuple_test) dict_test_json = json.dumps(dict_test)
在 Treminal 終端 執(zhí)行上述測試腳本,如下圖:
這里我們重點介紹一下 字典類型的序列化結(jié)果
In [7]: dict_test_json Out[7]: '{"Name": "\\u6258\\u5c3c.\\u53f2\\u5854\\u514b", "Sex": "\\u7537"}'
從執(zhí)行結(jié)果我們可以看出字典類型的數(shù)據(jù)類型,經(jīng)過序列化后。字典變成了字符串的同時,且字典內(nèi)的 單引號 變成了 雙引號,中文也變成了比特類型,并且進行了 encode 。(這是序列化的一個標準)
為什么我們說 字典類型是非常是和序列化的呢?實際上 json 并不僅僅是一個標準,也是一種文件格式。比如我們編寫腳本的 .py 格式的文件,就是 python 文件容器;.txt 格式的文件是普通的文本文件容器;同樣的,.json 格式的文件也是文件容器,json 文件存儲的樣式(格式)就是字典類型的序列化格式。
接下來我們再嘗試將上文的五種測試數(shù)類型反序列化處理,看看結(jié)果會怎樣?
_int_test_json = json.loads(int_test_json) _str_test_json = json.loads(str_test_json) _list_test_json = json.loads(list_test_json) _tuple_test_json = json.loads(tuple_test_json) _dict_test_json = json.loads(dict_test_json)
在 Treminal 終端 執(zhí)行上述測試腳本,如下圖:
劃重點:元組類型經(jīng)過序列化處理后再通過反序列化還原數(shù)據(jù)時,會變?yōu)榱斜頂?shù)據(jù)類型。這是因為 元組類型 是 python 語言中特有的數(shù)據(jù)類型,json 作為一個通用格式,無法識別元組類型。所以在針對元組類型進行序列化的時候,會先將 元組類型 ,先轉(zhuǎn)為 列表,再進行序列化處理;同樣的在進行反序列化處理時,就會將序列化后的 元組類型 ,又轉(zhuǎn)成了 列表類型 。(類型的轉(zhuǎn)換,不影響對數(shù)據(jù)的使用)
bool 、None 類型的序列化與反序列化
示例如下:
print(json.dumps(True)) # >>> 輸出結(jié)果:true print(json.dumps(False)) # >>> 輸出結(jié)果:false print(json.dumps(None)) # >>> 輸出結(jié)果:null
從上述運行結(jié)果來看,bool 類型經(jīng)過序列化處理后,變成了小寫的 true、false;而 None 類型則變成了 小寫的 null 。
之所以會這樣,是因為在大多數(shù)的編程語言中, bool 類型都是小寫的 true、false 。json 作為一個通用的序列化模塊,也同樣遵循著這種規(guī)則。(小寫的 true、false 依然是字符串類型。 )
接下來我們再將上述的序列化處理后的 bool 、None 類型 進行反序列化處理
print(json.loads(json.dumps(None))) # >>> 輸出結(jié)果:None print(json.loads(json.dumps(True))) # >>> 輸出結(jié)果:True print(json.loads(json.dumps(False))) # >>> 輸出結(jié)果:False
從執(zhí)行結(jié)果我們看到,經(jīng)過反序列化之后,bool、None 類型又被還原成了 python 可讀的狀態(tài)。
Python 中的pickle
pickle模塊與json模塊一樣可以進行序列化與反序列化,區(qū)別在于 pickle 是 Python 內(nèi)置的序列化模塊,而且不像 json 那么通用,它只能用于 python 自身來使用,其他語言可能就無法處理了,但pickle模塊的性能是要比 json 更好的。如果是僅僅用于 python 自身來使用,pckle 模塊還是一個挺不錯的選擇哦。
dumps() 與 loads() 函數(shù)
方法名 | 參數(shù) | 介紹 | 舉例 | 返回值 |
---|---|---|---|---|
dumps | obj | 對象序列化 | json.dumps([1, 2, 3]) | 比特 |
loads | str | 反序列化 | Json.loads(’[1, 2, 3]’) | 原始數(shù)據(jù)類型 |
注意:區(qū)別于 json ,pickle 模塊的 dumps() 函數(shù) 返回的是 byte 類型 ,而 loads() 函數(shù)也僅支持 byte 類型的 pickle 序列進行反序列化的操作。
pickle模塊的序列化與反序列化練習
pickle模塊與json模塊的用法是完全一致的,這里我們就不過多的演示,只針對 dict 類型演示一下即可。
json 模塊 - 序列化小實戰(zhàn)
需求:
創(chuàng)建一個 test.json 的空文件。
定義一個 write 函數(shù)寫入 dict 數(shù)據(jù)類型的內(nèi)容到 test.json 文件
定義一個 read 函數(shù),將寫入到 test.json 文件的內(nèi)容,反序列化讀取出來
# coding:utf-8 import json data = {'name': '托尼·史塔克', 'age': 52, 'top': 185} def read(path): # 定義 read() 函數(shù),讀取 test.json 文件(返回對象為 反序列化后的內(nèi)容) with open(path, 'r') as f: data = f.read() return json.loads(data) def write(path, data): # 定義 write() 函數(shù),將 data 寫入到 test.json 文件 with open(path, 'w') as f: if isinstance(data, dict): # 判斷 data 是否為字典類型。不是的情況下主動拋出異常 _data = json.dumps(data) f.write(_data) else: raise TypeError('\'data\' 不是一個字典類型的數(shù)據(jù)') return True if __name__ == '__main__': write('test.json', data) result = read('test.json') print(result) result['Sex'] = 'Man' # 加入 {'Sex': 'Max'} 鍵值對 write('test.json', result) # 將加入的 鍵值對 寫入 test.json 文件 result_test_json = read('test.json') print(result_test_json)
執(zhí)行結(jié)果如下:
總結(jié):json的使用在我們的未來 工作中是非常高頻的,所以大家一定要多多練習,加以掌握。
到此這篇關(guān)于Python文件的應用之序列化與反序列化詳解的文章就介紹到這了,更多相關(guān)Python文件序列化內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python利用requests庫模擬post請求時json的使用教程
這篇文章主要介紹了python利用requests庫模擬post請求時json的使用 ,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2018-12-12centos+nginx+uwsgi+Django實現(xiàn)IP+port訪問服務器
這篇文章主要介紹了centos+nginx+uwsgi+Django實現(xiàn)IP+port訪問服務器,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-11-11python通過elixir包操作mysql數(shù)據(jù)庫實例代碼
這篇文章主要介紹了python通過elixir包操作mysql數(shù)據(jù)庫,分享了相關(guān)代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-01-01python Web開發(fā)你要理解的WSGI & uwsgi詳解
這篇文章主要給大家介紹了關(guān)于python Web開發(fā)你一定要理解的WSGI & uwsgi的相關(guān)資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考借鑒,下面隨著小編來一起學習學習吧2018-08-08