Python中dataclass庫實(shí)例詳解
dataclass語法
一、 簡介
官方文檔的地址為:https://docs.python.org/3.9/library/dataclasses.html
dataclass的定義位于PEP-557,根據(jù)定義一個(gè)dataclass是指“一個(gè)帶有默認(rèn)值的可變的namedtuple”,廣義的定義就是有一個(gè)類,它的屬性均可公開訪問,可以帶有默認(rèn)值并能被修改,而且類中含有與這些屬性相關(guān)的類方法,那么這個(gè)類就可以稱為dataclass,再通俗點(diǎn)講,dataclass就是一個(gè)含有數(shù)據(jù)及操作數(shù)據(jù)方法的容器。
乍一看可能會(huì)覺得這個(gè)概念不就是普通的class么,然而還是有幾處不同:
- 相比普通class,dataclass通常不包含私有屬性,數(shù)據(jù)可以直接訪問
- dataclass的repr方法通常有固定格式,會(huì)打印出類型名以及屬性名和它的值
- dataclass擁有
__eq__
和__hash__
魔法方法 - dataclass有著模式單一固定的構(gòu)造方式,或是需要重載運(yùn)算符,而普通class通常無需這些工作
我們來創(chuàng)建一個(gè)實(shí)例:
from dataclasses import dataclass @dataclass class InventoryItem: """Class for keeping track of an item in inventory.""" name: str unit_price: float quantity_on_hand: int = 0 def total_cost(self) -> float: return self.unit_price * self.quantity_on_hand
同時(shí),我們也可以添加__init__
方法:
def __init__(self, name: str, unit_price: float, quantity_on_hand: int = 0): self.name = name self.unit_price = unit_price self.quantity_on_hand = quantity_on_hand
同時(shí)使用dataclass也有一些好處,它比namedtuple更靈活。同時(shí)因?yàn)樗且粋€(gè)常規(guī)的類,所以你可以享受繼承帶來的便利。
二、 裝飾器參數(shù)
參數(shù)為dataclass()
:
init
:如果為true(默認(rèn)),__init__()
將生成一個(gè)方法。- 如果類已經(jīng)定義
__init__()
,則忽略此參數(shù)。 repr
:如果為true(默認(rèn)),__repr__()
將生成一個(gè)方法。生成的 repr 字符串將具有類名以及每個(gè)字段的名稱和 repr,按照它們?cè)陬愔卸x的順序。不包括標(biāo)記為從 repr 中排除的字段。例如: 。InventoryItem(name='widget', unit_price=3.0, quantity_on_hand=10)
- 如果類已經(jīng)定義
__repr__()
,則忽略此參數(shù)。 eq
:如果為true(默認(rèn)),__eq__()
將生成一個(gè)方法。此方法按順序比較類,就好像它是其字段的元組一樣。比較中的兩個(gè)實(shí)例必須是相同的類型。- 如果類已經(jīng)定義
__eq__()
,則忽略此參數(shù)。 order
: 如果為真(默認(rèn)為False
),將生成__lt__()
、__le__()
、__gt__()
和方法。__ge__()
這些按順序比較類,就好像它是其字段的元組一樣。比較中的兩個(gè)實(shí)例必須是相同的類型。如果order
為真且eq
為假,ValueError
則引發(fā) a。- 如果該類已經(jīng)定義了
__lt__()
、__le__()
、__gt__()
或中的任何一個(gè),__ge__()
則TypeError
引發(fā)。 unsafe_hash
:ifFalse
(默認(rèn)),__hash__()
根據(jù)howeq
andfrozen
are set生成一個(gè)方法。__hash__()
由 built-in 使用hash()
,并且在將對(duì)象添加到散列集合(例如字典和集合)時(shí)使用。擁有 a__hash__()
意味著類的實(shí)例是不可變的??勺冃允且粋€(gè)復(fù)雜的屬性,它取決于程序員的意圖、 的存在和行為,以及裝飾器中的和標(biāo)志__eq__()
的值。eq``frozen
dataclass()
- 默認(rèn)情況下, 除非這樣做是安全的,否則
dataclass()
不會(huì)隱式添加方法。__hash__()
它也不會(huì)添加或更改現(xiàn)有的明確定義的__hash__()
方法。如文檔中所述,設(shè)置類屬性對(duì) Python 具有特定含義。__hash__ = None
__hash__()
- 如果
__hash__()
沒有顯式定義,或者如果設(shè)置為None
,則可以添加隱式方法。雖然不推薦,但您可以強(qiáng)制使用 . 如果您的類在邏輯上是不可變的,但仍然可以發(fā)生變異,則可能會(huì)出現(xiàn)這種情況。這是一個(gè)專門的用例,應(yīng)該仔細(xì)考慮。dataclass()
__hash__()
dataclass()
__hash__()
unsafe_hash=True
- 以下是管理方法隱式創(chuàng)建的規(guī)則
__hash__()
。請(qǐng)注意,您不能__hash__()
在數(shù)據(jù)類和 set 中都有顯式方法unsafe_hash=True
;這將導(dǎo)致一個(gè)TypeError
. - 如果
eq
和frozen
都為真,默認(rèn)情況下dataclass()
會(huì)為你生成一個(gè)__hash__()
方法。如果eq
為真且frozen
為假,__hash__()
將設(shè)置為None
,將其標(biāo)記為不可散列(它是,因?yàn)樗强勺兊模H绻?code>eq為假,__hash__()
將保持不變,這意味著__hash__()
將使用超類的方法(如果超類是object
,這意味著它將回退到基于 id 的散列)。 frozen
:如果為真(默認(rèn)為False
),分配給字段將產(chǎn)生異常。這模擬只讀凍結(jié)實(shí)例。如果__setattr__()
或__delattr__()
在類中定義,則TypeError
引發(fā)。
@dataclass class C: ... @dataclass() class C: ... @dataclass(init=True, repr=True, eq=True, order=False, unsafe_hash=False, frozen=False) class C: ...
三、 數(shù)據(jù)屬性
1、 參數(shù)
參數(shù)為field()
:
default
:如果提供,這將是該字段的默認(rèn)值。這是必需的,因?yàn)?code>field()調(diào)用本身會(huì)替換默認(rèn)值的正常位置。default_factory
:如果提供,它必須是一個(gè)零參數(shù)的可調(diào)用對(duì)象,當(dāng)該字段需要默認(rèn)值時(shí)將被調(diào)用。除其他目的外,這可用于指定具有可變默認(rèn)值的字段,如下所述。default
同時(shí)指定和是錯(cuò)誤的default_factory
。init
:如果為 true(默認(rèn)值),則此字段作為參數(shù)包含在生成的__init__()
方法中。repr
:如果為true(默認(rèn)),則該字段包含在生成的__repr__()
方法返回的字符串中。compare
: 如果為 true(默認(rèn)值),則該字段包含在生成的相等和比較方法中(__eq__()
、、__gt__()
等)。hash
: 這可以是 bool 或None
. 如果為 true,則此字段包含在生成的__hash__()
方法中。如果None
(默認(rèn)),使用compare
: 這通常是預(yù)期的行為。如果某個(gè)字段用于比較,則應(yīng)在哈希中考慮該字段。None
不鼓勵(lì)將此值設(shè)置為除此之外的任何值。hash=False
設(shè)置的一個(gè)可能原因compare=True
是,如果一個(gè)字段計(jì)算哈希值的成本很高,則需要該字段進(jìn)行相等性測試,并且還有其他字段有助于該類型的哈希值。即使某個(gè)字段從哈希中排除,它仍將用于比較。metadata
:這可以是映射或無。None 被視為空字典。這個(gè)值被包裝MappingProxyType()
成只讀的,并暴露在Field
對(duì)象上。數(shù)據(jù)類根本不使用它,而是作為第三方擴(kuò)展機(jī)制提供的。多個(gè)第三方可以各自擁有自己的密鑰,用作元數(shù)據(jù)中的命名空間。
2、 使用示例
@dataclass class C: x: int y: int = field(repr=False) z: int = field(repr=False, default=10) t: int = 20
3、 注意事項(xiàng)
init參數(shù)如果設(shè)置為False,表示不為這個(gè)field生成初始化操作,dataclass提供了hook——__post_init__
供我們利用這一特性:
@dataclass class C: a: int b: int c: int = field(init=False) def __post_init__(self): self.c = self.a + self.b
__post_init__
在__init__
后被調(diào)用,我們可以在這里初始化那些需要前置條件的field。
repr參數(shù)表示該field是否被包含進(jìn)repr的輸出,compare和hash參數(shù)表示field是否參與比較和計(jì)算hash值。metadata不被dataclass自身使用,通常讓第三方組件從中獲取某些元信息時(shí)才使用,所以我們不需要使用這一參數(shù)。
如果指定一個(gè)field的類型注解為dataclasses.InitVar
,那么這個(gè)field將只會(huì)在初始化過程中(__init__
和__post_init__
)可以被使用,當(dāng)初始化完成后訪問該field會(huì)返回一個(gè)dataclasses.Field
對(duì)象而不是field原本的值,也就是該field不再是一個(gè)可訪問的數(shù)據(jù)對(duì)象。舉個(gè)例子,比如一個(gè)由數(shù)據(jù)庫對(duì)象,它只需要在初始化的過程中被訪問:
@dataclass class C: i: int j: int = None database: InitVar[DatabaseType] = None def __post_init__(self, database): if self.j is None and database is not None: self.j = database.lookup('j') c = C(10, database=my_database)
四、 其他
1、 常用函數(shù)
dataclasses
模塊中提供了一些常用函數(shù)供我們處理數(shù)據(jù)類。
使用dataclasses.asdict
和dataclasses.astuple
我們可以把數(shù)據(jù)類實(shí)例中的數(shù)據(jù)轉(zhuǎn)換成字典或者元組:
>>> from dataclasses import asdict, astuple >>> asdict(C()) {'name': 'python', 'strong_type': True, 'static_type': False, 'age': 28} >>> astuple(C()) ('python', True, False, 28)
使用dataclasses.is_dataclass
可以判斷一個(gè)類或?qū)嵗龑?duì)象是否是數(shù)據(jù)類
2、 繼承
dataclass
裝飾器會(huì)檢查當(dāng)前class的所有基類,如果發(fā)現(xiàn)一個(gè)dataclass,就會(huì)把它的字段按順序添加進(jìn)當(dāng)前的class,隨后再處理當(dāng)前class的field。所有生成的方法也將按照這一過程處理,因此如果子類中的field與基類同名,那么子類將會(huì)無條件覆蓋基類。子類將會(huì)根據(jù)所有的field重新生成一個(gè)構(gòu)造函數(shù),并在其中初始化基類。
看個(gè)例子:
@dataclass class Base: x: float = 25.0 y: int = 0 @dataclass class C(Base): z: int = 10 x: int = 15 >>> C() C(x=15, y=0, z=10)
C
中的x
則覆蓋了Base
中的定義
3、 總結(jié)
合理使用dataclass將會(huì)大大減輕開發(fā)中的負(fù)擔(dān),將我們從大量的重復(fù)勞動(dòng)中解放出來,這既是dataclass的魅力,不過魅力的背后也總是有陷阱相伴,最后我想提幾點(diǎn)注意事項(xiàng):
- dataclass通常情況下是unhashable的,因?yàn)槟J(rèn)生成的
__hash__
是None
,所以不能用來做字典的key,如果有這種需求,那么應(yīng)該指定你的數(shù)據(jù)類為frozen dataclass
- 小心當(dāng)你定義了和
dataclass
生成的同名方法時(shí)會(huì)引發(fā)的問題 - 當(dāng)使用可變類型(如list)時(shí),應(yīng)該考慮使用
field
的default_factory
- 數(shù)據(jù)類的屬性都是公開的,如果你有屬性只需要初始化時(shí)使用而不需要在其他時(shí)候被訪問,請(qǐng)使用
dataclasses.InitVar
只要避開這些陷阱,dataclass一定能成為提高生產(chǎn)力的利器。
到此這篇關(guān)于Python中dataclass庫的文章就介紹到這了,更多相關(guān)Python dataclass庫內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Flask??請(qǐng)求鉤子的實(shí)現(xiàn)
這篇文章主要給大家分享了Flask請(qǐng)求鉤子的實(shí)現(xiàn),在客戶端和服務(wù)器交互的過程中,有些準(zhǔn)備工作或掃尾工作需要處理,比如:在請(qǐng)求開始時(shí),建立數(shù)據(jù)庫連接;在請(qǐng)求開始時(shí),根據(jù)需求進(jìn)行權(quán)限校驗(yàn);在請(qǐng)求結(jié)束時(shí),指定數(shù)據(jù)的交互格式;下面來看看文章詳細(xì)介紹內(nèi)容吧2021-11-11PyTorch 中的傅里葉卷積實(shí)現(xiàn)示例
這篇文章主要介紹了PyTorch 中的傅里葉卷積實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12關(guān)于Numpy生成數(shù)總結(jié)(隨機(jī)整數(shù)randint,固定步長arange,分布)
這篇文章主要介紹了關(guān)于Numpy生成數(shù)總結(jié)(隨機(jī)整數(shù)randint,固定步長arange,分布),具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-12-12使用Python在Excel工作表中創(chuàng)建數(shù)據(jù)透視表的方法
在數(shù)據(jù)處理和分析工作中,Excel作為一個(gè)廣泛使用的工具,提供了強(qiáng)大的功能來管理和解析數(shù)據(jù),當(dāng)面對(duì)大量復(fù)雜的數(shù)據(jù)集時(shí),為了更高效地總結(jié)、分析和展示數(shù)據(jù),創(chuàng)建數(shù)據(jù)透視表成為一種不可或缺的方法,本文將介紹如何使用Python在Excel工作表中創(chuàng)建數(shù)據(jù)透視表2025-01-01Python MySQL 日期時(shí)間格式化作為參數(shù)的操作
這篇文章主要介紹了Python MySQL 日期時(shí)間格式化作為參數(shù)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-03-03計(jì)算機(jī)二級(jí)python學(xué)習(xí)教程(2) python語言基本語法元素
這篇文章主要為大家詳細(xì)介紹了計(jì)算機(jī)二級(jí)python學(xué)習(xí)教程的第2篇,Python語言基本語法元素,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-05-05Mac中Python 3環(huán)境下安裝scrapy的方法教程
作為一名python爬蟲愛好者,怎能不折騰下Scrapy?折騰了許久之后終于安裝到了mac中,所以下面這篇文章主要給大家介紹了關(guān)于Mac系統(tǒng)中Python 3環(huán)境下安裝scrapy的相關(guān)資料,文中將實(shí)現(xiàn)的步驟一步步介紹的非常詳細(xì),需要的朋友可以參考下。2017-10-10