keras和tensorflow使用fit_generator 批次訓(xùn)練操作
fit_generator 是 keras 提供的用來(lái)進(jìn)行批次訓(xùn)練的函數(shù),使用方法如下:
model.fit_generator(generator, steps_per_epoch=None, epochs=1, verbose=1, callbacks=None, validation_data=None, validation_steps=None, class_weight=None, max_queue_size=10, workers=1, use_multiprocessing=False, shuffle=True, initial_epoch=0)
參數(shù)說(shuō)明:
generator: 一個(gè)生成器,或者一個(gè) Sequence (keras.utils.Sequence) 對(duì)象的實(shí)例, 以在使用多進(jìn)程時(shí)避免數(shù)據(jù)的重復(fù)。 生成器的輸出應(yīng)該為以下之一:
一個(gè)(inputs, targets) 元組
一個(gè) (inputs, targets, sample_weights) 元組。
這個(gè)元組(生成器的單個(gè)輸出)組成了單個(gè)的 batch。 因此,這個(gè)元組中的所有數(shù)組長(zhǎng)度必須相同(與這一個(gè) batch 的大小相等)。 不同的 batch 可能大小不同。 例如,一個(gè) epoch 的最后一個(gè) batch 往往比其他 batch 要小, 如果數(shù)據(jù)集的尺寸不能被 batch size 整除。 生成器將無(wú)限地在數(shù)據(jù)集上循環(huán)。當(dāng)運(yùn)行到第steps_per_epoch 時(shí),記一個(gè) epoch 結(jié)束。
steps_per_epoch: 在聲明一個(gè) epoch 完成并開(kāi)始下一個(gè) epoch 之前從 generator產(chǎn)生的總步數(shù)(批次樣本)。 它通常應(yīng)該等于你的數(shù)據(jù)集的樣本數(shù)量除以批量大小。 對(duì)于Sequence,它是可選的:如果未指定,將使用len(generator)作為步數(shù)。
epochs: 整數(shù)。訓(xùn)練模型的迭代總輪數(shù)。一個(gè) epoch 是對(duì)所提供的整個(gè)數(shù)據(jù)的一輪迭代,如 steps_per_epoch 所定義。注意,與 initial_epoch 一起使用,epoch 應(yīng)被理解為「最后一輪」。模型沒(méi)有經(jīng)歷由 epochs 給出的多次迭代的訓(xùn)練,而僅僅是直到達(dá)到索引 epoch 的輪次。
verbose: 0, 1 或 2。日志顯示模式。 0 = 安靜模式, 1 = 進(jìn)度條, 2 = 每輪一行。
callbacks: keras.callbacks.Callback 實(shí)例的列表。在訓(xùn)練時(shí)調(diào)用的一系列回調(diào)函數(shù)。
validation_data: 它可以是以下之一:
驗(yàn)證數(shù)據(jù)的生成器或Sequence實(shí)例
一個(gè)(inputs, targets) 元組
一個(gè)(inputs, targets, sample_weights) 元組。
在每個(gè) epoch 結(jié)束時(shí)評(píng)估損失和任何模型指標(biāo)。該模型不會(huì)對(duì)此數(shù)據(jù)進(jìn)行訓(xùn)練。
validation_steps: 僅當(dāng) validation_data 是一個(gè)生成器時(shí)才可用。 在停止前 generator 生成的總步數(shù)(樣本批數(shù))。 對(duì)于 Sequence,它是可選的:如果未指定,將使用 len(generator) 作為步數(shù)。
class_weight: 可選的將類索引(整數(shù))映射到權(quán)重(浮點(diǎn))值的字典,用于加權(quán)損失函數(shù)(僅在訓(xùn)練期間)。 這可以用來(lái)告訴模型「更多地關(guān)注」來(lái)自代表性不足的類的樣本。
max_queue_size: 整數(shù)。生成器隊(duì)列的最大尺寸。 如未指定,max_queue_size 將默認(rèn)為 10。
workers: 整數(shù)。使用的最大進(jìn)程數(shù)量,如果使用基于進(jìn)程的多線程。 如未指定,workers 將默認(rèn)為 1。如果為 0,將在主線程上執(zhí)行生成器。
use_multiprocessing: 布爾值。如果 True,則使用基于進(jìn)程的多線程。 如未指定, use_multiprocessing 將默認(rèn)為 False。 請(qǐng)注意,由于此實(shí)現(xiàn)依賴于多進(jìn)程,所以不應(yīng)將不可傳遞的參數(shù)傳遞給生成器,因?yàn)樗鼈儾荒鼙惠p易地傳遞給子進(jìn)程。
shuffle: 是否在每輪迭代之前打亂 batch 的順序。 只能與 Sequence (keras.utils.Sequence) 實(shí)例同用。
initial_epoch: 開(kāi)始訓(xùn)練的輪次(有助于恢復(fù)之前的訓(xùn)練)。
補(bǔ)充知識(shí):Keras中fit_generator 的多個(gè)分支輸入時(shí),需注意generator的格式 以及 輸入序列的順序
需要注意迭代器 yeild返回不能是[x1,x2],y 這樣,而是要完整的字典格式的:
yield ({'input_1': x1, 'input_2': x2}, {'output': y})
這也不算坑 追進(jìn)去 fit_generator也能看到示例
def generate_batch(x_train,y_train,batch_size,x_train2,randomFlag=True): ylen = len(y_train) loopcount = ylen // batch_size i=-1 while True: if randomFlag: i = random.randint(0,loopcount-1) else: i=i+1 i=i%loopcount yield ({'lstmInput': x_train[i*batch_size:(i+1)*batch_size], 'bgInput': x_train2[i*batch_size:(i+1)*batch_size]}, {'prediction': y_train[i*batch_size:(i+1)*batch_size]})
ps: 因?yàn)橐莟uple yield后的括號(hào)不能省
需注意的坑1是,validation data中如果用【】組成數(shù)組進(jìn)行輸入,是要按順序的,按編譯model前的設(shè)置model = Model(inputs=[simInput,lstmInput,bgInput], outputs=predictions),中數(shù)組的順序來(lái)編譯
需注意的坑2是,多輸入input時(shí),以后都用 inputs1=Input(batch_shape=(batchSize,TPeriod,dimIn,),name='input1LSTM')指定batchSize,不然跟stateful lstm結(jié)合時(shí),會(huì)提示不匹配。
history=model.fit_generator(generate_batch(trainX,trainY,batchSize,trainX2), steps_per_epoch=len(trainX)//batchSize, validation_data=([testX,testX2],testY), epochs=epochs, callbacks=[tensorboard,checkpoint],initial_epoch=0,verbose=1) # Fit the LSTM network/擬合LSTM網(wǎng)絡(luò)
以上這篇keras和tensorflow使用fit_generator 批次訓(xùn)練操作就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
pyqt5 從本地選擇圖片 并顯示在label上的實(shí)例
今天小編就為大家分享一篇pyqt5 從本地選擇圖片 并顯示在label上的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-06-06Python+tkinter使用40行代碼實(shí)現(xiàn)計(jì)算器功能
這篇文章主要為大家詳細(xì)介紹了Python+tkinter使用40行代碼實(shí)現(xiàn)計(jì)算器功能,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-01-01python整小時(shí) 整天時(shí)間戳獲取算法示例
今天小編就為大家分享一篇python整小時(shí) 整天時(shí)間戳獲取算法示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-02-02pycharm查看之前的運(yùn)行結(jié)果詳細(xì)步驟
在工作場(chǎng)景下,程序員如何運(yùn)用PyCharm去書寫代碼以及運(yùn)行文件,還有學(xué)會(huì)對(duì)各種突發(fā)情況的應(yīng)對(duì),這篇文章主要給大家介紹了關(guān)于pycharm查看之前的運(yùn)行結(jié)果的相關(guān)資料,需要的朋友可以參考下2023-04-04使用python將大量數(shù)據(jù)導(dǎo)出到Excel中的小技巧分享
今天小編就為大家分享一篇使用python將大量數(shù)據(jù)導(dǎo)出到Excel中的小技巧心得,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-06-06Python 使用tempfile包輕松無(wú)痕的運(yùn)行代碼
大家好,我們知道軟件運(yùn)行過(guò)程中一般會(huì)在指定位置生成臨時(shí)文件,這些資源不要輕易刪除,可能是過(guò)程文件,定時(shí)清理是必要的,今天給大家分享一款工具:tempfile,喜歡本文點(diǎn)贊支持,歡迎收藏學(xué)習(xí)2021-11-11Python3內(nèi)置函數(shù)chr和ord實(shí)現(xiàn)進(jìn)制轉(zhuǎn)換
這篇文章主要介紹了Python3內(nèi)置函數(shù)chr和ord實(shí)現(xiàn)進(jìn)制轉(zhuǎn)換,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06Python中那些簡(jiǎn)單又好用的特性和用法盤點(diǎn)
這篇文章主要為大家詳細(xì)介紹了在編寫Python代碼過(guò)程中用到的幾個(gè)簡(jiǎn)單又好用的特性和用法,這些特性和用法可以幫助我們更高效地編寫Python代碼,希望對(duì)大家有所幫助2024-03-03