快捷導(dǎo)航

python之tensorflow手把手實(shí)例講解貓狗識(shí)別實(shí)現(xiàn)

更新時(shí)間：2021年09月22日 16:03:07 作者：鑫xing

要說(shuō)到深度學(xué)習(xí)圖像分類的經(jīng)典案例之一，那就是貓狗大戰(zhàn)了。貓和狗在外觀上的差別還是挺明顯的，無(wú)論是體型、四肢、臉龐和毛發(fā)等等，都是能通過(guò)肉眼很容易區(qū)分的。那么如何讓機(jī)器來(lái)識(shí)別貓和狗呢？網(wǎng)上已經(jīng)有不少人寫(xiě)過(guò)這案例了，我也來(lái)嘗試下練練手。

一，貓狗數(shù)據(jù)集數(shù)目構(gòu)成

train	cats:1000 ,dogs:1000
test	cats: 500,dogs:500
validation	cats:500,dogs:500

二，數(shù)據(jù)導(dǎo)入

train_dir = 'Data/train'
test_dir = 'Data/test'
validation_dir = 'Data/validation'
train_datagen = ImageDataGenerator(rescale=1/255,
                                   rotation_range=10,
                                   width_shift_range=0.2,  #圖片水平偏移的角度
                                   height_shift_range=0.2,  #圖片數(shù)值偏移的角度
                                   shear_range=0.2,  #剪切強(qiáng)度 
                                   zoom_range=0.2,   #隨機(jī)縮放的幅度
                                   horizontal_flip=True,   #是否進(jìn)行隨機(jī)水平翻轉(zhuǎn)
#                                    fill_mode='nearest'
                                  )
train_generator = train_datagen.flow_from_directory(train_dir,
                 (224,224),batch_size=1,class_mode='binary',shuffle=False)
test_datagen = ImageDataGenerator(rescale=1/255)
test_generator = test_datagen.flow_from_directory(test_dir,
                 (224,224),batch_size=1,class_mode='binary',shuffle=True)
validation_datagen = ImageDataGenerator(rescale=1/255)
validation_generator = validation_datagen.flow_from_directory(
                validation_dir,(224,224),batch_size=1,class_mode='binary')
print(train_datagen)
print(test_datagen)
print(train_datagen)

三，數(shù)據(jù)集構(gòu)建

我這里是將ImageDataGenerator類里的數(shù)據(jù)提取出來(lái)，將數(shù)據(jù)與標(biāo)簽分別存放在兩個(gè)列表，后面在轉(zhuǎn)為np.array，也可以使用model.fit_generator，我將數(shù)據(jù)放在內(nèi)存為了后續(xù)調(diào)參數(shù)時(shí)模型訓(xùn)練能更快讀取到數(shù)據(jù)，不用每次訓(xùn)練一整輪都去讀一次數(shù)據(jù)（應(yīng)該是這樣的…我是這樣理解…）
注意我這里的數(shù)據(jù)集構(gòu)建后，三種數(shù)據(jù)都是存放在內(nèi)存中的，我電腦內(nèi)存是16g的可以存放下。

train_data=[]
train_labels=[]
a=0
for data_train, labels_train in train_generator:
    train_data.append(data_train)
    train_labels.append(labels_train)
    a=a+1
    if a>1999:
        break
x_train=np.array(train_data)
y_train=np.array(train_labels)
x_train=x_train.reshape(2000,224,224,3)

test_data=[]
test_labels=[]
a=0
for data_test, labels_test in test_generator:
    test_data.append(data_test)
    test_labels.append(labels_test)
    a=a+1
    if a>999:
        break
x_test=np.array(test_data)
y_test=np.array(test_labels)
x_test=x_test.reshape(1000,224,224,3)

validation_data=[]
validation_labels=[]
a=0
for data_validation, labels_validation in validation_generator:
    validation_data.append(data_validation)
    validation_labels.append(labels_validation)
    a=a+1
    if a>999:
        break
x_validation=np.array(validation_data)
y_validation=np.array(validation_labels)
x_validation=x_validation.reshape(1000,224,224,3)

四，模型搭建

model1 = tf.keras.models.Sequential([
    # 第一層卷積，卷積核為，共16個(gè)，輸入為150*150*1
    tf.keras.layers.Conv2D(16,(3,3),activation='relu',padding='same',input_shape=(224,224,3)),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 第二層卷積，卷積核為3*3，共32個(gè)，
    tf.keras.layers.Conv2D(32,(3,3),activation='relu',padding='same'),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 第三層卷積，卷積核為3*3，共64個(gè)，
    tf.keras.layers.Conv2D(64,(3,3),activation='relu',padding='same'),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 數(shù)據(jù)鋪平
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64,activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(1,activation='sigmoid')
])
print(model1.summary())

模型summary：

在這里插入圖片描述

五，模型訓(xùn)練

model1.compile(optimize=tf.keras.optimizers.SGD(0.00001),
             loss=tf.keras.losses.binary_crossentropy,
             metrics=['acc'])
history1=model1.fit(x_train,y_train,
# 					validation_split=(0~1)   選擇一定的比例用于驗(yàn)證集，可被validation_data覆蓋
                  validation_data=(x_validation,y_validation),
                  batch_size=10,
                  shuffle=True,
                  epochs=10)
model1.save('cats_and_dogs_plain1.h5')
print(history1)

在這里插入圖片描述

plt.plot(history1.epoch,history1.history.get('acc'),label='acc')
plt.plot(history1.epoch,history1.history.get('val_acc'),label='val_acc')
plt.title('正確率')
plt.legend()

在這里插入圖片描述

可以看到我們的模型泛化能力還是有點(diǎn)差，測(cè)試集的acc能達(dá)到0.85以上，驗(yàn)證集卻在0.65~0.70之前跳動(dòng)。

六，模型測(cè)試

model1.evaluate(x_validation,y_validation)

在這里插入圖片描述

最后我們的模型在測(cè)試集上的正確率為0.67，可以說(shuō)還不夠好，有點(diǎn)過(guò)擬合，可能是訓(xùn)練數(shù)據(jù)不夠多，后續(xù)可以數(shù)據(jù)增廣或者從驗(yàn)證集、測(cè)試集中調(diào)取一部分?jǐn)?shù)據(jù)用于訓(xùn)練模型，可能效果好一些。

到此這篇關(guān)于python之tensorflow手把手實(shí)例講解貓狗識(shí)別實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python tensorflow 貓狗識(shí)別內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: