欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用TFRecord存取多個數據案例

 更新時間:2020年02月17日 11:10:42   作者:gaoyueace  
今天小編就為大家分享一篇使用TFRecord存取多個數據案例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

TensorFlow提供了一種統(tǒng)一的格式來存儲數據,就是TFRecord,它可以統(tǒng)一不同的原始數據格式,并且更加有效地管理不同的屬性。

TFRecord格式

TFRecord文件中的數據都是用tf.train.Example Protocol Buffer的格式來存儲的,tf.train.Example可以被定義為:

message Example{
  Features features = 1
}

message Features{
  map<string, Feature> feature = 1
}

message Feature{
  oneof kind{
    BytesList bytes_list = 1
    FloatList float_list = 1
    Int64List int64_list = 1
  }
}

可以看出Example是一個嵌套的數據結構,其中屬性名稱可以為一個字符串,其取值可以是字符串BytesList、實數列表FloatList或整數列表Int64List。

將數據轉化為TFRecord格式

以下代碼是將MNIST輸入數據轉化為TFRecord格式:

# -*- coding: utf-8 -*-

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import numpy as np


# 生成整數型的屬性
def _int64_feature(value):
  return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))

# 生成浮點型的屬性
def _float_feature(value):
  return tf.train.Feature(float_list=tf.train.FloatList(value=[value]))  
#若想保存為數組,則要改成value=value即可


# 生成字符串型的屬性
def _bytes_feature(value):
  return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))


mnist = input_data.read_data_sets("/tensorflow_google", dtype=tf.uint8, one_hot=True)
images = mnist.train.images
# 訓練數據所對應的正確答案,可以作為一個屬性保存在TFRecord中
labels = mnist.train.labels
# 訓練數據的圖像分辨率,這可以作為Example中的一個屬性
pixels = images.shape[1]
num_examples = mnist.train.num_examples

# 輸出TFRecord文件的地址
filename = "/tensorflow_google/mnist_output.tfrecords"
# 創(chuàng)建一個writer來寫TFRecord文件
writer = tf.python_io.TFRecordWriter(filename)
for index in range(num_examples):
  # 將圖像矩陣轉換成一個字符串
  image_raw = images[index].tostring()
  # 將一個樣例轉化為Example Protocol Buffer, 并將所有的信息寫入這個數據結構
  example = tf.train.Example(features=tf.train.Features(feature={
    'pixels': _int64_feature(pixels),
    'label': _int64_feature(np.argmax(labels[index])),
    'image_raw': _bytes_feature(image_raw)}))

  # 將一個Example寫入TFRecord文件
  writer.write(example.SerializeToString())
writer.close()

本程序將MNIST數據集中所有的訓練數據存儲到了一個TFRecord文件中,若數據量較大,也可以存入多個文件。

從TFRecord文件中讀取數據

以下代碼可以從上面代碼中的TFRecord中讀取單個或多個訓練數據:

# -*- coding: utf-8 -*-
import tensorflow as tf

# 創(chuàng)建一個reader來讀取TFRecord文件中的樣例
reader = tf.TFRecordReader()
# 創(chuàng)建一個隊列來維護輸入文件列表
filename_queue = tf.train.string_input_producer(["/Users/gaoyue/文檔/Program/tensorflow_google/chapter7"
                         "/mnist_output.tfrecords"])

# 從文件中讀出一個樣例,也可以使用read_up_to函數一次性讀取多個樣例
# _, serialized_example = reader.read(filename_queue)
_, serialized_example = reader.read_up_to(filename_queue, 6) #讀取6個樣例
# 解析讀入的一個樣例,如果需要解析多個樣例,可以用parse_example函數
# features = tf.parse_single_example(serialized_example, features={
# 解析多個樣例
features = tf.parse_example(serialized_example, features={
  # TensorFlow提供兩種不同的屬性解析方法
  # 第一種是tf.FixedLenFeature,得到的解析結果為Tensor
  # 第二種是tf.VarLenFeature,得到的解析結果為SparseTensor,用于處理稀疏數據
  # 解析數據的格式需要與寫入數據的格式一致
  'image_raw': tf.FixedLenFeature([], tf.string),
  'pixels': tf.FixedLenFeature([], tf.int64),
  'label': tf.FixedLenFeature([], tf.int64),
})

# tf.decode_raw可以將字符串解析成圖像對應的像素數組
images = tf.decode_raw(features['image_raw'], tf.uint8)
labels = tf.cast(features['label'], tf.int32)
pixels = tf.cast(features['pixels'], tf.int32)

sess = tf.Session()
# 啟動多線程處理輸入數據
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coord)

# 每次運行可以讀取TFRecord中的一個樣例,當所有樣例都讀完之后,會重頭讀取
# for i in range(10):
#   image, label, pixel = sess.run([images, labels, pixels])
#   # print(image, label, pixel)
#   print(label, pixel)

# 讀取TFRecord中的前6個樣例,若加入循環(huán),則會每次從上次輸出的地方繼續(xù)順序讀6個樣例
image, label, pixel = sess.run([images, labels, pixels])
print(label, pixel)

sess.close()

>> [7 3 4 6 1 8] [784 784 784 784 784 784]

輸出結果顯示,從TFRecord文件中順序讀出前6個樣例。

以上這篇使用TFRecord存取多個數據案例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關文章

  • Python中最大最小賦值小技巧(分享)

    Python中最大最小賦值小技巧(分享)

    下面小編就為大家分享一篇Python中最大最小賦值小技巧,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2017-12-12
  • python使用Scrapy庫進行數據提取和處理的方法詳解

    python使用Scrapy庫進行數據提取和處理的方法詳解

    在我們的初級教程中,我們介紹了如何使用Scrapy創(chuàng)建和運行一個簡單的爬蟲,在這篇文章中,我們將深入了解Scrapy的強大功能,學習如何使用Scrapy提取和處理數據
    2023-09-09
  • Python執(zhí)行JS的四種方法

    Python執(zhí)行JS的四種方法

    本文將詳細介紹Python中執(zhí)行和調用JavaScript的多種方法,包括內置的execjs庫、外部庫如PyExecJS、使用瀏覽器引擎和與Node.js的交互,感興趣的可以了解一下
    2023-11-11
  • Python3爬蟲里關于代理的設置總結

    Python3爬蟲里關于代理的設置總結

    在本篇文章里小編給大家整理的是一篇關于Python3爬蟲里關于代理的設置總結,需要的朋友們可以參考下。
    2020-07-07
  • Python計算庫numpy進行方差/標準方差/樣本標準方差/協(xié)方差的計算

    Python計算庫numpy進行方差/標準方差/樣本標準方差/協(xié)方差的計算

    今天小編就為大家分享一篇關于Python計算庫numpy進行方差/標準方差/樣本標準方差/協(xié)方差的計算,小編覺得內容挺不錯的,現在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2018-12-12
  • Python實現把類當做字典來訪問

    Python實現把類當做字典來訪問

    今天小編就為大家分享一篇Python實現把類當做字典來訪問,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • python 多進程隊列數據處理詳解

    python 多進程隊列數據處理詳解

    今天小編就為大家分享一篇python 多進程隊列數據處理詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • Python中單例模式總結

    Python中單例模式總結

    單例模式(Singleton Pattern)是一種常用的軟件設計模式,該模式的主要目的是確保某一個類只有一個實例存在。當你希望在整個系統(tǒng)中,某個類只能出現一個實例時,單例對象就能派上用場。
    2018-02-02
  • Python中使用partial改變方法默認參數實例

    Python中使用partial改變方法默認參數實例

    這篇文章主要介紹了Python中使用partial改變方法默認參數實例,本文直接給出使用實例,代碼中包含詳細注釋,需要的朋友可以參考下
    2015-04-04
  • Python內存優(yōu)化的七種技巧分享

    Python內存優(yōu)化的七種技巧分享

    本文將重點介紹 Python 的內置機制,并介紹 7 種原始但有效的內存優(yōu)化技巧,掌握這些技巧將大大提高你的 Python 編程能力,文中通過代碼示例給大家講解的非常詳細,感興趣的小伙伴跟著小編一起來學習吧
    2024-02-02

最新評論