python神经网络tfrecords文件的写入读取及内容解析

2024-04-02 19:04:59 633人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录学习前言tfrecords格式是什么tfrecords的写入tfrecords的读取测试代码1、tfrecords文件的写入2、tfrecords文件的读取学习前言前一段时间对

学习前言

前一段时间对SSD预测与训练的整体框架有了一定的了解，但是对其中很多细节还是把握的不清楚。今天我决定好好了解以下tfrecords文件的构造。

tfrecords格式是什么

tfrecords是一种二进制编码的文件格式，Tensorflow专用。能将任意数据转换为tfrecords。更好的利用内存，更方便复制和移动，并且不需要单独的标签文件。

之所以使用到tfrecords格式是因为当今数据爆炸的情况下，使用普通的数据格式不仅麻烦，而且速度慢，这种专门为tensorflow定制的数据格式可以大大增快数据的读取，而且将所有内容规整，在保证速度的情况下，使得数据更加简单明晰。

tfrecords的写入

这个例子将会讲述如何将MNIST数据集写入到tfrecords，本次用到的MNIST数据集会利用tensorflow原有的库进行导入。

from tensorflow.examples.tutorials.mnist import input_data
# 读取MNIST数据集
mnist = input_data.read_data_sets('./MNIST_data', dtype=tf.float32, one_hot=True)

对于MNIST数据集而言，其中的训练集是mnist.train，而它的数据可以分为images和labels，可通过如下方式获得。

# 获得image，shape为(55000,784)
images = mnist.train.images
# 获得label，shape为(55000,10)
labels = mnist.train.labels
# 获得一共具有多少张图片
num_examples = mnist.train.num_examples

接下来定义存储TFRecord文件的地址，同时创建一个writer来写TFRecord文件。

# 存储TFRecord文件的地址
filename = 'record/output.tfrecords'
# 创建一个writer来写TFRecord文件
writer = tf.python_io.TFRecordWriter(filename)

此时便可以按照一定的格式写入了，此时需要对每一张图片进行循环并写入，在tf.train.Features中利用features字典定义了数据保存的方式。以image_raw为例，其经过函数_float_feature处理后，存储到tfrecords文件的’image/encoded’位置上。

# 将每张图片都转为一个Example，并写入
for i in range(num_examples):
    image_raw = images[i]  # 读取每一幅图像
    image_string = images[i].tostring()
    example = tf.train.Example(
        features=tf.train.Features(
            feature={
                'image/class/label': _int64_feature(np.argmax(labels[i])),
                'image/encoded': _float_feature(image_raw),
                'image/encoded_tostring': _bytes_feature(image_string)
            }
        )
    )
    print(i,"/",num_examples)
    writer.write(example.SerializeToString())  # 将Example写入TFRecord文件

在最终存入前，数据还需要经过处理，处理方式如下：

# 生成整数的属性
def _int64_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=value))
# 生成浮点数的属性
def _float_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(float_list=tf.train.FloatList(value=value))
# 生成字符串型的属性
def _bytes_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=value))

tfrecords的读取

tfrecords的读取首先要创建一个reader来读取TFRecord文件中的Example。

# 创建一个reader来读取TFRecord文件中的Example
reader = tf.TFRecordReader()

再创建一个队列来维护输入文件列表。

# 创建一个队列来维护输入文件列表
filename_queue = tf.train.string_input_producer(['record/output.tfrecords'])

利用reader读取输入文件列表队列，并用parse_single_example将读入的Example解析成tensor

# 从文件中读出一个Example
_, serialized_example = reader.read(filename_queue)
# 用parse_single_example将读入的Example解析成tensor
features = tf.parse_single_example(
    serialized_example,
    features={
        'image/class/label': tf.FixedLenFeature([], tf.int64),
        'image/encoded': tf.FixedLenFeature([784], tf.float32, default_value=tf.zeros([784], dtype=tf.float32)),
        'image/encoded_tostring': tf.FixedLenFeature([], tf.string)
    }
)

此时我们得到了一个features，实际上它是一个类似于字典的东西，我们额可以通过字典的方式读取它内部的内容，而字典的索引就是我们再写入tfrecord文件时所用的feature。

# 将字符串解析成图像对应的像素数组
labels = tf.cast(features['image/class/label'], tf.int32)
images = tf.cast(features['image/encoded'], tf.float32)
images_tostrings = tf.decode_raw(features['image/encoded_tostring'], tf.float32)

最后利用一个循环输出：

# 每次运行读取一个Example。当所有样例读取完之后，在此样例中程序会重头读取
for i in range(5):
    label, image = sess.run([labels, images])
    images_tostring = sess.run(images_tostrings)
    print(np.shape(image))
    print(np.shape(images_tostring))
    print(label)
    print("#########################")

测试代码

1、tfrecords文件的写入

import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
# 生成整数的属性
def _int64_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=value))
# 生成浮点数的属性
def _float_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(float_list=tf.train.FloatList(value=value))
# 生成字符串型的属性
def _bytes_feature(value):
    if not isinstance(value,list) and not isinstance(value,np.ndarray):
        value = [value]
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=value))
# 读取MNIST数据集
mnist = input_data.read_data_sets('./MNIST_data', dtype=tf.float32, one_hot=True)
# 获得image，shape为(55000,784)
images = mnist.train.images
# 获得label，shape为(55000,10)
labels = mnist.train.labels
# 获得一共具有多少张图片
num_examples = mnist.train.num_examples
# 存储TFRecord文件的地址
filename = 'record/Mnist_Out.tfrecords'
# 创建一个writer来写TFRecord文件
writer = tf.Python_io.TFRecordWriter(filename)
# 将每张图片都转为一个Example，并写入
for i in range(num_examples):
    image_raw = images[i]  # 读取每一幅图像
    image_string = images[i].tostring()
    example = tf.train.Example(
        features=tf.train.Features(
            feature={
                'image/class/label': _int64_feature(np.argmax(labels[i])),
                'image/encoded': _float_feature(image_raw),
                'image/encoded_tostring': _bytes_feature(image_string)
            }
        )
    )
    print(i,"/",num_examples)
    writer.write(example.SerializeToString())  # 将Example写入TFRecord文件
print('data processing success')
writer.close()

运行结果为：

……
54993 / 55000
54994 / 55000
54995 / 55000
54996 / 55000
54997 / 55000
54998 / 55000
54999 / 55000
data processing success

2、tfrecords文件的读取

import tensorflow as tf
import numpy as np
# 创建一个reader来读取TFRecord文件中的Example
reader = tf.TFRecordReader()
# 创建一个队列来维护输入文件列表
filename_queue = tf.train.string_input_producer(['record/Mnist_Out.tfrecords'])
# 从文件中读出一个Example
_, serialized_example = reader.read(filename_queue)
# 用parse_single_example将读入的Example解析成tensor
features = tf.parse_single_example(
    serialized_example,
    features={
        'image/class/label': tf.FixedLenFeature([], tf.int64),
        'image/encoded': tf.FixedLenFeature([784], tf.float32, default_value=tf.zeros([784], dtype=tf.float32)),
        'image/encoded_tostring': tf.FixedLenFeature([], tf.string)
    }
)
# 将字符串解析成图像对应的像素数组
labels = tf.cast(features['image/class/label'], tf.int32)
images = tf.cast(features['image/encoded'], tf.float32)
images_tostrings = tf.decode_raw(features['image/encoded_tostring'], tf.float32)
sess = tf.Session()
# 启动多线程处理输入数据
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coord)
# 每次运行读取一个Example。当所有样例读取完之后，在此样例中程序会重头读取
for i in range(5):
    label, image = sess.run([labels, images])
    images_tostring = sess.run(images_tostrings)
    print(np.shape(image))
    print(np.shape(images_tostring))
    print(label)
    print("#########################")

运行结果为：

#########################
(784,)
(784,)
7
#########################
#########################
(784,)
(784,)
4
#########################
#########################
(784,)
(784,)
1
#########################
#########################
(784,)
(784,)
1
#########################
#########################
(784,)
(784,)
9
#########################

以上就是python神经网络tfrecords文件的写入读取及内容解析的详细内容，更多关于python神经网络tfrecords写入读取的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python神经网络tfrecords文件的写入读取及内容解析

本文链接: https://www.lsjlt.com/news/117587.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python神经网络tfrecords文件的写入读取及内容解析

目录学习前言tfrecords格式是什么tfrecords的写入tfrecords的读取测试代码1、tfrecords文件的写入2、tfrecords文件的读取学习前言前一段时间对...

99+

2024-04-02
python open读取文件内容时的mode模式解析

Python可以使用open函数来实现文件的打开，关闭，读写操作； Python3中的open函数定义为：open(file, mode='r', buffering...

99+

2024-04-02
python中文件的读取与写入以及os模

1.文件读取的三部曲：打开 ---> 操作 ----> 关闭 r(默认参数)：-只能读，不能写-读取文件不存在会报错FileNotFoundError: [Errno 2] No such file or directory:...

99+

2023-01-31

文件 python os
pythonpandas解析(读取、写入)CSV文件的操作方法

目录1. 使用 pandas 读取 CSV 文件2. 使用 pandas 写入 CSV 文件1. 使用 pandas 读取 CSV 文件原始数据包含了公司员工的数据： NameHi...

99+

2022-12-23

python pandas 解析CSV 文件 pandas 读取 CSV 文件 pandas 写入 CSV 文件
python之文件操作（txt文本的读取写入及处理方法）

目录 1. 读取txt文档 1.1 打开.txt文件逐行读取文件内容 2.1 分割句子保存列表 2.2 filter使用：使用filter可将列表中的元素进行函数处理（append和expend区别） 3.1 获取列表中每个元素的长度：拓...

99+

2023-09-16

python 开发语言
python open读取文件内容时的mode模式实例分析

今天小编给大家分享一下python open读取文件内容时的mode模式实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来...

99+

2023-06-30
详解Python读取和写入操作CSV文件的方法

目录什么是 CSV 文件？内置 CSV 库解析 CSV 文件读取 CSV 文件csv将 CSV 文件读入字典csv可选的 Python CSV reader参数使用 csv 写入文件...

99+

2024-04-02
Python 使用netCDF4读写nc文件以及截取指定经纬度范围内的数据生成新的nc文件

Python 使用netCDF4读写nc文件以及截取nc文件经纬度范围内的数据简单介绍nc文件的读写操作，以及实现输入nc文件和坐标范围，输出一个新的nc文件的功能环境 python3.8.13 ...

99+

2023-09-13

python numpy
java简单解析xls文件的方法示例【读取和写入】

本文实例讲述了java简单解析xls文件的方法。分享给大家供大家参考，具体如下：读取：import java.io.*;import jxl.*;import jxl.write.*;import jxl.format.*;class Aa...

99+

2023-05-31

java xls文件 ava
Python实现一个简单三层神经网络的搭建及测试代码解析

目录1.初始化2.预测3.训练4.测试废话不多说了，直接步入正题，一个完整的神经网络一般由三层构成：输入层，隐藏层（可以有多层）和输出层。本文所构建的神经网络隐藏层只有一层。一个神...

99+

2024-04-02
深入理解Go语言文档中的io/ioutil.ReadFile函数读取文件内容

深入理解Go语言文档中的io/ioutil.ReadFile函数读取文件内容在Go语言中，有一个非常方便的函数可以用来读取文件内容，那就是io/ioutil包中的ReadFile函数。这个函数可以接收文件路径作为参数，并返回一个字节数组，表...

99+

2023-11-04

Go语言深入理解 ReadFile函数
深入理解Go语言文档中的io/ioutil.ReadAll函数读取完整文件内容

深入理解Go语言文档中的io/ioutil.ReadAll函数读取完整文件内容，需要具体代码示例在Go语言的标准库中，io/ioutil包提供了一些用于进行文件I/O操作的函数。其中，ReadAll函数被广泛用于读取完整文件内容，并返回一个...

99+

2023-11-04

Go语言 ReadAll io/ioutil
Java对文件的写入和读取 (File类详解以及Input,OutputStream用法,注意事项)

Java中,操作文件的类有很多, 核心的部分是File类,InputStream,OutputStream类文章目录 File类通过File类创建文件通过File类创建目录文件内容的读写 -- 数据流InputStream方...

99+

2023-08-18

java jvm 开发语言