PyTorch 模型 onnx 文件导出及调用详情

2024-04-02 19:04:59 535人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录前言基本用法高级 api前言 Open Neural Network Exchange (ONNX，开放神经网络交换) 格式，是一个用于表示深度学习模型的标准，可使模型在不同框架

前言

Open Neural Network Exchange (ONNX，开放神经网络交换) 格式，是一个用于表示深度学习模型的标准，可使模型在不同框架之间进行转移

PyTorch 所定义的模型为动态图，其前向传播是由类方法定义和实现的

但是 python 代码的效率是比较底下的，试想把动态图转化为静态图，模型的推理速度应当有所提升

PyTorch 框架中，torch.onnx.export 可以将父类为 nn.Module 的模型导出到 onnx 文件中，

最重要的有三个参数：

model：父类为 nn.Module 的模型
args：传入 model 的 forward 方法的变量列表，类型应为
tuplef：onnx 文件名称的字符串

import torch
from torchvision.models import resnet50
 
file = 'resnet.onnx'
# 声明模型
resnet = resnet50(pretrained=False).eval()
image = torch.rand([1, 3, 224, 224])
# 导出为 onnx 文件
torch.onnx.export(resnet, (image,), file)

onnx 文件可被 Netron 打开，以查看模型结构

基本用法

要在 Python 中运行 onnx 模型，需要下载 onnxruntime

# 选其一即可
pip install onnxruntime        # CPU 版本
pip install onnxruntime-gpu    # GPU 版本

推理时需要借助其中的 InferenceSession，其中较为重要的实例方法有：

get_inputs()：得到输入变量的列表 (变量属性：name、shape、type)
get_outputs()：得到输入变量的列表 (变量属性：name、shape、type)run(output_names, input_feed)：输入变量为 numpy.ndarray (注意 dtype 应为 float32)，使用模型推理并返回输出

可得出 onnx 模型的基本用法：

import onnxruntime as ort
import numpy as np
file = 'resnet.onnx'
# 找到 GPU / CPU
provider = ort.get_available_providers()[
    1 if ort.get_device() == 'GPU' else 0]
print('设备:', provider)
# 声明 onnx 模型
model = ort.InferenceSession(file, providers=[provider])
# 参考: ort.nodeArg
for node_list in model.get_inputs(), model.get_outputs():
    for node in node_list:
        attr = {'name': node.name,
                'shape': node.shape,
                'type': node.type}
        print(attr)
    print('-' * 60)
 
# 得到输入、输出结点的名称
input_node_name = model.get_inputs()[0].name
ouput_node_name = [node.name for node in model.get_outputs()]
image = np.random.random([1, 3, 224, 224]).astype(np.float32)
print(model.run(output_names=ouput_node_name,
                input_feed={input_node_name: image}))

高级 API

为了简化使用步骤，使用类进行封装：

class Onnx_Module(ort.InferenceSession):
    ''' onnx 推理模型
        provider: 优先使用 GPU'''
    provider = ort.get_available_providers()[
        1 if ort.get_device() == 'GPU' else 0]
 
    def __init__(self, file):
        super(Onnx_Module, self).__init__(file, providers=[self.provider])
        # 参考: ort.NodeArg
        self.inputs = [node_arg.name for node_arg in self.get_inputs()]
        self.outputs = [node_arg.name for node_arg in self.get_outputs()]
 
    def __call__(self, *arrays):
        input_feed = {name: x for name, x in zip(self.inputs, arrays)}
        return self.run(self.outputs, input_feed)

在 PyTorch 中，对于卷积神经网络 model 与图像 image，推理的代码为 "model(image)"，而使用这个封装的类也是类似：

import numpy as np
file = 'resnet.onnx'
model = Onnx_Module(file)
image = np.random.random([1, 3, 224, 224]).astype(np.float32)
print(model(image))

为了方便观察 Torch 模型与 onnx 模型的速度差异，同时检查两个模型的输出是否一致，又编写了 test 函数

test 方法的参数与 torch.onnx.export 一致，其基本流程为：

得到 Torch 模型的输出，并 print 推断耗时
将 Torch 模型导出为 onnx 文件，将输入变量中的 torch.tensor 转化为 numpy.ndarray
初始化 onnx 模型，得到 onnx 模型的输出，并 print 推断耗时
计算 Torch 模型与 onnx 模型输出的绝对误差的均值
将 onnx 模型 return

class Timer:
    repeat = 3
 
    def __new__(cls, fun, *args, **kwargs):
        import time
        start = time.time()
        for _ in range(cls.repeat): fun(*args, **kwargs)
        cost = (time.time() - start) / cls.repeat
        return cost * 1e3  # ms
 
 
class Onnx_Module(ort.InferenceSession):
    ''' onnx 推理模型
        provider: 优先使用 GPU'''
    provider = ort.get_available_providers()[
        1 if ort.get_device() == 'GPU' else 0]
 
    def __init__(self, file):
        super(Onnx_Module, self).__init__(file, providers=[self.provider])
        # 参考: ort.NodeArg
        self.inputs = [node_arg.name for node_arg in self.get_inputs()]
        self.outputs = [node_arg.name for node_arg in self.get_outputs()]
    def __call__(self, *arrays):
        input_feed = {name: x for name, x in zip(self.inputs, arrays)}
        return self.run(self.outputs, input_feed)
 
    @claSSMethod
    def test(cls, model, args, file, **export_kwargs):
        # 测试 Torch 的运行时间
        torch_output = model(*args).data.numpy()
        print(f'Torch: {Timer(model, *args):.2f} ms')
        # model: Torch -> onnx
        torch.onnx.export(model, args, file, **export_kwargs)
        # data: tensor -> array
        args = tuple(map(lambda tensor: tensor.data.numpy(), args))
        onnx_model = cls(file)
        # 测试 onnx 的运行时间
        onnx_output = onnx_model(*args)
        print(f'Onnx: {Timer(onnx_model, *args):.2f} ms')
        # 计算 Torch 模型与 onnx 模型输出的绝对误差
        abs_error = np.abs(torch_output - onnx_output).mean()
        print(f'Mean Error: {abs_error:.2f}')
        return onnx_model

对于 ResNet50 而言，Torch 模型的推断耗时为 172.67 ms，onnx 模型的推断耗时为 36.56 ms，onnx 模型的推断耗时仅为 Torch 模型的 21.17%

到此这篇关于PyTorch 模型 onnx 文件导出及调用详情的文章就介绍到这了,更多相关PyTorch文件导出内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: PyTorch 模型 onnx 文件导出及调用详情

本文链接: https://www.lsjlt.com/news/126051.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

PyTorch 模型 onnx 文件导出及调用详情

目录前言基本用法高级 API前言 Open Neural Network Exchange (ONNX，开放神经网络交换) 格式，是一个用于表示深度学习模型的标准，可使模型在不同框架...

99+

2024-04-02
【yolov5】pytorch模型导出为onnx模型

博主想拿官网的yolov5训练好pt模型，然后转换成rknn模型，然后在瑞芯微开发板上调用模型检测。但是官网的版本对npu不友好，所以采用改进结构的版本：将Focus层改成Conv层将Swis...

99+

2023-09-14

pytorch 深度学习 python yolov5 模型转换
利用模板导出文件之XLSTransformer导出excel文件

使用XLSTransformer库导出excel文件的步骤如下：1. 安装XLSTransformer库：在命令行中运行`pip i...

99+

2023-09-14

excel
模型的保存加载、模型微调、GPU使用及Pytorch常见报错

序列化与反序列化序列化就是说内存中的某一个对象保存到硬盘当中，以二进制序列的形式存储下来，这就是一个序列化的过程。而反序列化，就是将硬盘中存储的二进制的数，反序列化到内存当中，得到一个相应的对象，这样就可以再次使用这个模型了。序列化和...

99+

2023-08-30

pytorch 人工智能 python
EXCEL文件软件利用POI模板导出

本篇文章给大家分享的是有关EXCEL文件软件利用POI模板导出，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。一般的EXCEL导出使用POI先创建一个HSSFWorkbook，然...

99+

2023-05-31

poi excel
详细介绍 Yolov5 转 ONNX模型 + 使用ONNX Runtime 的 Python 部署（包含官方文档的介绍）

1 Pytorch模型转Onnx 对ONNX的介绍强烈建议看，本文做了很多参考：模型部署入门教程（一）：模型部署简介模型部署入门教程（三）：PyTorch 转 ONNX 详解以及Pytorch的官...

99+

2023-08-31

python pytorch 深度学习目标检测
PhpSpreadsheet 基本使用和导入导出模版生成Excel文件

一. 基本使用 ...

99+

2023-09-08

excel PhpSpreadsheet php
利用PHPExcel导出excel文件的方法详解

最近工作中需要用到phpexcel导出excel表格。自动存储在固定位置。之前导出excel使用header原生导出。但是这种方法，我没有找到可以自动存储的功能。如果你知道，请...

99+

2022-11-13

PHPExcel导出excel文件 PHPExcel导出excel PHP 导出excel文件
详解TypeScript使用及类型声明文件

目录简介Script 与 Vue3defineProps 与 TypescriptdefineEmits 与 Typescriptref 与 Typescriptcomputed 与...

99+

2024-04-02
怎么用Java Hutool工具实现验证码生成及Excel文件的导入和导出

这篇文章主要介绍“怎么用Java Hutool工具实现验证码生成及Excel文件的导入和导出”，在日常操作中，相信很多人在怎么用Java Hutool工具实现验证码生成及Excel文件的导入和导出问题上存在疑惑，小编查阅...

99+

2023-06-21
GEN 自动生成 GORM 模型结构体文件及使用示例

GEN 自动生成 GORM 模型结构体文件及使用示例背景 GEN 是一个基于 GORM 的安全 ORM 框架, 由字节跳动无恒实验室与 GORM 作者联合研发，主要功能说白了就是帮助生成数据表对应的...

99+

2023-09-06

golang gorm gen mysql
JAVA利用Freemarker模版动态生成并导出word文档（全网最详细）

文章目录一、文章背景二、实现步骤1、需要的环境2、创建模板3、书写java类4、测试三、freemarker技术点一、文章背景公司的某个需求，需要根据接口的信息生成一...

99+

2023-09-09

java word 开发语言
【导出Word】如何使用Java+Freemarker模板引擎，根据XML模板文件生成Word文档（只含文本内容的模板）

这篇文章，主要介绍如何使用Java+Freemarker模板引擎，根据XML模板文件生成Word文档。目录一、导出Word文档 1.1、基础知识 1.2、制作模板文件 1.3、代码实现（1）引入依赖（2）创建Freemarke...

99+

2023-10-23

word Java导出Word Freemarker Word文档导出功能根据模板文件导出Word文档
ONNX：C++通过onnxruntime使用.onnx模型进行前向计算【下载的onnxruntime是编译好的库文件，可直接使用】

一、基本介绍微软联合Facebook等在2017年搞了个深度学习以及机器学习模型的格式标准–ONNX，旨在将所有模型格式统一为一致，更方便地实现模型部署。现在大多数的深度学习框架都支持ONNX模型转出并提供相应的导出接口。 ONNXRun...

99+

2023-09-05

pytorch 人工智能 python
python xmind 包使用详解(其中解决导出的xmind文件 xmind8可以打开 xmind2020及之后版本打开报错问题)

pip install xmind 使用場景　xmind8 可以打开　xmind2020 报错 main_fest.xml(xmind8 打开另存后更改后缀为.zip 里边包含...

99+

2024-04-02
【目标检测实验系列】AutoDL线上GPU服务器租用流程以及如何用Pycharm软件远程连接服务器进行模型训练（以Pycharm远程训练Yolov5项目为例子超详细）

目录 1. 文章主要内容2. 租用AutoDL服务器详细教程2.1 注册AutoDL账号，并申请学生认证(学生认证有优惠，如果不是学生可以忽略此点)2.2 算力市场选择GPU，并选择初始化配置环境2.3 控制台参数解析，并使用相关参...

99+

2023-08-30

目标检测 pycharm AutoDL yolov5 深度学习