【深度学习】ONNX：从入门到精通-世界杯日本队员-男篮世界杯_世界杯德国7比1巴西

【深度学习】ONNX：从入门到精通

2025-08-08 11:02:27

在软件工程中，部署指把开发完毕的软件投入使用的过程，包括环境配置、软件安装等步骤。类似地，对于深度学习模型来说，模型部署指让训练好的模型在特定环境中运行的过程。相比于软件部署，模型部署会面临更多的难题：

运行模型所需的环境难以配置。深度学习模型通常是由一些框架编写，比如 PyTorch、TensorFlow。由于框架规模、依赖环境的限制，这些框架不适合在手机、开发板等生产环境中安装。

深度学习模型的结构通常比较庞大，需要大量的算力才能满足实时运行的需求，模型的运行效率需要优化。

因为这些难题的存在，模型部署不能靠简单的环境配置与安装完成。经过工业界和学术界数年的探索，模型部署有了一条流行的流水线：

image-20240922104902828如上图，为了让模型最终能够部署到某一环境上，开发者们可以使用任意一种深度学习框架来定义网络结构，并通过训练确定网络中的参数。之后，模型的结构和参数会被转换成一种只描述网络结构的中间表示，一些针对网络结构的优化会在中间表示上进行。最后，用面向硬件的高性能编程框架(如 CUDA，OpenCL）编写，能高效执行深度学习网络中算子的推理引擎会把中间表示转换成特定的文件格式，并在对应硬件平台上高效运行模型，比如中间表示ONNX转换支持华为芯片推理的OM文件。

ONNX介绍ONNX （Open Neural Network Exchange）是 Facebook 和微软在2017年共同发布的，用于标准描述计算图的一种格式。目前，在数家机构的共同维护下，ONNX 已经对接了多种深度学习框架和多种推理引擎。因此，ONNX 被当成了深度学习框架到推理引擎的桥梁，就像编译器的中间语言一样。由于各框架兼容性不一，我们通常只用 ONNX 表示更容易部署的静态图。

图是由多个节点组成的，除输入和输出节点，每个节点表示一个算子，节点相互连接则形成有向无环图，静态图的含义是节点个数是确定的。

如下ONNX网络图：

image-20240922110128702输入节点名称：input

输出节点名称：values

算子节点：Conv、Sigmoid、Mul

箭头则表示网络图为有向无环图

构建ONNX图现在我们通过ONNX库构建ONNX神经网络图。

构建神经网络图的流程图：

我们通过流程图编码实现基于ONNX的模型。

定义输入输出向量

import onnx

from onnx import helper

from onnx import TensorProto

# define tensor

input = helper.make_tensor_value_info('input', TensorProto.FLOAT, [1,3,256, 256])

roi = helper.make_tensor_value_info('roi',TensorProto.FLOAT,[])

scales = helper.make_tensor_value_info('scales',TensorProto.FLOAT,[4])

conv_input = helper.make_tensor_value_info('conv_input',TensorProto.FLOAT,[1,3,512,512])

conv_weight = helper.make_tensor_value_info('conv_weight',TensorProto.FLOAT,[32,3,3,3])

conv_bias = helper.make_tensor_value_info('conv_bias',TensorProto.FLOAT,[32])

conv_output = helper.make_tensor_value_info('conv_output',TensorProto.FLOAT,[1,32,512,512])

add_input = helper.make_tensor_value_info('add_input',TensorProto.FLOAT,[1])

output = helper.make_tensor_value_info('output',TensorProto.FLOAT,[1,32,512,512])通过make_tensor_value_info定义向量，参数分别表示：向量名称，向量类型和向量形状。如input向量名称是input，向量类型是TensorProto.FLOAT，向量大小是[1,3,256,256]。

构建节点

resize_node = helper.make_node("Resize",['input','roi','scales'],['conv_input'],name='resize')

conv_node = helper.make_node("Conv",['conv_input','conv_weight','conv_bias'],['conv_output'],name='conv')

add_node = helper.make_node('Add',['conv_output','add_input'],['output'],name='add')通过make_node构建节点，参数分别表示onnx算子，输入名称、输出名称和节点名称。如节点resize_node的onnx算子是Resize，输入名称是input,roi,scales，输出名称是conv_input，节点名称是resize。

构建图

graph = helper.make_graph([resize_node,conv_node,add_node],'resize_conv_add_graph',inputs=[input,roi,scales,conv_weight,conv_bias,add_input],outputs=[output])通过make_graph构建图，参数分别表示onnx节点，图名称，输入向量和输出向量

构建和检测模型

model = helper.make_model(graph) # 构建模型

onnx.checker.check_model(model) # 检测模型的准确性通过make_model构建模型，参数graph表示网络图，通过check_model检测构建的模型是否准确，参数model表示构建的模型。

保存模型

onnx.save(model, 'resize_conv_add.onnx')我们通过链接https://netron.app/可视化onnx模型。

image-20240922122007134完成代码如下：