【读书】《计算机视觉之PyTorch数字图像处理》7.模型部署
[复制链接]
【读书】《计算机视觉之PyTorch数字图像处理》7.模型部署
在深度学习任务中,无论是图像分类、分割还是目标检测,完成模型的训练和测试并不是终点。训练只是模型开发的第一步,真正的挑战在于如何让模型在实际场景中高效、稳定地运行。这就需要我们进行模型部署。
模型部署是指将训练好的深度学习模型集成到具体的项目或系统中,作为系统的一部分,提供实际的推理服务。与模型训练不同,部署的核心目标是让模型能够高效执行推理任务,提升系统的整体智能性和稳定性。
在模型部署中,ONNX(Open Neural Network Exchange)作为一款开源的标准化模型格式,逐渐成为了行业的热门选择。它能够将训练好的模型转换为高效的推理格式,支持跨平台、跨硬件部署,让模型真正从“实验室”走向“生产环境”。
ONNX简介
ONNX 是由微软和Facebook联合推出的开源模型交换格式,旨在实现不同深度学习框架之间的互操作性。它为我们提供了一个标准化的表示方式,可以轻松将模型从一个框架(如 PyTorch、TensorFlow)导出,然后在另一个框架或推理引擎(如 ONNX Runtime)中高效运行。
ONNX的核心优势
- 框架无关:支持主流的深度学习框架,如 PyTorch、TensorFlow 等。
- 高效推理:通过计算图优化,大幅提升推理速度和效率。
- 跨平台支持:无论是服务器、移动端还是嵌入式设备,ONNX 都能轻松部署。
ONNX的工作流程
使用ONNX进行模型部署大致分为以下几步:
- 模型导出
从训练框架(如 PyTorch、TensorFlow)将模型导出为 ONNX 格式。
示例:在PyTorch中,使用 torch.onnx.export() 函数轻松实现模型转换。
- 模型优化
使用 ONNX 工具链(如 onnxruntime-tools)对模型进行优化,包括计算图简化、量化等操作,以提升推理性能。
- 模型部署
利用 ONNX Runtime 等推理引擎加载和执行 ONNX 模型,实现高效推理。
接下来,让我们详细看看 ONNX 的导出与部署过程。
模型导出
在 PyTorch 中,ONNX 提供了一个简单易用的工具包,利用 torch.onnx.export() 函数即可完成模型的导出。这个函数的原理与 PyTorch 的 TorchScript 类似,都是通过追踪输入数据,导出模型的运行流程并记录到 ONNX 文件中。部分参数如下:
示例代码:导出ResNet18模型
Python
from torchvision import models
import torch as tc
#创建一个模型
res18=models.resnet18(weights=models.ResNet18_Weights.DEFAULT)
res18.eval()
#生成一个正确尺寸的伪造图像
img=tc.ones((1,3,224,224))
tc.onnx.export(res18, img, "res18.onnx", input_names=['img'], output_names=['out']) |
以上代码会将训练好的 ResNet18 模型导出为一个名为 res18.onnx 的 ONNX 文件。导出后的模型可以被其他框架或推理引擎加载,进行高效部署。
导出的onnx模型如下:
模型部署
ONNX Runtime 是由微软推出的高性能推理引擎,可以加载 ONNX 格式的模型并执行推理任务。ONNX Runtime 支持 CPU 和 GPU 两种推理加速方式,安装方法如下:
Bash
pip install onnxruntime #安装支持CPU
pip install onnxruntime-gpu #安装支持GPU |
在安装完onnxruntime库后,就可以使用InferenceSession()方法加载ONNX模型,得到用于模型推断的会话,调用会话的run()方法进行输入数据的计算,并返回模型的输出。
对于输入数据,不能直接使用numpy数组,需要使用OrtValue.ortvalue_from_numpy()函数进行格式转化后才能作为模型的输入。
此外,在调用run()方法时,指定输入和输出数据的名称,要与模型导出时设置的名称一致。
Python
from PIL import Image
import numpy as np
# 打开图像文件
image = Image.open('1.jpeg')
image = image.resize([224,224])
# 将图像转换为NumPy数组
image_array = np.array(image).astype(np.float32)
image_array = image_array/255
# 2. 改变通道顺序,从 (224, 224, 3) 转换为 (3, 224, 224)
image_array = np.transpose(image_array, (2, 0, 1))
# 3. 添加批次维度,从 (3, 224, 224) 转换为 (1, 3, 224, 224)
image_array = np.expand_dims(image_array, axis=0)
# 输出数组的形状和数据类型
print(image_array.shape) # 输出图像的尺寸(高度, 宽度, 通道数)
print(image_array.dtype) # 输出数组的数据类型,通常是uint8
import onnxruntime
import numpy as np
#导入onnx格式的res18模型
session=onnxruntime.InferenceSession('./res18.onnx',providers=['CPUExecutionProvider'])# providers=['CPUExecutionProvider','CUDAExecutionProvider']
#创建并转换数据
# img=np.ones((1,3,224,224)).astype(np.float32)
img = image_array
ortimg = onnxruntime.OrtValue.ortvalue_from_numpy(img)
#使模型执行输入数据,得到结果
results = session.run(["out"], {"img": ortimg})
#得到模型运行结果
results[0][0].argmax() |
上述代码首先读取了名为1.jpeg的图片并处理成输入的大小,之后执行onnxruntime推理,得到输出结果。
输入图片如下:
输出结果如下:
|