电子工程世界-论坛»论坛 › 电子技术交流 › 嵌入式系统 › 《计算机视觉之PyTorch数字图像处理》----解读“图像分 ...

阅 376|回 0

1469 帖子	1 TA的资源

五彩晶圆（初级）

楼主

发表于2024-12-9 11:27 只看该作者

《计算机视觉之PyTorch数字图像处理》----解读“图像分类和图像分割” [复制链接]

要说起图像分类和图像分割，还要从一个有转折性意义的比赛讲起。

在2012年的ImageNet大规模分类比赛中，AlexKrizhevsky在Hinton的指导下使用其构建的卷积神经网络—AlexNet取得冠军。该AlexNet的分类精度较之以前的手工构建特征的再分类方法提高了近50%，从而使得图像分类任务取得了重大的突破。随后，卷积神经网络一路突飞猛进，在图像分类上迅速达到了人的识别精度，并在其他的图像和非图像任务上也取得了极大的进步。

单就图像分类来讲，它是模式识别、机器学习和人工智能的重要任务之一，它由图像处理研究开始，始终是研究的热点之一。

随着卷积神经网络成为研究的热点，基于卷积神经网络的各种模型在不断地刷新分类精度。

就完成一个分类任务而言，完全从头开始进行模型的构建和训练并非是一个好方法。充分利用已有的模型，在进行评估后，再进行调节和修改才更合理。在torchvision库中，已集成了许多经典的分类网络模型，可以通过函数的调用即可创建相应的模型，从而可以免去自行搭建的麻烦。令人更为心喜的是这些模型中大多数都提供了已训练好的参数，并可在创建模型时同步加载，让模型即时可用，这些模型均位于torchvision.models包下。

在预训练模型的使用，可所用多种模型进行预测，以三趾树懒（three-toed sloth）为例，三种模型的预测结果为：

resnet18的预测结果是：three-toed sloth, ai, Bradypus tridactylus，置信度是：93.9%

shufflenet的预测结果是：three-toed sloth, ai, Bradypus tridactylus，置信度是：99.9%

mobilenetv3的预测结果是：three-toed sloth, ai, Bradypus tridactylus，置信度是：75.0%

可见其置信度是非常高的，是可以投入应用的。

图1 三趾树懒

图像分割是图像处理的一项重要任务，图像分割可以看作是一种特殊的图像分类——逐像素的分类。

由于卷积神经网络在图像分类任务上的成功，将卷积网络进行适当的改进就能用于图像分割任务。在加入上采样和不同层次的特征后，卷积神经网络相较于其他方法能够在图像分割上取得更好的效果。

相较于分类网络，分割网络在数据集的制作、数据增强方法、损失函数、模型评估等都有自身独特的特性。

在经典的图像处理中，图像分割一般是基于单个像素值或包含一定邻域内的全部像素进行类别的判断。

经典方法存在的问题主要表现为分割结果较为破碎，边界不够圆滑，分割结果不准确。随着深度学习在分类上的成功，深度神经网络成为一种很好的特征提取器，能够生成比像素值更好的识别特征。因此，在对分类神经网络的结构进行改进后，能直接输出一张与输入图像宽高尺寸相同的张量，从而完成端到端的训练。

图2是一个进行实例分割的结果，可见其完成质量是较高的。

图2 原始图像分割结果

计算机视觉, PyTorch, 数字图像处理

此帖出自嵌入式系统论坛

点赞关注

嵌入式论坛嵌入式开发嵌入式技术嵌入式教程

返回列表发新帖回复

活动更多>>

开源项目更多>>

随便看看

《计算机视觉之PyTorch数字图像处理》--图像分类与分割
本篇讲述基于深度学习的图像分类与图像分割。图像分类图像分类是模式识别、机器学习和人工智能的重要任务之一。图像分类及其进展：早前图像分类的主要方法是先由人工设计特征，把图像从图像空间转换到特征空间，随后在特征空间中进行分类。后来卷积神经网络一 ...
《计算机视觉之PyTorch数字图像处理》----解读“自动梯度与神经网络”
在说明自动梯度与神经网络这个问题之前，先要介绍一下计算机视觉研究的方法，它主要分为三类，即传统方法、机器学习方法即深度学习方法。传统方法所谓“传统方法”是一种基于经典图像处理技术的方法，主要包括边缘检测、角点检测、纹理分析和状态 ...
芯片输出引脚在上电初始化阶段状态不确定怎么考虑处理？
在常用的芯片ARM、DSP、FPGA等芯片或者光耦等其他芯片，在上电过程中出现状态不确定的问题，也就是在上电过程中输出IO口在低电平和高电平之间快速跳变，请问这是什么原因导致的？如果想要确定在上电初始化阶段的IO口输出电平状态，以确保对后续控制电路不会产 ...
红外感应在智能照明中的具体应用
某些国产芯片厂商真是有病
EVC如何永久存储数据?
学习电磁场和微波的人必读的几本好书
如何去除上位机和下位机的通信问题
怎样对F28027的FLASH进行读写操作？
博基兴业提供usbtap powerpc仿真器