《机器学习算法与实现 —— Python编程与应用实例》-- 第六贴 目标检测和深度强化学习
<p><b>引言:</b></p><p ><b>本贴主要分享10~11章节相关的内容,也是本书的最后两个章节。</b></p>
<p >本书第10章主要讲解了目标检测相关的内容,从图像中检测出特定的目标。并讲解了目标检测的发展历程,当前常见的算法等;</p>
<p >本书第11章讲解了深度强化学习的相关知识,深度强化学习是一种在交互中学习的理论</p>
<p > </p>
<p ><b>第十章 目标检测:</b></p>
<p >目标检测是计算机视觉的一个重要研究方向,在静态图像或者视频中找到某些特定的特征,从而判断图像/视频中出现的类别,一般会输出一个框,框出具体识别到的东西。</p>
<p > </p>
<p ><b>目标检测的任务:</b>分类,定位,检测,分割。</p>
<p > </p>
<p ><b>目标检测的发展历程:</b>2013年之前多以传统方法为主,特征提取加分类器。2013年之后,引入了神经网络等概念,促进了目标检测的飞速发展。</p>
<p > </p>
<p ><b>传统的目标检测分为:</b>区域选取、特征提取、特征分类三个阶段。</p>
<p ><b>传统的方法存在的问题是计算量很大,特征和分类器关联性较弱,而深度神经网络本身具备特征提取能力和分类能力, 可以借助GPU进行计算加速。</b></p>
<p > </p>
<p ><b>而卷积神经网络在处理图像分类问题时,一般分为两大类算法。</b>第一大类是以R-CNN(region with CNN features)为代表的两阶算法,step1把所有物体框出来,step2,每个物体使用卷积神经网络进行分类。另外,一种是以YOLO(you only look once)/SSD(single-shot multibox detector)算法的一阶处理算法,框出物体的同时进行物体识别分类。</p>
<p ><b>一阶算法,计算速度快,但精度会差些。二阶算法,计算速度慢,但精度会高一些。</b></p>
<p > </p>
<p ><b>Fast RCNN,2015年在RCNN的基础上,Fast RCNN实现了端到端的检测和卷积共享。</b></p>
<p > </p>
<p >之后出现的Faster RCNN,首次提出了锚框的思想,即预先给出一些列的大小和宽高不等的先验框,他们均匀的分布在特征图上。利用特征可以预测这些锚框的类被,以及与真实目标包围框的偏移。这样可以提高检测的精度。</p>
<p > </p>
<p ><b>目标检测的评估方法:</b></p>
<p ><b>1.</b>IoU=交集/并集,假如图像中只有1个物体,定位这个物体时,输出的结果应该是一个框,但定位不准确时,这个框就会出现偏差。假如输出是B框,而实际是A框,则可以用IoU来评价定位的准确性。--适用于判断1个物体的图像的定位准确性</p>
<p > </p>
<p ><b>2.mAP(mean Average Precision)</b></p>
<p >按照IoU评价算法来评估每个类别的精度;</p>
<p >所有图像中某一类别精度的算数平均是平均精度。</p>
<p >平均精度均值:对所有N个类别的平均精度再取平均。</p>
<p > </p>
<p ><b>目标检测的原理:</b></p>
<p >由于性能的原因,目前人们基本不在使用传统的方法来进行目标检测,当前的重点是研究基于深度学习的目标检测算法。</p>
<p ><b>YOLO:</b></p>
<p >You only look once, 顾名思义,看一眼就能判断出目标。它的主要思想:讲目标定位和分类用一个神经网络统一起来,实现端到端的目标检测。把目标检测问题转换为直接从图像中提取边界框和类别概率的单回归问题,一次就可以检测出目标的分类和位置。Yolo模型的运算速度非常快,借助GPU可以实现非常高的检测帧率。</p>
<p >2015年 yolov1</p>
<p >2016年 yolov2</p>
<p >2018年 yolov3</p>
<p >2020年yolov5</p>
<p >2022年 yolov6/7</p>
<p >2023 年yolov8</p>
<p >2024年 yolov9</p>
<p >Yolo的各个版本介绍,网上已经很多了,就不在赘述。</p>
<p >本书,讲解了yolov1~5的基本特点,然后着重讲解了yolov4的原理与实现,可以帮助读者从根本上理解人工智能网络的设计和实现。</p>
<p > </p>
<p > </p>
<p ><b>第十一章 深度强化学习</b></p>
<p >人工智能中,有很多应用问题要求再算法时刻做出决策并执行动作。智能体在与环境的交互过程中根据获得的奖励或者惩罚不断的学习知识,调整自己的动作策略,以达到某个预期目标。解决这类问题的机器学习算法被成为强化学习。</p>
<p >深度强化学习是深度学习与强化学习的结合产物。</p>
<p > </p>
<p >强化学习要解决的问题可以抽象为马尔可夫决策过程(MDP), 特点是:系统下一时刻的状态由当前时刻的状态决定,而与更早的时刻的状态无关。MDP智能体可以执行动作,以改变自己和环境的状态,并且得到惩罚和奖励。</p>
<p ><b>Q学习算法:</b>如果知道所有状态转移的概率以及结果,理论上可使用动态规划算法求解出最优策略。然而实际当中,无法直接得到所有的状态间的转移概率,无法使用动态规划来求解。从而产生了随机算法来求解。典型的便是Q学习算法。这是一种无模型的算法,他提供智能系统在马尔可夫环境下通过动作序列选择最优动作的学习能力。</p>
<p > </p>
<p ><b>深度强化学习:</b>传统的Q学习中,Q值存储在Q表中,表中各行是所有可能的状态,各列是所有可能的动作。如果量少,问题不大。当面对一些存在很多可能的情况下,Q表的建立难度非常大,导致Q算法很难应用到解决现实问题当中。</p>
<p >为解决这个难题,可用值近似函数来表示Q表,加入权重,借助神经网络来实现。具体书中讲的很清楚,由于公式比较多,这里就不赘述了。</p>
<p > </p>
<p > </p>
页:
[1]