《深度学习》中图像识别相关知识的学习分享
<div class='showpostmsg'><p>在《深度学习》的第6章介绍了图像卷积相关的知识,对于专业的算法部分印象比较深的是互相关运算和卷积运算。其中互相关运算是一种衡量两个函数相似度的度量,它通过滑动一个函数(称为核或滤波器)与另一个函数(如图像)进行比较,计算匹配程度。卷积与相关运算类似,但在核的应用上有所不同。在卷积运算中,核首先被翻转(180度旋转),然后再应用到图像上。图像识别最常见的是用来做边缘检测,专业内容在这里不进行叙述,我查阅了其他的一些资料,了解了边缘检测在实际中的应用场景,目前最常见也是最热门的便是机器视觉和自动驾驶:边缘检测可以帮助系统识别和追踪物体的边界,对于避障、路径规划和环境理解等任务至关重要。例如,香港城市大学陈沐谷助理教授团队与日本理化学研究所Takuo Tanaka教授团队合作开发的基于双目超构透镜的边缘增强深度感知系统,用于空间计算,有助于精确的3D场景建模,促进机器视觉、自动驾驶和机器人技术的发展。另外在医疗成像领域,边缘检测用于从MRI、X射线、CT扫描等图像中提取器官、血管和异常的边界,提高诊断的准确性。有研究提出了基于人工神经网络的MRI医学图像边缘检测算法,使用Canny算子作为训练输出,通过训练人工神经网络获得优化参数,对MRI医学图像的边缘检测结果进行主观和计算分析,结果表明该方法比传统的单一Sobel、Canny等算子获得的边缘信息更完整,处理时间也快近3倍。还有,边缘检测也可以用于目标运动检测,香港理工大学郝建华教授团队提出了一种由铁电共聚物调制的WSe<sub>2</sub>同质结简单器件结构的OMD视觉传感器,能够在零功耗下产生具有离散多态的渐进和双向光电流,实现了物体运动检测(OMD),这对于健康监测、虚拟现实和智能交通系统等应用至关重要。较为基础的应用是对象识别,最常见的是边缘检测帮助计算机识别和提取图像中的重要边界和轮廓,为后续的图像理解任务提供关键线索。除此之外边缘检测还可以在文档分析时进行字符识别、表格处理以及文本提取。以上种种案例仅仅是边缘检测所扩展开的应用,而边缘检测只是深度学习中的一个方向,由此可知机器学习可以为人类生活带来多大的变革,这也让我感觉读这本书是很有价值的,对于未来的理解以及视野的拓宽有所帮助,后续我将继续跟随书上的指导试着进行算法的实际学习。</p></div><script> var loginstr = '<div class="locked">查看本帖全部内容,请<a href="javascript:;" style="color:#e60000" class="loginf">登录</a>或者<a href="https://bbs.eeworld.com.cn/member.php?mod=register_eeworld.php&action=wechat" style="color:#e60000" target="_blank">注册</a></div>';
if(parseInt(discuz_uid)==0){
(function($){
var postHeight = getTextHeight(400);
$(".showpostmsg").html($(".showpostmsg").html());
$(".showpostmsg").after(loginstr);
$(".showpostmsg").css({height:postHeight,overflow:"hidden"});
})(jQuery);
} </script><script type="text/javascript">(function(d,c){var a=d.createElement("script"),m=d.getElementsByTagName("script"),eewurl="//counter.eeworld.com.cn/pv/count/";a.src=eewurl+c;m.parentNode.insertBefore(a,m)})(document,523)</script>
页:
[1]