《计算机视觉之PyTorch数字图像处理》----初品之感受
[复制链接]
《计算机视觉之PyTorch数字图像处理》这本书是由侯伟来编写,该书共分三篇11章,它以我们司空见惯而又习以为常的视觉问题为切入点,从而展开丰富的知识讲解。
之所以视觉的问题习以为常是因为我们每天都利用它来观察世界,似乎它没有啥研究的必要,我们天生就具备这样的能力。即使身上这个光学器件出现问题,那也是去医院找医生来解决问题,当然这只是开个玩笑。
其实,对视觉的研究过程是较为漫长的,那人类是怎样开始这方面的研究呢?
这还要从人类发现光以直线传播开始,继而观察到了小孔成像的现象,并通过描绘影像来记录景观。
随后,是化学知识的提高,尤其是感光材料的出现,才开始以胶片来记录景观。
受感光材料的限制,最初的照片是反应灰度层次的图像,后来是三色感光材料的出现,才促使彩色照片的出现。至此,人类还仍处于真实记录自然景观的阶段。
后来是计算机及电荷耦合器件CCD的出现,才是图像处理技术萌发起来。这是源于光学器件只是一种图像采集器件,要在显示器件上再现原图像,还需计算机对采集信号的离散化处理并存储在存储单元中。再经显示器件将数据呈现到显示屏上的图像。也正是基于它,才有了数字图像的概念。随后,为例保存和传递数字图像,又推出图像文件格式的产生,如bmp、jpg、gif等文件格式。
对于一幅图像来讲,其分辨率越高,其图像越清晰,相应的其所含的像素也越多,并导致其所占用的存储空间越多。为此就出现了无损和有损压缩技术,如bmp文件就采用无损压缩,jpg文件则属于有损压缩。
那是使用无损压缩好还是使用压缩压缩好呢?
其实这要看使用的场合,利用要用单片机来显示图像,就以使用无损压缩的bmp文件为好,因为它无需对数据做进一步的数据处理。而对于ARM来讲,它要显示图像则可以使用有损压缩格式的jpg文件,因为它具有数据解压缩能力。
对于gif格式文件来讲,它也是具有自身特点的,即它可以将多帧图像存放到一起,从而显示具有动画效果的画面。
其实大家通常所说的“图像处理”是指数字图像处理。而图像处理也是分层次的,通常在各类院校中,是将讲授photoshop这类课程称之为图像处理,其实这是很狭隘的。因为它只是面向解决图像显示效果方面的处理,即使用滤镜这一特效工具来制作各种效果,其实质只是一种艺术效果处理。而图像处理的本质则是进行图像数据的分析处理和深度发掘,如将采集的可视范围外的信号通过变换处理,转化可视化的图像的X光透视,又如将各地采集的温度数据经平滑处理而绘制出的区域气象温度图等。可见图像处理的内容是非常丰富的,所涉及的领域也十分广泛。
图1 X光透视
图2 气象温度图
随着人工智能技术的出现,图像处理又迈向了一个新的高度,那就是对图像数据的深度发掘和利用,例如从图像中寻找和识别文字信息、对车牌进行识别及相应的管控、对图片中的物体或器件进行识别和数量统计、对图像中的人进行识别及使用等,甚至可以进行人脸识别、手语姿态识别等。
此外,通过多视角的拍摄可以进行物体的三位实体构建并加以应用。、
总之,图像处理技术,已全面走入人们的生活,并向我们展现出更加深远的探索空间,并引导我们前行。
|