第1章引言
人类获得的信息70%以上来自于视觉,换句话说,人类将双眼观察到的世界,进行缜密地分析和思考之后,推动科技的进步,同时推动整个世界的发展。图像带给人们的信息非常直观,图像处理技术随着计算机技术、多媒体技术的飞速发展,取得了长足的进步。图像具有可以反映人类第一感觉下的思维的魅力,这些年来,图像技术快速向多个研究领域渗透。本章首先介绍数字图像处理的基本概念,并对数字图像处理的系统结构和主要研究内容进行概述。
图像是对客观存在物体的一种相似性的生动模仿与描述,是物体的一种不完全、不精确的,但是在某种意义上非常适当的表示。
图1.1所示是对一枝桂花的描述,可以从图中感受到这枝桂花盛开的场景,这种感受来自于图像对场景的生动模仿。而这种模仿的写实性、生动性,以及直观性是其他表达方式所不能及的。从感受桂花美感的角度讲,这幅图像是对当时状况的一个适当表示。但是从图中无法知道当时整棵桂花树的状态,从这个角度来说,这幅图像同时也只是不完全、不精确的描述。
图1.1桂花
根据上面对图像的定义,可以将图像分为物理图像和虚拟图像。
物理图像是指物质或能量的实际分布。例如,光学图像的光强度的空间分布,能够被人的肉眼看见,因此也称为可见图像,是与人类的视觉特性相吻合的通常意义下的图像。不可见的物理图像,例如,温度、压力、高度等的分布图,在医学诊断中使用的以超声波、放射线手段成像得到的医学影像等,这类图像是将不可见的物理量通过可视化的手段转换成方便人眼识别的图像形式。物理图像的好坏,很大程度地依赖于物理信号检测设备的性能。以光学图像为例,光感应特性好的设备,可以得到效果好的图像,同时,光感应器件的适应范围(可以感知的*大、*小光强度的范围)不同,使用目的也不同。
虚拟图像是指采用数学的方法,将由概念形成的物体(不是实物)进行表示的图像。虚拟图像从想象中的物体到想象中的光照,再到想象中的摄像机等,都采用数学建模的方式,利用成像几何原理,在计算机上制作。虚拟图像的应用包括增强现实和虚拟现实两个方向。增强现实是在现实场景图像中,增加虚拟的物体。例如,很多电影中合成的灾难场面、历史场面等,在提升电影感染力方面发挥了很好的作用。虚拟现实则全部是虚拟的景物,例如,虚拟手术、虚拟驾驶训练舱等,在提升参与者的操作能力方面发挥了很好的作用。
数字图像是用数字阵列表示的图像。数字阵列中的每个数字表示数字图像的一个*小单位,称为像素。通过对每个像素点的颜色或者亮度等进行数字化的描述,就可以得到在计算机上进行处理的数字图像。显然,数字图像可以是物理图像,也可以是虚拟图像。
1.1数字图像处理、计算机视觉、计算机图形学
与数字图像相关的研究领域,包括数字图像处理、计算机视觉、计算机图形学等。这三个研究领域所研究的内容有一定的交叉和覆盖,也有其不同的侧重点。
1.数字图像处理
数字图像处理可以通俗地理解为以下两个方面的操作。
1)从图像到图像的处理
从图像到图像的处理是对一幅效果不好的图像进行处理,获得效果好的图像。如图1.2所示,图1.2(a)是实际拍摄的大雾天气的一个场景,我们希望提高画面的清晰度,由此观察到场景中的景物细节。分析图像不清晰的原因,是因为空气中悬浮着许多微小的水颗粒,这些水颗粒在光线的散射下,在景物与镜头(或人眼)之间形成一个半透明层。如果通过适当的图像处理方法,消除或减弱这层遮挡视线的大雾层,就可以得到一幅清晰的图像,如图1.2(b)所示。这就是从图像到图像的处理。
( a )( b )
图1.2从图像到图像的处理示例
2)从图像到决策表达的一种表示
这类处理通常称为数字图像分析,是对一幅图像中的若干目标物进行识别分类后,给出其特性测度。例如,道路监控系统拍摄到一幅卡口图像,图像记录了道路上行驶的若干车辆,通过对图像的处理与分析,可以分检出车辆的数量、车辆的类型、车辆的车牌等信息。
这种从图像到非图像的表示,在许多图像分析中起着非常重要的作用。例如,对人体组织切片图像中的细胞分布进行自动识别与分析,给出病理分析报告就是计算机辅助诊断系统的一个重要应用。这类处理方法在图像检测、图像测量等领域有着非常广泛的应用。
2.计算机视觉
计算机视觉是指通过对采集的图像进行处理,实现对自然景物的理解。
计算机视觉为设备或机器人提供眼睛的功能。因此,计算机视觉的处理包括三维景物信息的识别与处理,对景物中所包含目标的内容及信息进行理解,*终得到一个决策。
如图1.3所示,在一个生产线上,机械手由三个装有吸盘的手爪构成,当需要机械手平稳地抓起工件时,就需要计算机视觉给出三个手爪可以抓到的*平稳的面。
3.计算机图形学
计算机图形学是指用计算机对由概念或者数学描述表示的虚构物体图像进行处理和显示的过程。
计算机图形学采用的方法是,利用成像几何对需要表示的虚构物体进行数学建模,并对光照、想象中的摄像机等进行数学建模,获得需要的场景。
图1.3工件示例
虽然数字图像处理、计算机视觉以及计算机图形学都有其相对独立的研究方法,但是,这三个领域的交叉覆盖面相对比较宽,在实际应用中,很多时候是三者的结合。本书的目的是介绍数字图像处理的基本方法,读者在实际应用中如果需要计算机视觉或者是计算机图形学方面的技术,请参考相关著作或参考文献。
1.2数字图像处理系统的结构
数字图像处理系统结构示意图如图1.4所示。摄像单元记录对象物反射的光强度,通过光电传感器转换成电信号,电信号在A/D转换单元转换成数字信号,存储在图像存储单元中,之后读入计算机,进行相关的处理并将处理结果进行显示。
图1.4数字图像处理系统结构示意图
实际上,*终形成的图像取决于光源、光源与对象物的位置关系,以及对象物的反射光强度等要素。光源包括各种人造光源以及白昼自然光,而光源与对象物的位置关系则大致可分为图1.5所示的背光光照、正面光照、斜射光照等情况。
(a)
(b)
(c)
图1.5光照模式
背光光照下,由于背景光的强度大于前景(对象物),如果拍摄人物图像,人脸的细节部分在图像中呈现的效果不是很好。但是,在某些工业自动化生产线上,为了快速获得目标物的定位,常常将光源设置为背光照明方式。
正面光照下,如果目标物有非常光滑的反射表面,如金属表面,并且其表面是凸面,则会在画面上产生高光区,高光区部分的颜色等细节会退化。但是对于一般的非特殊光滑表面的物体,正面照射可以获得反映目标物细节的图像。
斜射光照下,画面会产生光照不均的效果,如果要进行景物渲染,这是一种非常好的方法,但是当需要从画面提取相应目标物时,光照不均会严重影响正确获取目标物。
显然,在构造数字图像处理系统时,如果允许设置光源,需要综合考虑系统的功能目标来进行合理的设置。
1.3数字图像的基本概念
数字图像是指用数字阵列表示的图像,阵列中的每一个元素称为像素。像素是组成数字图像的基本元素,数字图像由有限个像素组成,构成数字图像的所有像素构成矩阵,矩阵大小表示像素数量。每英寸图像内的像素个数称为图像的分辨率,是由采样精度确定的;矩阵中像素值的分布范围,则是由量化精度确定的。
图像分辨率是面阵传感器采集图像的指标,例如,手机拍摄到一个大小为4032×3024的图像,其像素数为12192768,在购买具有这个分辨率的数码相机时,产品性能介绍上会给出1200万像素分辨率这一参数。
扫描分辨率是线阵传感器采集图像的指标,一台扫描仪输入图像的细微程度指每英寸扫描所得到的点,单位是dpi(dot per inch,每英寸点数)。扫描分辨率数值越大,被扫描的图像转化为数字化图像越逼真,扫描仪质量也越好。
量化是把采样点上表示亮暗信息的连续量离散化后,用数值来表示。一般的量化值为整数。图像的量化等级反映了量化的质量,例如,图像中每个像素都采用8位二进制数表示,则有28=256个量级;若采用16位二进制数表示,则有216=65536个量级;若采用24位二进制数表示,则有224≈1677万个量级。
1.3.1数字图像的数值描述
图像可以看成对三维客观世界的二维投影,因此一幅图像可以定义为一个二维函数f(x, y),其中,x, y是空间坐标,f(x, y)表示图像在该点的亮度或灰度,或简称为像素值。
因为矩阵是二维结构的数据,同时量化值取整数,因此,一幅数字图像可以用一个整数矩阵来表示。矩阵的元素位置(i, j)对应数字图像上一个像素点的位置。矩阵元素的值f(i, j)即对应像素点的像素值。
展开