图像数字化
本学习报告是基于中国大学慕课中武汉大学所开的《数字图像处理》课程,在此表示感谢,链接:数字图像处理
要研究图像加密,首先要知道真实世界中的画面在计算机中是如何表示的,这样才有利于对其进行处理。
而真实世界中的画面也被称为模拟图像,计算机中处理的称为数字图像,所以将模拟图像转化为数字图像的过程就被称为图像数字化。
具体来说:
就是将一幅图分割成一个个小区域,这个小区域被称为像素,然后每个像素用整数来表示,最终构成了一幅点阵式的数字图像,像素包含两个属性:
- 位置
- 颜色/灰度
数字化包含采样和量化两个过程
数字图像的表示
数字图像F可以用矩阵来描述,把F左上角的像素中心作为坐标原点,一幅m x n的数字图像用矩阵表示如下:
数字图像根据灰度级数的差异可以分为:黑白图像、灰度图像和彩色图像
- 黑白图像:图像的每个要素只能是黑或白,所以也称为二值图像,二值图像的像素值为0或1,如下所示其表示形式为:
- 灰度图像:每个像素的信息由一个量化的灰度来描述,没有彩色信息,灰度级别有256级[0,255],用一个字节(8位)即可表示,如下所示:
- 彩色图像,彩色图像的表示要比前两个复杂,每个像素由三原色(R、G、B)组成,其中R、G、B是由不同的灰度级来描述的,此时一个像素需要用3个字节(24位)来表示
图像数字化过程
采样
含义:将空间上连续的图像变换成离散点的操作
两个参数:采样间隔和采样孔径
- 采样间隔:采样点之间的距离,采样间隔需要符合信号与系统处理中的抽样定理(在一定的采样间隔下,能够完全把原始信号恢复)
- 采样孔径:采样所用的形状和大小,与采样方式有关,通常有圆形、正方形、长方形和椭圆形四种,从采样方式来说分为有缝、无缝和重叠,如下所示:
量化
将像素灰度转化成离散的整数值的过程
一幅数字图像中不同灰度值的个数称为灰度级,用G表示。一般数字图像灰度级数G为2的整数幂,幂g被称为量化bit数。若一幅数字图像的量化灰度级数G=256级,灰度值范围为0-255,常称为8bit量化。
- 图像的数据量:一幅M X N、灰度级数为G的图像所需的存储空间为M X N X g (bit)
采样、量化参数与数字化图像间的关系
数字化方式可分为均匀采样、量化和非均匀采样、量化
- 均匀:采样、量化为等间隔方式,图像数字化一般采用这种方式
- 非均匀:根据图像细节的丰富程度来改变采样间距,越丰富则间距越小,所以这种方式比较复杂。
关系:
- 采样间隔越大,所得像素数越少。空间分辨率低、质量差;相反质量好,但数据量大,如下为像素数从256 X 256递减至8 X 8
- 量化等级越多,所得的图像等级越丰富,灰度分辨率越高,质量越好。但数据量大;相反。质量变差,会出现假轮廓现象,如下为灰度级数从256减至2所得图像
图像灰度直方图
概念:灰度直方图是反映一幅图像中各灰度级像素出现的频率与灰度级的关系。以灰度级为横坐标,频率为纵坐标,他能反映图像灰度分布状况。
性质:
- 直方图只能反映图像的灰度分布情况,不能反映图像像素的位置,丢失了像素的位置信息
- 一幅图像对应唯一的灰度直方图
应用:
- 用于判断图像量化是否恰当,如下所示:
- 用于确定图像二值化的阈值,这个意思就是在直方图中若有两个山峰和一个山谷,这个山谷就可以用来作为阈值,小于等于它的像素设为0,大于它的像素设为1,形成二值图
图像处理算法
基本功能形式
有三种:
- 单幅图像——>单幅图像
- 多幅图像——>单幅图像
- 单(或多)幅图像——>数字或符号等
具体算法形式
1、局部处理
- 邻域:对于任一像素(i,j),该像素周围的像素构成的集合{(i+p,j+q),p、q取合适的整数},叫做该像素的邻域,比较常用的为4邻域和8邻域,如图所示:
概念:对输入图像IP(i,j)处理时,某一输出像素JP(i,j)值由输入图像像素(i,j)及其邻域N(IP(i,j))中的像素值确定。
2、点处理
概念:在局部处理中,当输出值JP(i,j)仅与IP(i,j)有关
增加对比度和调亮、调暗
3、大局处理
概念:在大局处理中,输出像素JP(i,j)的值取决于输入图像大范围或全部像素的值
4、迭代处理
概念:反复对图像进行某种运算直至满足给定的条件,从而得出输出图像
5、跟踪处理
概念:选择满足适当条件的像素作为起始像素,检查输入图像和已得到的输出结果,求出下一步应该处理的像素,进行规定的处理,然后决定是继续处理下面的像素还是终止处理。
6、窗口处理和模板处理
也可以对画面中特定部分进行处理,这种处理方式有窗口处理和模板处理
- 窗口处理:单独对图像中选定的矩形区域内的像素进行处理的方式叫做窗口处理
- 模板处理:处理任意形状的区域,必须设置一个模板平面,存储模板信息,一般是一幅二值图像
7、串行处理和并行处理
- 串行处理:后一像素输出结果依赖于前面像素处理的结果,并且只能依次处理各像素而不能同时对各像素进行相同处理
- 并行处理:对图像内的各像素同时进行相同形式运算的一种处理形式
图像与图像之间的运算
前提:两图像尺寸大小相等
1、加法
通过平均的方式除噪
例子:在拍摄星空时,可以短时间内连续拍摄多张照片,后平均就可以得到一张非常清晰的图片
因为噪声是随即存在的,而星星是一直存在的
2、减法
去除背景
检测到运动,motion detective
3、乘法
想一想图像二值化,如果二值图像和原图之间做乘法,1的值的灰度值会恢复
4、除法
图像的数据结构
数字图像在计算机中的组织方式
概念:是指图像像素灰度值的存储方式,常用方式是将图像各像素灰度值用一维或二维数组相应的各元素加以存储
组合方式
一个字长存放多个像素的灰度值,这里一开始没有明白是啥意思,经过学霸学姐的提点才想起来,一个字是计算机处理数据一次存取加工的数据长度,一般我们常说32,64位计算机,然后这里的意思是比如一个字是16位,然后一个像素8位,那么一个字可以存放两个像素
特点:节省内存,但计算量增加,处理程序复杂
比特面方式
将所有像素灰度的相同比特位用一个二维数组表示,形成比特面,n个比特位表示的灰度图像按比特面方式存取,就得到n个比特面
这个意思就是,比如图像是n X m的,那个每个比特面也是n X m的,然后第a个面中的(i,j)值(取0和1),就代表原图像中第(i,j)个像素的二进制的第a个值
特点:能充分利用内存空间,便于进行比特面之间的运算,但对灰度图像处理耗时多
分层结构
从原始图像开始依次构成像素数越来越少的系列图像,使数据表示具有分层性,代表为锥形(金字塔)结构
这里介绍锥形结构:
对2k X 2k个像素形成的图像,依次构成分辨率下降的k+1幅图像的层次集合,从最初图像开始,行列像素数都变为1/2,此时变换后的像素值为变换前其所对应的2 X 2像素的灰度的平均值
优点:先对低分辨率图像进行处理,根据需要对高分辨率图像进行处理,可提高效率
树结构
比较常用于二值图像的处理,用在特征提取和信息压缩
就是不断地将行和列进行二等分,构造四叉树,如果当被分裂部分中地全体像素具有相同地特征时,不再分割
多重图像数据存储
这种一般是对于彩色图像或多波段图像而言,因为每个像素包含多个波段的信息,可以采取图上的三种方式:
1、逐波段存储,分波段处理时采用,这个的意思就是先存完这个波段,再存下一个波段
2、逐行存储,逐行扫描记录设备采用的方式,就是类似于数组的存储方式
3、逐像素存储,适用于分类,比如针对n个波段,先存储每个波段的(1,1),然后再存储每个波段的(2,1)
图像变换
通常是一种二维正交变换
目的:简化图像处理,有利于图像特征提取
要求:
- 正交变换必须是可逆的
- 正变换和逆变换的算法不能太复杂
- 正交变换的特点是在变换域中图像能量将集中分布在低频率成分上,边缘、线状信息反映在高频率部分上
傅里叶变换
是一种将图像从空间域转化为频率的一种方式
有几篇讲傅里叶变换很好的博客:
1、傅里叶变换博客一
2、傅里叶变换博客二
可能会在后期使用时进行详细讲解