图像变换2离散余弦变换

上传人:ren****ao 文档编号:245228626 上传时间:2024-10-08 格式:PPT 页数:47 大小:547KB
返回 下载 相关 举报
图像变换2离散余弦变换_第1页
第1页 / 共47页
图像变换2离散余弦变换_第2页
第2页 / 共47页
图像变换2离散余弦变换_第3页
第3页 / 共47页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,3.2 离散余弦变换,图像处理中常用的正交变换除了傅里叶变换外,还有其他一些有用的正交变换。其中离散余弦就是一种。离散余弦变换表示为DCT。,1,3.2.1 离散余弦变换的定义,一维离散余弦变换的定义由下式表示,(374),(375),2,式中 是第 个余弦变换系数,是广义频率变量,;是时域N点序列,,一维,离散余弦反变换,由下式表示,(376),显然,式(374)式(375)和式(376)构成了一维离散余弦变换对。,3,二维离散余弦变换,的定义由下式表示,(377),4,式(377)是正变换公式。其中 是空间域二维向量之元素。,是变换系数阵列之元素。式中表示的阵列为N N,5,二维离散余弦反变换,由下式表示,(378),6,7,8,9,余弦变换与傅里叶变换有什么关系?,10,式中的符号意义同正变换式一样。式(377)和式(378)是离散余弦变换的解析式定义。更为简洁的定义方法是采用矩阵式定义。如果令N4,那么由一维解析式定义可得如下展开式,(379),11,写成矩阵式,(380),若定义 为变换矩阵,为变换系数矩阵,为时域数据矩阵,则一维离散余弦变换的矩阵定义式可写成如下形式,(381),12,同理,可得到反变换展开式,(382),写成矩阵式,13,即,(384),当然,二维离散余弦变换也可以写成矩阵式,(385),式中 是空间数据阵列,是变换系数阵列,是变换矩阵,是 的转置。,14,3.2.2 离散余弦变换的正交性,由一维DCT的定义可知,它的基向量是,(386),15,在高等数学中,切比雪夫多项式的定义为,(387),16,式中 是 和 的多项式。它的第N个多项式为,如果,那么,将此式代入,17,显然,这与一维DCT的基向量是一致的。因为切比雪夫多项式是正交的,所以DCT也是正交的。另外,离散余弦变换的正交性也可以通过实例看出。如前所示,当N时,,(388),则,18,显然,这是满足正交条件的。从上述讨论可见,离散余弦变换是一类正交变换。,19,3.2.3 离散余弦变换的计算,与傅里叶变换一样,离散余弦变换自然可以由定义式出发进行计算。但这样的计算量太大,在实际应用中很不方便。所以也要寻求一种快速算法。,首先,从定义出发,作如下推导,20,(389),21,式中 是取其实部的意思。如果把时域数据向量作下列延拓,即:,(390),则 的离散余弦变换可写成下式,22,(391),23,由式(391)可见,是2N点的离散傅里叶变换。所以,在作离散余弦变换时,可以把序列长度延拓为2N,然后作离散傅里叶变换,产生的结果取其实部便可得到余弦变换。,24,同样道理,在作反变换时,首先在变换空间,把 作如下下延拓,(392),那么,反变换也可用式(393)表示,25,(393),26,由式(393)可见,离散余弦反变换可以从,的2N点反傅里叶变换实现。,27,3.3 离散K-L变换,又称为霍特林(Hotelling)变换,KL(Karhunen-Loeve)或DKT,以图像的统计性质为基础的,变换核矩阵,由图像阵列的协方差矩阵的,特征值和特征向量,所决定又称为特征向量变换,28,当变量之间存在一定的相关关系时,可以通过原始变量的线性组合,构成数目较少的不相关的新变量代替原始变量,而每个新变量都含有尽量多的原始变量的信息。这种处理问题的方法,叫做主成分分析,新变量叫做原始变量的主成分。,目的是寻找任意统计分布的数据集合之主要分量的子集。相应的基向量组满足正交性且由它定义的子空间最优地考虑了数据的相关性。将原始数据集合变换到主分量空间使单一数据样本的互相关性(cross-correlation)降低到最低点。,29,图像协方差矩阵,假设对某幅NN的图像f(x,y),在某个传输通道上传输了M次,因会受到各种因素的随机干扰,接收到是一个图像集合,将M次传送的图像集合写成M个N,2,维向量X,1,X,2,X,i,X,M,生成向量的方法可以采用行堆叠或列堆叠的方法,对第i次获得的图像f,i,(x,y),可用N,2,维向量X,i,表示:,30,问题是:如何选取一个合适的正交变换,A,,使得变换后的图像Y=AX,1)是具有MN,2,个分量的向量,2)由,Y,经反变换而恢复的 (向量,X,的估值)和原始图像具有最小的均方误差,即,称满足这两个条件的正交变换A为K-L变换。如果能找到这样一个变换,那么就意味着经过一个变换,不仅删除了N,2,-M个分量,并且由变换结果Y重新恢复的图像,是有效的过滤了随机干扰的原图像的最佳逼近。,31,X向量的协方差矩阵C,X,定义为,设e,i,和,i,是协方差矩阵C,X,对应的特征向量和特征值,将特征值按减序排列,即,则K-L变换核矩阵A的行用C,X,的特征值,i,所对应的特征向量e,i,构成:,32,直接求矩阵,C,X,的特征值和特征向量很困难。这是因为C,X,是N,2,N,2,维矩阵,尽管图像的大小N可能不是很大的,但N,2,却是很大的数据。这样求其特征向量和特征值速度较慢。但如果样本图象个数M不太多,可以先计算出MM维方阵LA,T,A的特征值,k,和特征向量 v,k,左乘矩阵A,则有,是矩阵C,X,的 特征向量,可以选择P(PM)个较大特征值对应的特征向量(主成分),构造新的P维主成分空间Q,因为C,X,是实对称矩阵,总能找到一个标准正交的特征向量集合,使,A,-1,=A,T,,那么可得K-L反变换为,33,K-L变换的性质和特点,(1)Y的平均值向量m,y,0,即为零向量0,(2)Y向量的协方差,34,(3)对角性,对角线上的元素是原始图像向量的协方差矩阵C,X,对应的特征值,i,,它也是Y向量的方差。而非对角线上的元素值为0,说明Y向量中各元素之间相关性小,而C,X,的非对角线上元素不为0,说明原始图像元素之间相关性强,这就是采用K-L变换进行编码,数据压缩比大的原因,显然K-L坐标系将矩阵C,X,对角化了,换句话说,通过K-L变换,消除了原有向量X的各分量之间的相关性,从而可能去掉那些带有较少信息的坐标轴,以达到降低特征空间维数的目的。,35,X1,X2,e 1,e 2,在原来坐标系中,要用两个分量X1,X2来表示各个样本,而在K-L坐标系中,只要用e1就可以,去掉e2并不会带来很大的误差,假设矩阵C,X,只有少数几个数值大的特征值,而其余的特征值数值很小,K-L坐标系就可以有效的进行信息压缩,36,K-L变换的最大优点是去相关性好,可用于数据压缩和图像旋转,主要困难是由于协方差矩阵C,X,求特征值和特征向量解方程的计算量大,同时K-L变换是非分离的,二维不可分,一般情况下,K-L变换没有快速算法,37,实例,以K-L变换进行自动的人脸识别为例说明,我们把一幅数字图像看成一个矩阵或一个数组,用B(i,j)或bij 表示,,一,幅NN大小的人脸图像按列相连构成一个N,2,维矢量,x=(b11 b21bN1 b12b22bN2 b1N b2NbNN),它可视为N,2,维空间中的一个点,假设N=128。由于人脸,结构的相似性,,当把很多这样的人脸图像归一化之后,这些图像在这一超高维空间中,不是随机或散乱分布,的,而是存在,某种规律,,因此可以通过K-L变换用一个,低维子空间描述人脸图像,,同时又能保存所需要的识别信息,38,图像的归一化,对于一个全自动的人脸识别系统,其首要的工作是人脸,图像的分割以及主要器官的定位,。另外,由于K-L变换本质上依赖于,图像灰度在空间分布上的相关性,,因此还需要对人脸图像进行一系列的预处理,以达到位置校准和灰度归一化的目的,假设已根据分割及定位算法,得到了人脸正面图像,左右两眼中心的位置,并分别记为Er和El,,则可通过下述步骤达到图像校准的目的,39,1、进行,图像旋转,,以使Er和El的,连线ErEl保持水平,。这保证了人脸,方向的一致性,,体现了人脸在图像平面内的,旋转不变性,2、根据图所示的比例关系,进行图像裁剪。图中,O点为ErEl的中点,且d=ErEl。经过裁剪,在2d2d的图像内,可保证O点固定于(0.5d,d)处。这保证了人脸,位置的一致性,,体现了人脸在图像平面内的,平移不变性,3、进行图像缩小和放大变换,得到统一大小的标准图像,规定标准图像的大小为128128象素点,则缩放倍数为=2d/128。这使得d=ErEl为定长(64个象素点),即保证了人脸,大小的一致性,体现了人脸在图像平面内的尺度不变性,40,经过校准,不仅在一定程度上获得了人脸表示的几何不变性,而且还基本上消除了头发和背景的干扰。,完成了旋转、平移和尺度不变性后,需要对校准的图像做灰度拉伸,以改善图像的对比度,然后采用直方图修正技术使图像具有统一的均值和方差,一部分消除光照强度的影响,假设人脸数据库中,由20人,每人10幅人脸图像,41,K-L变换,以归一化后的标准图像做为训练样本集,以该样本集的总体散布矩阵为协方差矩阵,即,xi为第i个训练样本的图像向量,为训练样本集的平均图像,M为训练样本的总数,为了N,2,N,2,维矩阵的特征值和正交归一的特征向量,直接计算是困难的,因此引入一个定理,奇异值分解SVD,42,设A是一秩为r的nr维矩阵,则存在两个正交矩阵:,以及对角阵,满足,其中i为矩阵AA,T,和A,T,A的非0特征值,u和v分别为AA,T,和A,T,A对应于i的特征向量,上述分解称为矩阵A地奇异值分解,为A的奇异值,推论,43,由于可表示为:,故,构造矩阵:,容易求其特征值i及相应的正交归一特征向量vi(i=0,1,2M-1)。由推论可知,的正交归一化特征向量ui为,这就是图像的特征向量,它是通过计算较低维矩阵R的特征值与特征向量而间接求出的,44,将特征值从大到小排序:0 1 r-1,其对应的特征向量为u,i,。这样,每一幅人脸图像都可以投影到由u,0,u,1,u,M-1,张成的子空间中。因此每一幅人脸图像对应于子空间中的一个点,同样,子空间中的任一点也对应于一幅图像,45,特征脸,46,对于任一待识别样本f,可通过向“特征脸”子空间投影求出其系数向量:,y=U,t,f,其重建图像,f=Uy,考虑重建图像的信噪比,R,SN,=10lg(|f|,2,/|f-f|,2,),若其小于阈值,则 可判断f不是人脸图像。,47,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!