资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Zhang Weiwei,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Zhang Weiwei,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Zhang Weiwei,*,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,工学人脸识别,第一章,人脸识别的定义、特征提取方法;,第二章,人脸识别的具体算法PCA、BP神经网络;,第三章,人脸识别用途、优势、缺陷及面临的困难;,9/28/2024,第一章,第一节,人脸识别的定义;,第二节,原始特征的提取方法;,第三节,本章总结;,吴娟,9/28/2024,人脸识别技术是基于生物特征的识别方式,利用人类自身所拥有的、并且能够唯一标示其身份的生理特征或行为特征进展身份验证技术。也就是给定一场景的静止或视频图象,利用训算机里存储的人脸数据库,确定场景中的一个或多个人。,人脸识别的应用:相机的人脸自动对焦和笑脸快门,门禁系统,公安刑侦破案,摄像监视,网络应用,身份辨识,信息平安;,9/28/2024,人脸识别过程需要完成以下几方面的工作:,人脸检测:从各种场景中检测出人脸的存在,并从场景中准确别离出人脸区域;,预处理:校正人脸尺度、光照以及旋转等方面的变化,得到标准化的人脸图像;,特征提取:从人脸图像中提取出人脸具有代表性的特征信息,并用一定的方式加以描述;,人脸识别:根据所提取的特征信息,将待识别的人脸与数据库中的人脸进展比较,找到数据库中最相似的人脸,由于各方面对人脸识别系统的迫切需求,人脸特征提取与识别是人脸识别系统的重点。,9/28/2024,人脸特征提取是对人脸进展特征建模(精细建模)的过程,目的是提取出原高维人脸模式的低维特征,以用于后续的分类任务。主要是分为基于整体的方法和基于局部的方法。,Gabor特征最接近人类视觉特性;,LBP特征广泛应用于纹理分析领域;,HOG特征在跟踪监测领域用于描述物体的关键点;,9/28/2024,Gabor特征,冲击响应函数,其中:,该函数是二维高斯函数和二维调制谐波函数的乘积。高斯函数以空间抽样点为中心,,为方差;调制谐波函数以1/为空间频率,为其方向;与其他短时傅里叶变换相比,此函数能到达最小时频积,对于分析信号细节非常有帮助;在众多公开数据库和评测中取得了较好的效果,是目前在人脸识别领域公认性能最好的特征提取方法;,9/28/2024,LBP特征,LBP算子是一种非常强大的特征描述算子,高度的鉴别性、低复杂度以及对图像单调灰度变化的不变性,使得它在包括纹理分析在内的众多领域得到广泛的应用;,LBP首先计算图像中每个像素与其局部邻域点在灰度上的二值关系;,然后,对二值关系按一定规那么加权形成局部二值模式;,最后,采用多区域直方图序列作为图像的二值模式,9/28/2024,HOG特征,在计算机视觉和图像处理领域用于目标检测的特征描述算子,记录图像局部区域各梯度方向出现的频率;,HOG算子对人脸局部图像单元格进展梯度直方图统计的特性使之对于一些几何和光照变化具有不变性;,9/28/2024,HOG算子处理步骤,(1)将标准化大小的检测窗口作为输入,通过梯度算子计算水平和垂直方向上的梯度。,(2)将输入图像块分成假设干块,block和block之间可以有重叠,每块再分成假设干格子,我们把这些格子叫细胞单元(cel1)。利用三线性插值的方法。对cell统计其中所有像素的一维梯度直方图。,(3)在块内进展比照度归一化,以消除光照的影响。,(4)将检测窗口中所有重叠的块的HOG特征串联起来,并将它们结合成最终的特征向量,这就成为最终这个区域的描述子,以便后面分类使用。,9/28/2024,随着监控和平安的需要,人脸识别技术得到了更多的重视,全局特征由不同局部描述算子对整幅人脸图像进展运算产生,局部特征按空间位置的不同划分由直接抽取全局特征子集构成;,以上方法根据实际应用中对人脸识别系统速度和精度的不同要求具体选择;多种算法融合效果更佳,假设算法计算结果之间差异较大,应该是由于训练与测试样本不充分造成。,9/28/2024,第二章 人脸识别具体算法,第一节,PCA算法介绍、计算步骤以及应用;,第二节,BP神经网络识别算法、计算步骤、应用及优势;,9/28/2024,PCA算法简介;,PCA算法的主要步骤;,特征脸计算;,PCA算法在人脸识别中的应用;,鲁文武,9/28/2024,PCA算法,PCA算法介绍,令x为表示环境的m维随机向量。假设x均值为零,即:Ex=0.,令w表示为m维单位向量,x在其上投影。这个投影被定义为向量x和w的内积,表示为:,9/28/2024,而主成分分析的目的就是寻找一个权值向量w使得表达式Ey2的值最大化:,根据线性代数的理论,可以知道满足式子值最大化的训应该满足下式:,即使得上述式子最大化的w是矩阵Cx的最大特征值所对应的特征向量。,9/28/2024,主成分的求解步骤,1构建关联矩阵:Cx=Ex*xT,CxPn*n.,在实际应用中,由于原始数据的数学期望不容易求解,我们可以利用下式来近似构造关联矩阵:,其中x1,x2,,xN,是各个原始灰度图像所有象素点对应的向量,N是原始图像的个数,9/28/2024,2先计算出Cx的各个特征值,3把特征值按大小排序,4计算出前m个特征值对应正交的特征向量构成w.,5将原始数据在特征向量w上进展投影,即可获得原始图像的主特征数据。,9/28/2024,计算特征脸,设人脸图像Ix,y为二维N*N灰度图像,用N维向量R表示。人脸图像训练集为Ri|i=1,,M,其中M为训练集中图像总数,这M幅图像的平均向量为:,每个人脸Ri与平均人脸的差值向量是:,9/28/2024,训练图像的协方差矩阵可表示为:,C=AAT.,其中,A=1,M.,特征脸有协方差矩阵C的正交特征向量组成。对于N*N人脸图像,协方差矩阵C的大小为N2*N2,对它求解特征值和特征向量是很困难的。一种取而代之的方法是令L=ATA.,即协方差矩阵的转置阵,那么可以知道此矩阵是M*MM是训练人脸的数量的一个较小的矩阵。首先计算M*M矩阵L的特征向量vil=l,,M,那么矩阵C的特征向量uil=1,,M由差值图像ii=1,,M与vil=l,,M线性组合得到:U=u1,,uM=1,,MTv1.,vM.实际上,mmM个特征值足够用于人脸识别。,因此,仅取L的前m个最大特征值的特征向量计算特征脸。,9/28/2024,PCA算法在人脸识别中的应用,基于特征脸的人脸识别过程由训练阶段和识别阶段两个阶段组成。在训练阶段,每个人脸Ri映射到由特征脸构成的子空间上,得到m维向量,9/28/2024,在识别阶段,首先把待识别的图像R映射到特征脸空间。得到向量:,为了区分人脸和非人脸,还需计算原始图像R与其由特征空间重建的图像Rf之间的距离:,9/28/2024,采用最小距离法对人脸进展分类,分类规那么如下:,1假设c,那么输入图像不是人脸图像;,2假设,那么输入图像包含未知人脸;,3假设,那么输入图像为库中第k个人的人脸。,9/28/2024,神经网络简介;,BP神经网络算法根本思想;,BP神经网络根本算法及步骤;,BP网络用于人脸识别的优势与现状;,张伟伟,9/28/2024,BP神经网络识别算法,人工神经网络是一门穿插学科,其通过模拟人类大脑神经网络的构造和工作机理,构建一种类似人脑的计算模型,其中误差反向传播BP神经网络是一种最成熟和应用最广泛的算法。,9/28/2024,人脸识别的复杂性在于面部特征会随着外部及内部条件的变化产生连续的变化。尽管有这些变化,我们人类仍能够在不同环境下识别面部特征,但是机器却不具备人脑所具备的这种能力,这就启发我们模仿人脑的构造模型和思维模式,利用人工神经网络进展人脸识别。,9/28/2024,BP算法的根本思想,学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。假设输出层的实际输出与期望的输出不符,那么转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。,这种信号正向传播与误差反向传播的各层权值调整的过程,是周而复始地进展的。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进展到网络输出的误差减小到可以承受的程度,或进展到预先设定的学习次数为止。,9/28/2024,BP根本算法,设传递函数 ;,误差函数,其中 与 分别为网络的期望输出和实际输出;,9/28/2024,算法根本步骤,1设置变量和参量。包括输入向量,教师信号,各层间的权值向量,学习迭代次数等;,2初始化。赋给各权值向量一个较小的随机值,重复下面的过程直至收敛;,3从前向后计算各单元的输出 ,,其中 ;,9/28/2024,4对输出层计算误差,,5从后向前计算各隐层误差,,6计算各单元权值修正量,,7修正权值,,其中, 为输出层误差, 代表本层输出, 是前层到本层的权值,下标i为前层第i个节点,下标k为后层的第k个节点,j为本层的第j个节点。,9/28/2024,BP网络用于人脸识别,1将人脸图像各点象素值按一定顺序变为一个高维向量,对人脸预处理方法进展处理,将得到的特征向量作为输入模式送入BP网络,因此网络输入层的神经元数目为所提取人脸图像的特征个数。,2输出层的神经元数目由模式类别数决定。换言之,有多少个不同的人需要我们识别,输出层的神经元个数就是多少。在训练过程中,每个输入模式的希望输出为0,0,1,0,0输出为1的神经元即对应着该输入模式所属的模式类别。,9/28/2024,3中间竞争层的神经元数目没有限制,建立好网络,按照学习规那么对其进展训练即可。网络收敛速度的快慢、训练后网络性能的好坏与很多因素有关,比方误差容限。如果误差容限值设置较大,那么网络收敛速度很快,但是性能可能会下降;如果设置较小,性能可能很好,但是训练时间会增长。因此,误差容限值设置要适中,一般0.0011;学习率的大小对于收敛速度也有影响。,9/28/2024,人脸识别神经网络构造,9/28/2024,优势,神经网络方法进展人脸检测的优点主要在于可以简便地构造出神经网络系统作为分类器,使用人脸和非脸样本对该系统进展训练,让系统自动学习两类样本复杂的类条件密度,这样就防止了人为假设类条件密度函数所带来的问题。,研究说明:通过神经网络设计了组合分类器,在识别效果的准确率、容错性、鲁棒性等方面都有很大的优势。神经网络方法在人脸识别上比其它类别的方法有独到的优势,防止了复杂的特征提取工作,其可以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规那么的隐性表达。,9/28/2024,神经网络用于人脸识别现状,人工神经网络在人脸识别中的应用目前还是个热门的课题。它的自主训练和学习能力为人脸识别提出一个简便可行的方法,同时神经网络算法的运算量和训练时间以及目前计算机系统构造的局限性等又提出了一个改进的挑战。,要充分利用神经网络在人脸识别中的优势,尽量防止其缺陷,更好地为人脸识别系统效劳。,9/28/2024,第三章 总结,尹静,人脸识别目前面临的困难,第四节,第一节,人脸识别的用途,第二节,人脸识别的优势与缺陷,第三节,开展趋势,9/28/2024,人脸识别的用途,9/28/2024,与其它生物特征识别技术相比,人脸识别在可用性方面具有独到的技术优势,这主要表达在:, 可以隐蔽操作,尤其适用于平安监控,这一点特别适用于解决重要的平安问题、罪犯监控与网上抓逃等应用,这是指纹、虹膜、视网膜等其他人体生物特征识别技术不能比较的;, 非接触式采集,没有侵犯性,容易被承受,因此,不会对用户造成生理上的伤害,另外也比较符合一般用户的习惯,容易被大多数的用户承受;,人脸识别的优势与缺陷,优势,9/28/2024, 具有方便、快捷、强大的事后追踪能力,基于面像的身份认证系统可以在事件发生的同时记录并保存当事人的面像,从而可以确保系统具有良好的事后追踪能力。例如,用于考勤系统时候,管理人员就可以方便的对代打卡进展事后监控和追踪;这是指纹、虹膜等生物特征所不具有的性质(一般人不具备指纹、虹膜鉴别能力)。, 图像采集设备本钱低,目前,中低档的USB CCDCMOS摄像头价格已经非常低廉,根本成为标准的外设,极大的扩展了其实用空间;另外,数码相机、数码摄像机和照片扫描仪等摄像设备在普通家庭的日益普及进一步增加了其可用性, 更符合人类的识别习惯,可交互性强,例如,对于指纹、虹膜等识别系统,一般用户对识别往往是无能为力的,而对人脸来说,授权用户的交互和配合可以大大提高系统的可靠性和可用性;,9/28/2024, 人脸特征稳定性较差,尽管面部通常不会发生根本性的变化(成心整容除外),但人脸是有极强可塑性,的三维柔性皮肤外表,会随着表情、年龄等的变化而发生改变,皮肤的特性也,会随着年龄、化装乃至整容、意外伤害等发生很大变化;, 可靠性、平安性较低,尽管不同个体的人脸各不一样,但人类的面孔总体是相似的,而且地球上人口,如此众多,以致很多人的面孔之间的差异是非常微妙的,技术上实现平安可靠,的认证是有相当难度的:, 图像采集受各种外界条件影响很大,因此识别性能偏低,图像的摄制过程决定了入脸图像识别系统必须面对不同的光照条件、视角、距,离变化等非常困难的视觉问题,这些成像因素都会极大影响人脸图像的表观,,从而使得识别性能不够稳定:,缺陷,9/28/2024,人脸识别目前面临的困难,当前人们的研究主要集中在寻找识别率更高、稳定性更好、计算代价更低、实用性更强的人脸识别系统。但是由于各种客观条件的限制,目前尚没有二种方法可以兼有上述所有性能。,影响人脸识别系统性能的客观因素有很多,也很复杂,主要是以下这些:,光照条件:光照变化对二维人脸识别影响比较明显,因为二维人脸识别更多的依赖于二维灰度图像,而二维灰度图像极易受到光照变化的影响。光照条件的影响主要表达在实际条件下光照强度的未知变化以及光照不均匀对二维成像带来的影响,这可以直接表达在二维图像的灰度值上。人们解决光照影响的方法主要有获取实时光照参数、对二维图像做光照补偿和灰度预处理等。获取实时光照参数以及进展光照补偿这两种方法都比较复杂,因此大量应用并不现实。,9/28/2024,人脸姿态和表情:因为实时人脸识别需要在非接触非告知的条件下获取被测人脸图像,因此,被测人脸姿态和表情都是无法控制的因素,这给人脸识别带来了极大的挑战。人脸姿态反映的是头部姿势,包括头的俯仰、摇摆以及旋转等动作引起的变化,由于二维图像无法得到人脸器官所有的深度信息,因此,头部姿态势必引起许多关键信息被遮挡。人脸表情那么比姿态更难以控制,人的面部表情千变万化,并且不同器官表情的变化相对独立,很难用准确的模型去描述其变化规律。通常解决这类问题的方法有姿态补偿、姿态和表情估计等。,数据库人脸图像的缺少:这是限制人脸识别技术的一个客观因素,因为要想识别出实时人脸,那么必须在数据库中有此人的人脸信息,而现实中我们又不可能把每个人脸信息都存入数据库,就算是目前科研界最通用的人脸库如ORL、Yale等也只有数十到数百个人脸的信息,要想到达实用也是远远不够的。,9/28/2024,开展趋势,找到更好的算法或是减少算法本身的缺乏来提高识别的效率和精度。,可以通过提高整体多媒体设备的性能来提高获取高质量的源文件的能力,使识别过程在运行初期就能奠定很好的根底;,最后就是要深层次地摸索能够更好识别人脸的技术模型;提高系统的鲁棒性强健性、提高算法的泛化能力、增强抗干扰能力等;,9/28/2024,图像获取,人脸检测,图像预处理,匹配,结果,特征提取,人 脸 识 别 进 程,归一化,小波分解,滤除外界干扰,改进措施,9/28/2024,谢谢!,9/28/2024,Thank You !,不尽之处,恳请指正!,
展开阅读全文