人脸识别发展史

上传人:lis****211 文档编号:141496838 上传时间:2022-08-24 格式:DOCX 页数:4 大小:13.31KB
返回 下载 相关 举报
人脸识别发展史_第1页
第1页 / 共4页
人脸识别发展史_第2页
第2页 / 共4页
人脸识别发展史_第3页
第3页 / 共4页
点击查看更多>>
资源描述
人脸识别的研究历史比较悠久。高尔顿(Galton)早在1888年和1910年就分别 在Nature杂志发表了两篇关于利用人脸进行身份识别的文章,对人类自身的 人脸识别能力进行了分析。但当时还不可能涉及到人脸的自动识别问题。最早 的AFR1的研究论文见于1965年陈(Chan)和布莱索(Bledsoe)在?anoramic Research Inc .发表的技术报告,至今已有四十年的历史。近年来,人脸识别研 究得到了诸多研究人员的青睐,涌现出了诸多技术方法。尤其是1990年以来, 人脸识别更得到了长足的发展。几乎所有知名的理工科大学和主要IT产业公司 都有研究组在从事相关研究。表1人脸识别发展历史简表人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷,在一定 程度上有泛滥成“灾”之嫌。为了更好地对人脸识别研究的历史和现状进行介绍, 本文将AFR的研究历史按照研究内容、技术方法等方面的特点大体划分为三个 时间阶段,如表1所示。该表格概括了人脸识别研究的发展简史及其每个历史 阶段代表性的研究工作及其技术特点。下面对三个阶段的研究进展情况作简单介 绍。第一阶段(1964年1990年)这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主 要技术方案是基于人脸几何结构特征(Geometric feature based)的方法。这 集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特 征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于 人脸识别问题中。较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有 戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。 金出武雄于1973年在京都大学完成了第一篇AFR方面的博士论文,直到现在, 作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,仍然是人脸识别领域的 活跃人物之一。他所在的研究组也是人脸识别领域的一支重要力量。总体而言, 这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获 得实际应用。第二阶段(1991年1997年)这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可 谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的 FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为 著名的Visionics (现为Identix)的FaceIt系统。美国麻省理工学院(MIT) 媒体实验室的特克(Turk)和潘特(Pentland)提出的“特征脸”方法无疑是这 一时期内最负盛名的人脸识别方法。其后的很多人脸识别技术都或多或少与特 征脸有关系,现在特征脸已经与归一化的协相关量(Normalized Correlation) 方法一道成为人脸识别的性能测试基准算法。这一时期的另一个重要工作是麻 省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥Poggio)于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与 基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:模板匹配的方 法优于基于特征的方 法。这一导向性的结论与特征脸共同作用,基本中止了纯 粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观 (Appearance- based)的线性子空间建模和基于统计模式识别技术的人脸识别 方法的发展,使其逐渐成为主流的人脸识别技术。贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别方法是这 一时期的另一重要成果。该方法首先采用主成分分析(Principal Component Analysis,PCA,亦即特征脸)对图像表观特征进行降维。在此基础上,采用线 性判别分析(Linear Discriminant Analysis, LDA)的方法变换降维后的主成 分以期获得“尽量大的类间散度和尽量小的类内散度”。该方法目前仍然是主流 的人脸识别方法之一,产生了很多不同的变种,比如零空间法、子空间判别模 型、增强判别模型、直接的LDA判别方法以及近期的一些基于核学习的改进策 略。麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上,提出了基于双 子空间进行贝叶斯概率估计的人脸识别方法。该方法通过“作差法”,人脸图像 对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类 间差数据都要首先通过主成分分析(PCA)技术进行降维,计算两个类别的类条 件 概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进 行人脸识别。脸识别中的另一种重要方法 弹性图匹配技术(Elastic Graph Matching,EGM)也是在这一阶段提出的。其基本思想是用一个属性图来描述人 脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多 方向局部特征一一Gabor变换12特征,称为Jet;边的属性则为不同特征点之 间的几何关系。对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位 预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的 属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该方法的 优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。 近来还出现了一些对该方法的扩展。局部特征分析技术是由洛克菲勒大学 (Rockefeller University)的艾提克(Atick)等人提出的。LFA在本质上是一 种基于统计的低维对象描述方法,与只能提取全局特征而且不能保留局部拓扑结 构的PCA相比,LFA在全局PCA描述的基础上提取的特征是局部的,并能够同 时保留全局拓扑信息,从而具有更佳的描述和判别能力。LFA技术已商业化为著 名的FaceIt系统,因此后期没有发表新的学术进展。由美国国防部反毒品技 术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。 FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。 该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织 FERET人脸识别性能评测。该项目分别于1994年,1995年和1996年组织了 3 次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大地促进了这些 算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展 方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方 向。柔性模型(Flexible Models)包括主动形状模型(ASM)和主动表观 模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。ASM/AAM将人脸描 述为2D形状和纹理两个分离的部分,分别用统计的方法进行建模(PCA),然 后再进一步通过PCA将二者融合起来对人脸进行统计建模。柔性模型具有良好 的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取 与建模。柔性模型目前已被广泛用于人脸特征对准(Face Alignment)和识别 中,并出现了很多的改进模型。总体而言,这一阶段的人脸识别技术发展非常 迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据 库上达到了非常好的性能,也因此出现了若干知名的人脸识别商业公司。从技 术方案上看,2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别 方法是这一阶段内的主流技术。第三阶段(1998年现在)FERET96人脸识别算法评估表明:主流的人脸识别技术 对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。 因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的商业系统进 一步发展。为此,美国军方在FERET测试的基础上分别于2000年和2002年 组织了两次商业系统评测。基奥盖蒂斯(Georghiades)等人提出的基于光照锥 (Illumination Cones)模型的多姿态、多光照条件人脸识别方法是这一时期的 重要成果之一,他们证明了一个重要结论:同一人脸在同一视角、不同光照条件 下的所有图像在图像空间中形 成一个凸锥一一即光照锥。为了能够从少量未知 光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉方法进行了扩 展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的7幅 同一视点图像恢复物体的3D形状和表面点的表面反射系数(传统光度立体视觉 能够根据给定的3幅已知光照条件的图像恢复物体表面的法向量方向),从而 可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。识别则通过 计 算输入图像到每个光照锥的距离来完成。以支持向量机为代表的统计学习理论 也在这一时期内被应用到了人脸识别与确认中来。支持向量机是一个两类分类器, 而人脸识别则是一个多类问题。通常有三种策略解决这个问题,即:类内亦称窗口傅里叶变换或短时傅里叶变换(Short Time FourierTransformation,STFT),1946 年 Gabor 提出。差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。 布兰兹(Blanz)和维特(Vetter)等提出的基于3D变形(3D Morphable Model) 模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的 工作。该方法在本质上属于基于合成的分析技术,其主要贡献在于它在3D形状 和纹理统计变形模型(类似于2D时候的AAM)的基础上,同时还采用图形学模 拟的方法对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人 脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开, 更加有利于人脸图像的分析与识别。Blanz的实验表明,该方法在CMU-PIE(多 姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率, 证明了该方法的有效性。2001年的国际计算机视觉大会(ICCV)上,康柏研究 院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特 征和AdaBoost的实时人脸检测系统,在CIF格式上检测准正面 人脸的速度达到了每秒15帧以上。该方法的主要贡献包括:1)用可以快速计算的简单矩形特征作为人脸图像特征;2)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习方法;3)采用了级联(Cascade)技术提高检测速度。目前,基于这种人脸/非人脸学 习的策略已经能够实现准实时的多姿态人脸检测与跟踪。这为后端的人脸识别提 供了良好的基础。沙苏哈(Shashua)等于2001年提出了一种基于商图像13的人 脸图像识别与绘制技术。该技术是一种基于特定对象类图像集合学习的绘制技术, 能够根据训练集合中的少量不同光照的图像,合 成任意输入人脸图像在各种光 照条件下的合成图像。基于此,沙苏哈等还给出了对各种光照条件不变的人脸签 名(Signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有 效性。巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics) 表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:由任 意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这意味着一 个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空 间来近似。这不仅与先前的光照统计建模方法的经验实验结果相吻合,更进一 步从理论上促进了线性子空间对象识别方法的发展。而且,这使得用凸优化方法 来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!