模式识别培训教程

上传人:花里****1 文档编号:243733497 上传时间:2024-09-29 格式:PPT 页数:93 大小:2.57MB
返回 下载 相关 举报
模式识别培训教程_第1页
第1页 / 共93页
模式识别培训教程_第2页
第2页 / 共93页
模式识别培训教程_第3页
第3页 / 共93页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,第四章 模式识别,第一节 知觉理论概述,一、知觉概述,关于知觉的传统观点,知觉是在刺激作用下即刻产生的,而且似乎是自动的,常人意识不到知觉的过程,某些空间特性的知觉受先天制约,不依赖于过去的经验或者学习,某些几何错觉甚至不依赖于人掌握的有关概念,传统的观点认为,知觉是一种消极被动的接受刺激的过程;,现代观点则认为,知觉是主动和富有选择性的构造过程。,黄希庭:“知觉是直接作用于感觉器官的事物的整体在脑中的反映,是人对感觉信息的组织和解释的过程。”,梁宁建:“知觉是人脑对客观事物的各种属性、各个部分及其相互关系的综合的整体的反映,它通过感觉器官,把从环境中得到的各种信息,如光、声音、味道等转化为对物体、事件等的经验的过程。”,知觉,现代认知心理学认为,知觉是确定人们所感受的刺激物的意义的过程。或者说,知觉是解释刺激信息,从而产生模式和意义的过程。,知识经验在知觉中的作用,因素恢复实验,(,Warren 1970,),已有知识对句子知觉的作用,(,Miller&Isard,,,1963),视知觉研究的证据,(,Biederman,1972,),二、知觉理论,(一)直接知觉理论(,Direct perception,),以,Gibson,为代表,认为环境可提供的信息足以产生知觉,知觉并不需要内部过程和表征的参与。,刺激眼睛的光线模式是一个结构性的光学分布;,这种分布能提供空间中目标分布特征的明确或恒定信息;,知觉在很少或没有信息加工参与的,情况下,可以通过共振直接从光学,分布中提取各种丰富信息。,线条透视,结构密度,遮盖关系,(二)建构性知觉理论(,Constructive perception,),知觉是一个积极的和建构的过程,知觉并不是由刺激输入直接引起的,而是所呈现刺激与内部假设、期望、知识以及动机和情绪因素交互作用的产物,知觉有时可受到不正确的假设和期望影响,因而也会发生错误,邻近物体大小对大小知觉的影响,对两种知觉观的评论,建构知觉观,强调人主观能动性,人,的,知觉常常是错误的吗?,大多数实验和演示都用了人工或非自然刺激,直接知觉观,强调环境信息,真的不需要假设内部表征来理解知觉吗?,“看见”与“看成”是两个不同的过程,视觉模式识别,眼睛构造与视神经通路,主观组织,(三)格式塔理论,格式塔学派认为思维是整体的、有意义的知觉,而不是联结起来的表象的简单集合;主张学习是在于构成一种完形。,知觉相似律,封闭性原则,知觉接近律,返回,尽管这些点没有用线段连接起来,但仍能看到一个三角形和一个长方形。,闭合性法则,完形法则,相近(,Proximity,) 距离相近的各部分趋于组成整体。,相似(,Similarity,) 在某一方面相似的各部分趋于组成整体。,封闭(,Closure,) 彼此相属、构成封闭实体的各部分趋于组成整体。,简单(,Simplicity,) 具有对称、规则、平滑的简单图形特征的各部分趋于组成整体。,典型表象(,canonic perspectives,),指能对物体作出最佳表征的形象,或回忆一个形状时最先想起的表象。,典型表象可能是对同一范畴中相似成员(成为样例)的经验的产物。,格式塔心理学的理论核心是整体决定部分的性质,部分依从于整体。他们通过实验的方式证明感知运动不等于实际运动,也不等于若干的单一刺激,而是与交互作用的刺激网络相关,整体不等于各部分简单相加之和。,三、知觉信息加工过程,自下而上(,bottom-up,)加工,:,指由外部刺激开始的加工,通常是说先对较小的知觉单元进行分析,然后再转向较大的知觉单元,经过一系列连续阶段的加工而达到对感觉刺激的解释。,又称之为,数据驱动加工(,Data-Driven Processing,),自上而下(,top-down,)加工,:,由有关知觉对象的一般知识开始的加工,由此可以形成期望或对知觉对象形成假设,这种期望或假设制约着加工的所有阶段或水平。,又称之为,概念驱动加工(,Concept-Driven Processing,),Tulving,Mandler,&,Baumal,的实验,自变量,上下文情况:无上下文、,4,字上下文、,8,字上下文(考察自上而下加工),靶子词呈现的时间:,0,140ms,,以,20ms,变化(考察自下而上加工),因变量:,靶子词识别率,结果:,随呈现时间增加,靶子词识别率上升。,有上下文的始终优于无上下文的,但两者差距随呈现时间延长而缩小,(二)整体加工和局部加工,整体加工与局部加工的实验,a,(,Navon,,,1977,),视觉材料,80ms,40ms,听觉材料,300ms,自变量:,总体的一致性关系与局部的一致性关系,因变量:,反应时间(按键判断听到的是哪一个字母,按键作反应),实验结果:,总体的一致性关系有主效应,:,一致,无关,冲突,局部的一致性关系无主效应,:一致无关冲突,整体加工与局部加工的实验,b,(,Navon,,,1977,),自变量:两个,不同指导语(注意整体、注意局部),大字母与小字母的一致性关系(冲突、无关、一致),实验程序:,预警信号,视觉刺激(,40ms,),掩蔽,反应,实验结果,:,大字母识别快于小字母,在注意整体的指导语下,小字母是否与大字母冲突并不影响反应时,冲突无关一致,在注意局部的指导语下,大字母是否与小字母冲突则会影响到反应时,两者冲突时,对小字母的反应时最慢。,STROOP,效应,STROOP,效应是指字义对命名的干扰效应。一般认为,念字和命名是两个不同的认知过程。,Stroop,于,1935,年做了一个实验,他使用的刺激字与书写它所用的颜色相矛盾,结果发现,说字的颜色时会受到字义的干扰,但在用一年级小学生做实验时却没有发现这种现象。,红,红,蓝,绿,蓝,绿,一般认为,,STROOP,效应是由于念字自动化造成的。人们对字加工快,而对颜色加工慢,因此,当要说颜色时,就会受到字义的干扰,而反过来,念字却不会受颜色的干扰。,第二节 模式识别及其理论模型,一、概述,从广义上说,一个模式,(,pattern,),就是一组刺激或刺激特性,它们按一定关系(如空间、时间)构成一个有结构的整体。,从狭义上说,模式仅指视觉刺激物的整体结构。,模式:,指有若干元素或成分按一定关系形成的某种刺激结构,也可以说是刺激的组合。,不同形状的椅子,返回,模式识别,(,Pattern Recognition,),当人能确认他所知觉的某个模式时,将它与其他模式区分开来,就是模式识别。,模式识别是指人把输入刺激模式的信息与长时记忆中的信息进行匹配,并辨认出该刺激属于什么范畴的过程。 (梁宁建),模式识别的,意义,二、模式识别过程,分析,比较,决策,三、模式识别理论,(一)模板说(模板匹配理论,template-matching theory,),模板,(template),:存在于人的长时记忆中的、与外部刺激具有一一对应关系的外部模式的小复本。,模板匹配说,模板匹配的基本思想:模式的识别需要刺激与模板相匹配,而这种匹配要求两者有最大程度的重叠。,(二)、特征分析说,1.,基本思想,特征分析说试图将模式分析为组成它们的各种特征,(feature),,模式识别时需要对刺激的特征进行分析,将之与长时记忆中的各种刺激特征进行比较,一旦获得最佳的匹配,外部刺激就得以识别。,2.,“,泛魔堂”模型(“魔城”模型),通过特征分析识别一个字母,R,3.,特征分析的生理学依据,1981,年诺贝尔医学奖获得者:,Hubel & Wiesel,4.,特征分析的行为学证据,Neisser(1964),英文字母扫描实验,固定影像与静止影像的实验,5.,特征分析说的评论,优点:避开预加工、减轻记忆负担、带有学习色彩,缺点:缺乏自上而下的过程,(三)、原型说,(,prototype theory,),1.,基本思想,原型,(prototype),:,头脑中存储着的代表一组物体、一个类别或范畴内所有个体关键特征的表征,它反映的是一类物体所具有的基本特征。原型不仅是对一类刺激的概括,也是这类刺激在头脑中的最优代表。,2.,原型存在的,证据,3.,原型的构成,趋中或特征频率,4.,伪记忆,for,(四)、几何离子理论,Biederman,(,1987,)认为:物体是由一些基本形状(,shapes,)或成分(,components,),也就是几何子(,geon; geometric ion,几何离子)组成的。通过把复杂对象的结构拆分为简单的部件形状,就可以进行模式识别。,几何离子理论,成分识别(,Recognition by components,),P109,图,4.9,对给定物体的识别是由贮存表征(包含相关几何离子特征、朝向、大小等方面的信息)能否与源自物体的成分或几何离子信息进行最佳匹配决定的。,几何离子大约有,36,种,包括方块(,block,)、圆锥(,cylindrer,)、球面(,sphere,)、圆弧(,arc,)和楔子(,wedge,)。,根据,Biederman,的理论,物体识别依赖于边缘信息而不是表面信息(如颜色)。,启动效应,(priming effects),指先前呈现的刺激项目对随后该刺激项目或与其相关的刺激项目进行某种加工所产生的易化现象,表现为启动刺激,(prime),对目标刺激,(target),在反应时上的促进作用。,启动效应的分类,启动效应按照启动词和目标词间字形、语音、语义间的相似程度分为重复启动和相似启动。,依据对语义加工的依赖程度和是否具有知觉特异性效应,(perceptual-specific effects),,分为物体(知觉)启动和语义(概念)启动。,语义启动,(semantic priming),指先前的语义加工使得随后的语义性任务操作的反应时间缩短、准确率提高。,例如,在词汇判断任务中,将“医院”作为启动刺激时,它会促进被试对目标刺激“医生”的判断反应。又如,:,当前面呈现的词是“面包”时,比是“护士”时对目标词“黄油”的反应要快。,Marr,的计算理论,(computational theory,),初级素描,(primal sketch),:,这一表征对视觉输入的主要光强变化进行二维描述,包括关于边缘、轮廓和墨块的信息。,2 1/2 -D,素描,(2 1/2 -D sketch),:,这一表征通过利用由阴影,(shading),、纹理,(texture),、运动,(motion),、双眼视差,(binocular disparity),等提供的信息,对可视表面深度和方位进行描述,此表征依赖于观察点。,3-D,模型表征,(3-D model representation),:,这一表征描述物体形状的三维特征,以及它们的相对位置,而不依赖于观察点。,Marr,的计算理论,物体识别的三种表征过程,拓扑学理论(,topological theory,),上世纪,80,年代初,陈霖提出视觉拓扑学理论。该理论认为,在视觉处理的早期阶段,人的视觉系统首先检测图形的拓扑性质;它对图形的大范围拓扑性质敏感,而对图形的局部几何性质不敏感。,图形的拓扑性质(,topological properties,),指在拓扑变换下图形保持不变的性质和关系,如连通性(,connectedness,)、封闭性(,closedness,)、洞(,hole,),都是典型的拓扑性质,而大小、角度、平行性等几何性质则不是拓扑性质。,陈霖,认知科学和实验心理学家。,1945,年生于四川成都。,1970,年毕业于中国科技大学。任中国科学院研究生院和生物物理研究所认知科学重点实验室教授、主任,中国科学院,-,北京医院脑认知成象研究中心主任。,2003,年当选为中国科学院院士。,1982,年他在,科学,杂志上原创性地提出了“拓扑性质初期知觉”的理论,向半个世纪以来占统治地位的理论提出了挑战。随后,20,多年的时间里,在与国际上持不同学术观点的学者的争论与交流中,他以令人信服的系列科学实验不断地完善和论证着这一假说,使之成为被越来越多的国际同行所接受的学说,进而成为有国际影响力的理论,他的成果也被,科学,、,美国科学院院报,等著名学术刊物多次刊登。,2004,年,著名知觉杂志,Visual Cognition,以专辑的形式刊载了陈霖教授的成果并配发了大量国际著名学者的评论性文章。,Lin Chen. The topological approach to perceptual organization. VISUAL COGNITION (2004).Lin Chen, Shaowu Zhang, Mandyam V. Srinivasan. Global perception in small brains: Topological pattern recognition in honeybees. P NATL ACAD SCI USA 100(11),6884-6889 (2003).Chen, L. Topological structure in visual perception.SCIENCE 218, 699-700 (1982).,实验证据,被试先注视屏幕上的一个注视点。,用速示器呈现三对实验图形(,5,毫秒)。被试注视成对图形并作出反应。(同,-,异判断)。,专家的模式识别,国际象棋研究中的常用指标:复盘时间、正确复位数,为什么象棋大师的复盘情况优于新手?,Chase & Simon (1973):,实际样本的复盘与凭记忆复盘,3,种棋艺水平下的扫描时间和复盘时间,正确复位的棋子数是棋艺水平的函数,早在二十世纪,60,年代,研究者就对婴儿的面孔偏好进行了一系列研究, 在,30,多年的研究中,研究者达成一致的看法,认为出生几小时甚至几分钟的婴儿都表现出对面孔的偏好。之后,大量研究验证了这个观点,,Morton,发现,出生,30,分钟的婴儿对面孔注视的时间长于非面孔刺激,这种兴趣出现于任何经验与学习之前。,Bruce and Young model of face recognition (1986),The IAC model of face recognition Burton Bruce (1993).,Interactive Activation and Competition (IAC),Face Recognition Units (FRU),Person Identity Nodes (PIN),Semantic Information Units (SIU),Name Recognition Units (NRU),Word Recognition Units (WRU),Haxby et al (2000),多级整合模型(汪亚珉,傅小兰,.2005,),认知神经科学研究成果,面孔刺激在下颞叶后部的外侧梭状回引起明显的,fMRI,信号的增强,提示梭状回参与完成面孔加工,梭状回也因此被称为梭状回“面孔区”。,在枕区和下颞叶的交界处、,V4,区之前有一个脑区的,fMRI,信号与面孔刺激存在密切相关,因此被认为也参与面孔加工,并被称为枕区“面孔区”。,彭小虎,王国锋,罗跃嘉,.,面孔认知及神经机制的独特性,J.,心理科学, 2002, 25 (4) : 488-490.,李琰琰,钱秀莹 面孔识别真的具有特殊性吗,? J.,人类工效学,,2006,,,12,(,2,):,62-64,面孔识别的独特性,Farah,提出了三个衡量面孔识别与物体识别差异的标准,:,脑定位标准,:,参与面孔识别与物体识别的脑结构与脑机制不同,;,加工系统标准,:,即每个系统独立运作而不依靠另外一个系统,;,信息处理方式标准,:,两个系统按照不同的方式来处理信息。,面孔神经元对面孔有着强烈的反应而对非面孔物体表现出微弱的反应或不反应。,患有面孔失认症的病人对面孔识别有着特别的困难。他们识别熟悉的面孔主要依靠非面孔线索,如嗓音、衣服或发型等。但这些病人对其他物体的识别却毫无困难或只有很少的困难。对面孔失认症最直截了当的解释是面孔识别系统与物体识别系统是相互独立的。,面孔识别主要定位在腹侧颞叶和枕叶皮层,所以在这些区域内无论前后部分损伤只要大小足够就会导致面孔失认。,一般认为面孔识别是“格式塔,(gestalt) ”,式或“整体的,( holistic) ”,。在物体识别中,整个物体外形常常被表征为各部件的外形,;,而在面孔识别中,面孔常常被表征为一个整体。到目前为止,已有很多心理学实验证实,面孔的表征很少是基于部分的,更多的是基于整体的。,面孔识别真的具有特殊性吗,?,面孔的各个部分以“粘着”的方式表征,人们对面孔的加工更倾向整体的、结构的编码,;,而普通物体的识别则基于局部、特征的分析。,然而,这种“特殊性”近来受到了专家系统论支持者的质疑。他们认为,除了物理结构特征外,面孔还在以下三方面不同于普通物体,: ,不同面孔的基本成分和基本结构相同,; ,面孔都在个体水平上区分,; ,人们都是面孔识别的专家。,人脸识别技术,人脸识别技术就是利用计算机分析人脸图像,通过检测对比人脸数据库中的所有已知原型人脸图像来达到“辨认”身份的目的。,人脸识别技术在视频监控、访问控制等领域有着广阔的应用前景。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!