模式识别与神经网络.ppt

上传人:za****8 文档编号:15894974 上传时间:2020-09-13 格式:PPT 页数:90 大小:13.87MB
返回 下载 相关 举报
模式识别与神经网络.ppt_第1页
第1页 / 共90页
模式识别与神经网络.ppt_第2页
第2页 / 共90页
模式识别与神经网络.ppt_第3页
第3页 / 共90页
点击查看更多>>
资源描述
2020/9/13,1,模式识别与神经网络,hujing,2020/9/13,2,主要内容:,介绍模式识别的基本概念 介绍神经网络技术在模式识别领域的发展与应用 介绍神经网络如何应用于仿生模式识别研究中的。 神经网络泛化能力的提高。,2020/9/13,3,第一个主题模式识别的基本概念,模式和模式识别的概念 模式识别的发展简史和应用 模式识别的主要方法 模式识别的系统和实例?,2020/9/13,4,模式识别,模式识别作为一个研究领域,迅速发展于20世纪60年代,它既是一个多领域的交叉学科,又是一个与实际问题结合非常紧密的应用学科。,2020/9/13,5,什么是模式,2020/9/13,6,模式的定义,广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。 模式的直观特性: 可观察性 可区分性 相似性,2020/9/13,7,模式识别的概念,模式识别 直观,无所不在,“人以类聚,物以群分” 周围物体的认知:桌子、椅子 人的识别:张三、李四 声音的辨别:汽车、火车,狗叫、人语 气味的分辨:炸带鱼、红烧肉 人和动物的模式识别能力是极其平常的,但对计算机来说却是非常困难的。因此模式识别的任务就是让计算机能够像人那样认识事物。,2020/9/13,8,模式识别简史,1929年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。 30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。 50年代 Noam Chemsky 提出形式语言理论傅京荪 提出句法结构模式识别。 60年代 L.A.Zadeh提出了模糊集理论,模糊模式识别方法得以发展和应用。 80年代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活,并在模式识别得到较广泛的应用。 90年代小样本学习理论,支持向量机也受到了很大的重视。(Vipnik.N),2020/9/13,9,与模式识别相关的学科,统计学 概率论 线性代数(矩阵计算) 形式语言 机器学习 人工智能 图像处理 计算机视觉 ,2020/9/13,10,模式识别的研究目的,目的:利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。 Y = F(X) X的定义域取自特征集 Y的值域为类别的标号集 F是模式识别的判别方法,2020/9/13,11,模式识别的应用(举例),生物学 自动细胞学、染色体特性研究、遗传研究 天文学 天文望远镜图像分析、自动光谱学 经济学 股票交易预测、企业行为分析 医学 心电图分析、脑电图分析、医学图像分析,2020/9/13,12,模式识别的应用(举例),工程 产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析 军事 航空摄像分析、雷达和声纳信号检测和分类、自动目标识别 安全 指纹识别、人脸识别、监视和报警系统,2020/9/13,13,模式识别的方法,模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。 特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。 解释空间:将c个类别表示为 其中 为所属类别的集合,称为解释空间。,2020/9/13,14,假说的两种获得方法,监督学习、概念驱动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果。 依靠已知所属类别的的训练样本集,按它们特征向量的分布来确定假说 (通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类; 对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。,2020/9/13,15,假说的两种获得方法(续),非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。 在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况; 如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类; 这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。,2020/9/13,16,模式分类的主要方法,数据聚类 统计分类 结构模式识别 神经网络,2020/9/13,17,数据聚类,目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。 是一种非监督学习的方法,解决方案是数据驱动的。,2020/9/13,18,统计分类,基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。 是一种监督分类的方法,分类器是概念驱动的。,2020/9/13,19,结构模式识别,该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。 识别采用结构匹配的形式,通过计算一个匹配程度值(matching score)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。 当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法 句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。,2020/9/13,20,神经网络,神经网络是受人脑组织的生理学启发而创立的。 由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。 增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。 神经网络可以实现监督和非监督学习条件下的分类。,2020/9/13,21,模式识别系统,模式识别系统的基本构成,数据获取,特征提取和选择,预处理,分类决策,分类器设计,2020/9/13,22,模式识别系统组成单元,数据获取:用计算机可以运算的符号来表示所研究的对象 二维图像:文字、指纹、地图、照片等 一维波形:脑电图、心电图、季节震动波形等 物理参量和逻辑值:体温、化验数据、参量正常与否的描述 预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原,2020/9/13,23,模式识别系统组成单元,特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征 测量空间:原始数据组成的空间 特征空间:分类识别赖以进行的空间 模式表示:维数较高的测量空间-维数较低的特征空间 分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别 基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小,2020/9/13,24,模式识别过程实例,在传送带上用光学传感器件对鱼按品种分类 鲈鱼(Seabass) 品种 鲑鱼(Salmon),2020/9/13,25,识别过程,数据获取:架设一个摄像机,采集一些样本图像,获取样本数据 预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开,2020/9/13,26,识别过程,特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量 长度 亮度 宽度 鱼翅的数量和形状 嘴的位置,等等 分类决策:把特征送入决策分类器,2020/9/13,27,实例,2020/9/13,28,2020/9/13,29,2020/9/13,30,2020/9/13,31,训练和测试,训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。 测试集:在设计识别和分类系统时没有用过的独立样本集。 系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。,2020/9/13,32,第二个主题神经网络在模式识别领域中的应用,神经网络技术,因其优异的分类能力而被广泛地应用于各种模式识别系统中,为模式识别系统的迅猛发展起到了极大的推动作用。,2020/9/13,33,神经网络在模式识别领域应用的优势,以与统计模式识别相比较为例。,2020/9/13,34,统计模式识别,2020/9/13,35,统计模式识别的不足,参数估计法在参数估计法中错误的估计了分布的形式。 非参数估计法数据点较为稀疏而导致较差的核函数密度估计。 线性判别法可以避免上述问题,不再需要对类条件的概率密度函数进行估计或是对样本的分布十分清晰。但是假定决策面为线性的前提下展开讨论的,非线性情况不太好。,2020/9/13,36,神经网络用于分类的优势,1:神经网络是数据驱动的自适应模型,它们根据数据自适应的调整自己,而无需对数据的分布以及数据的模型十分了解。 2:神经网络可以以某种特定精度逼近任何一个函数。 3:神经网络是非线性的,这使得它们在构造现实世界中复杂关系模型时可以十分灵活。 4:神经网络可以估计后验概率。有关这一点,Andrew R.webb在“多层感知器的非线性判别分析”一文中进行了分析与说明。,2020/9/13,37,神经网络发展的历史回顾,1:1943年 McCulloch和Pitts根据神经传输中的“0”,“1”律,第一个提出神经元模型。 2:五十年代末,F.Rosenblatt设计了感知机。 3:1969年,Minsky与Papert首先提出了感知器的功能有限,并首次提到了“线性可分”的概念。同时也是第一个意识到神经元模型的几何意义。 4:1965年Nilsson对多层感知机进行了描述,给出了具有隐节点的广义感知机。 5:1986年,Rumehart 和McClelland出版了著名的PDP专著,提出了前向神经网络的概念和相应的“BP”算法。,2020/9/13,38,用于模式识别的神经网络分类器原理,神经网络是一种基于距离度量的数据分类方法,这个方法就是通过最小化输出与期望值之间的偏差来实现。,2020/9/13,39,神经元的数学模型,最早的设计与改造方案。 神经元是神经网络的基本处理单元,神经元的数学模型为:,2020/9/13,40,感知器原理,感知器的输出: d(x)= w x + w0 假设对于一个c类分类问题,需要找到一个线性判别方法。现在假设得到一个判别单元,它的输入变量是特征,输出变量是一个线性函数,所以称之为“线性网络”。,2020/9/13,41,线性可分的一个实例,通过感知器学习准则来解决一个判别手写的U和V的两类分类问题。 它们书写在一个78的方格里,并且图像进行了二值化处理,通过统计黑像素点的个数得到水平方向和垂直方向的投影。,2020/9/13,42,线性可分,对于一个线性可分的U和V集合,感知器不断调整一个判别直到完全分开为止。,2020/9/13,43,线性不可分的实例,对于线性不可分的U和V,感知器不会收敛,它将在U和V的两个聚类分解线附近振荡。,2020/9/13,44,非线性,现实生活中大多数模式识别都曾现非线性特性。 神经网络的非线性特性设计以满足实际应用。,2020/9/13,45,非线性特性的改进(一)对原模型的功能函数进行修改。,利用感知器,只能得到简单类型的决策面。这就构成了感知器的应用局限。 改进方法将原模型的功能函数改为非线性判别函数。使用非线性判别函数的模式分类器称作“工作机”; 工作机具有如下形式:d(x) = w (x)+ w0 可以看到判别函数不再是原始测量x的线性函数(d(x)= w x + w0) ,而 是非线性函数。,2020/9/13,46,实例一:径向基函数 (RBF),“径向对称非线性基函数”的线性组合。一般可表示为: d(x)=w(xu/ h)+w0 RBF 的最显著优点是它的简单性,一旦非线性的形式和中心被确定,就可以得到一个非线性模型,而模型参数就可以很容易地由最小平方法获得,或者通过真正合适的优化方法获得。,2020/9/13,47,用RBF进行分类实例,该例子是一个一维例子,从两个单变量,单位方差,均值分别为0和2的正态分布中抽取数据,并将数据表于图上。,2020/9/13,48,实例二:多层感知器,多层感知器由输入层、隐节点层以及输出层组成,其中隐节点层可以为一层或多层。多层感知器中每个神经元的激励函数是可微的Sigmoid函数。 d(x) = w (x + 0) (z) 1/(1+exp(z),2020/9/13,49,与RBF网络的不同之处,多层感知器是对非线性映射的全局逼近;而RBF网络是使用局部指数衰减的非线性函数(如高斯函数)对非线性输入输出映射进行局部映射。,2020/9/13,50,实例三:受限库仑能量分类器,受RBF网络的启发: 用“钟形”的对称函数代替s形函数,用局部划分代替全局划分。它是一个超球分类器的典型代表。 其隐层单元的功能函数;(用“圆形”函数代替全局划分)。其中D(U,x)是输入空间的某个距离函数。这个功能函数相当于以输入x为中心,进行小领域覆盖,直到所有样本被覆盖完毕为止。,2020/9/13,51,受限库仑能量分类器的结构,2020/9/13,52,非线性特性的改进(二)对神经网络的结构进行重新设计于改造。,实例一:级联网 实例二:高阶网,2020/9/13,53,实例一:级联网的设计与构造,修剪法首先给定一个足够大的神经网络结构(较实际需要的大小而言),然后在训练过程中动态地撤掉那些不重要的权重和神经元。 增长法从一个小的网络结构开始,逐步增加隐节点和隐层,直到网络适应给定的任务为止。,2020/9/13,54,实例:增长形级联网,整个网络由单个子网串联而成;每个子网则由工作子网和监督子网组成。,2020/9/13,55,级联网的优势,1)实现了任务的自动分解和模块化训练策略,提高了训练速度。 2)在训练过程中,训练集自动减少,学习复杂度随子网的不断增加而降低。 3)更适于复杂任务的分类和识别。,2020/9/13,56,实例二:高阶网,一阶网络的扩展形式,并对输入形式进行了修改。 修改方式有两种:连接函数形式与向量积形式,2020/9/13,57,(一)连接函数,对输入项进行预处理 输入项并不作为网络的直接输入,而是经过连接函数的转换为,2020/9/13,58,(二)向量积,高阶网最常采用的方法是利用向量积的方法获得高阶项,2020/9/13,59,第三个主题,仿生模式识别,2020/9/13,60,2020/9/13,61,2020/9/13,62,2020/9/13,63,2020/9/13,64,2020/9/13,65,2020/9/13,66,仿生模式识别的理论基点,对这类事物全体在特征空间形成的无穷点集合的“形状”的认识点集拓扑学,2020/9/13,67,2020/9/13,68,2020/9/13,69,2020/9/13,70,2020/9/13,71,2020/9/13,72,2020/9/13,73,2020/9/13,74,2020/9/13,75,2020/9/13,76,2020/9/13,77,2020/9/13,78,2020/9/13,79,2020/9/13,80,2020/9/13,81,2020/9/13,82,2020/9/13,83,综上所述可以说明,仿生模式识别开辟了一个效果较好有前途的新方向,正有待于从理论到实践上研究发展众多具体针对性的应用领域。,2020/9/13,84,第四个主题,2020/9/13,85,2020/9/13,86,2020/9/13,87,多层前向神经网络的泛化能力,在样本来源可靠的情况下,对于固定结构的神经网络,需要多少训练样本才能使网络达到所要求的泛化能力。 如何选择神经网络结构以保证神经网络的泛化能力。而影响神经网络返还能力的其他因素则可以通过学习算法来加以避免。,2020/9/13,88,泛化方法总结,如何将实际问题中的先验知识嵌入到神经网络的学习过程中,是改进神经网络泛化的最好途径之一。,2020/9/13,89,本节课总结,神经网络技术因其优异的分类能力而被广泛地应用于各种模式识别系统中,为模式识别系统的迅猛发展起到了极大的推动作用。,2020/9/13,90,
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!