分类模型 特征表示 (作业第四周讲)- 330

上传人:a**** 文档编号:242600267 上传时间:2024-08-28 格式:PPT 页数:27 大小:1.08MB
返回 下载 相关 举报
分类模型 特征表示 (作业第四周讲)- 330_第1页
第1页 / 共27页
分类模型 特征表示 (作业第四周讲)- 330_第2页
第2页 / 共27页
分类模型 特征表示 (作业第四周讲)- 330_第3页
第3页 / 共27页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,分类模型 & 特征表示,Classification model & features said,主讲人:juan,日期:2021 年 3 月 30 日,?计算机视觉?-周平,2024/8/28,2,#4,查准率和查全率,特征表示,目,录,#1,#2,#3,模式识别,分类模型,2024/8/28,3,2024/8/28,4,一、模式识别,定义1:将一个目标实例以一个目标原型或类别定义进行匹配的过程成为验证。e:银行自动柜员机,模式识别是根据输入的原始数据对其进行各种分析判断,从而得到其类别属性,特征判断的过程。,模式是存在于时间和空间中的可观察的事物,如果我们可以区别它们是否相同或者是否相似,那我们从这种事物所获取的信息就可以称之为模式。,人们为了掌握客观的事物,往往会按照事物的相似程度组成类别,而模式识别的作用和目的就在于把某一个具体的事物正确的归入某一个类别。,识别的一个定义是再认识。 “人以类聚,物以群分,用计算机实现人对各种事物或现象的分析、描述、判断、识别。,2024/8/28,5,用例子说明,哪些是模式识别的范畴:,1将铅笔、钢笔、圆珠笔、毛笔、彩笔都归类为书写用的“笔;,2医生根据心电图化验单来判断病人是否得心脏病;,3警察根据指纹来进行身份验证;,4利用计算机进行字符识别;,5根据用户的虹膜进行身份识别;虹膜与指纹一样独一无二,6判断当前用户发出的声音是什么字符;,7判断当前图片中是否有行人、人脸、车辆等;,8对出现在图片序列中的行人、车辆进行跟踪;,9对图片中的人脸进行身份识别验证;,10对车辆的拍照进行识别;,11判断车辆的颜色、车型;,12在海量图片库当中寻找与某一张图片相似的假设干图片;,13根据用户哼唱的音调搜索对应的歌曲.,二、分类模型,2024/8/28,8,一个理想类别是一些具有重要工头属性的目标的集合在实际中,某目标所属类别用类别标号来标识。分类就是根据目标的属性表示赋予目标类别号的过程。分类器是一种设备或算法,她输入的是目标的表示,输出的是类别标号。,拒绝类别是无法归入任何类别的目标设置的通用类别。,特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。,解释空间:将 C 个类别表示为 ,其中 为所属类别的集合,称为解释空间。,二、分类模型,分类任务的输入数据是记录的集合。每条记录也称实例或者样例,用元组x, y表示,其中x是属性的集合,而y是一个特殊的属性,指出样例的类标号也成为分类属性或目标属性。,2024/8/28,9,分类classification,通过学习得到一个目标函数target function , 也成为分类模型classification model,把每个属性集x映射到一个预先定义的类标号y。,目的:,1、描述性建模,分类模型可以作为解释性的工具,用于区分不同类中的对象。,2、预测性建模,分类模型还可以用于预测未知记录的类标号。,2024/8/28,10,分类,分类器的任务:根据输入属性集,x,确定类标号,y,。,分类技术非常适合预测或描述二元或标称类型的数据集,对序数分类不太有效,因为分类技术不考虑隐含在目标类中的序关系。,2024/8/28,11,输入属性集x,分类模型,输出类标号y,解决分类问题的一般方法,分类技术是一种根据输入数据集建立分类模型的系统方法。,2024/8/28,12,分类技术,这些技术都使用一种学习算法确定分类模型,修改这个模型能够很好地拟合输入数据中类标号和属性集之间的联系。学习算法得到的模型不仅要很好地拟合输入数据,还要能够正确地预测未知样本的类标号。,训练算法的目标:建立具有很好的泛化能力的模型。,表中每个表项 表示实际类标号为,i,但是被预测为类,j,的记录数。被分类模型正确预测的样本总数是 ,而被错误预测的样本总数是 。,2024/8/28,13,二类问题的混淆矩阵,2024/8/28,14,二类问题的混淆矩阵,同样,分类模型的性能也可以用错误率error rate来表示,其定义如下:,目标:寻求最高的准确率或者最低的错误率,虽然混淆矩阵提供衡量分类模型的信息,但是用一个数汇总这些信息更便于比较不同模型的性能。为实现这一目的,可以使用性能度量performance metric,如准确率accuracy,其定义如下:,2024/8/28,15,三、查准率查全率,定义1:文档检测系统的查准率,是检索出的相关文档数属于C1类与检索出的文档总数属于C1类的文档数加上实际是C2类的误报文档数之比。,定义2:文档检索系统的查全率,是检索出的相关文档数与数据库中总的相关文档数之比,即分子是检索出的属于C1的文档数,分母是检索出的属于C1的文档数与漏报的文档数之和。,2024/8/28,16,查准率和查全率,假设一个图像数据库包含200张用户感兴趣的日落图像,用户希望能与查询图像匹配。假设系统检索出200个相关图像中的150幅以及另外100幅欧诺个户不感兴趣的图像。,这次检索分类的查准率是:150/250=60%,查全率是:150/200=75%,如果系统将数据库中的所有图像返回,那么查全率是100%,但查准率将非常低,另一方面,如果分类是为了低误报率的话,查准率将偏高,而查全率将偏低。,什么是图像特征,?,理想的特征描述符应该具有:可重复性、可区分性、集中以及高效等特性;还需要能够应对图像亮度变化、尺度变化、旋转和仿射变换等变化的影响。,计算机视觉中通常把角点corner作为是图像的特征,而角点能够作为图像特征点的原因有以下两点:,1、角点具有唯一的可识别性,当然,这是基于两幅图像没有非常大的差异的前提下适用的;,2、角点具有稳定性,换句话说,就是当该点有微小的运动时,就会产生明显的变化。于是,可以清晰的看到该点的移动,这有利于特征点的跟踪;,对于图像上其它的特征描述,如边edge,区域patch等,用数学的语言来描述,就是,这些特征点变化性比较小。,如某一灰度相似的区域,其一阶导数为常数,二阶导数也为常数。因此,假设选取一幅图像中这样的某个区域作为特征,那么在另一幅图像中,便很难找到同时满足唯一可识别性和稳定性要求的对应特征。,2024/8/28,17,四、特征表示,特征向量及其几何解释:,2024/8/28,18,四、特征表示,图像特征的分类有多种标准,如根据自身的特点可以将其分为两大类:描述物体外形的形状特征和描述物体外表灰度变化的纹理特征。而根据特征提取所采用的方法的不同又可以将其特征分为统计特征和结构特征。,灰度彩色图像像素矩阵,图像特征的分类:,我们常将某一类对象的多个特型组合在一起,形成一个特征向量来代表该类对象,如果只有单个数值特征,那么特征向量为一个一维向量;如果是n个特征组合,那么为一个n维特征向量,常常被作为识别系统的输入。一般讲带分类的对象称为样本,将其特征向量称为样本特征向量或样本向量。,2024/8/28,19,a三维空间中的3维特征向量样本,b二维空间中的2维特征向量及其上的一种可能的划分,四、特征表示,2024/8/28,20,四、特征表示,投影降维法,字符样本的特征举例,2024/8/28,21,四、特征表示,特征处理的根本方法:分别处理单个特征,并除去那些几乎不具新的、不相关区分能力的特征;将特征综合考虑,通过线性/非线性变换,使结果维数降低且具有更好地区分能力。,2024/8/28,22,四、特征表示,通常假定给出了维数为d确实定的模式样本集,但d维特征如何确定尚未明确,实际设计一个模式识别系统时,首先要解决的问题用各种可能的手段对识别对象的性质作各种可能的测量,并将这些测量值作为分类的特征,为了设计出好的分类器,一般需要对原始的测量值集合进行分析,进行选择或变换,组成识别特征,在保证一定分类精度的前提下,减少特征维数,使分类器的工作又快又准确,要到达上述目的,关键是所提供的模式特征应具有很好的可分性类别可别离性判据来衡量,同时去掉那些关联性较强的特征,需要依据某种准那么进行特征提取和选择,为此应当首先构造这样的准那么类别可别离性判据,可别离性判据应能反映各类样本在特征空间中的分布情况,能刻画各特征分量在分类识别中的重要性或奉献,1 类别可别离性判据满足的要求,1与错误概率或其的上下界有单调关系,2当特征独立时有可加性,2024/8/28,23,2024/8/28,24,四、特征表示,3具有“距离的某些特性,即,4对特征数目是单调不减,即参加新的特征后,判据值不减,应当指出,所构造的可别离性判据并不一定同时具有上述的四个性质,但这并不影响它在实际使用中的性质。,2024/8/28,25,根本任务如何从许多特征中找出那些最有效的特征,原那么:在同类图像之间差异较小较小的类内距,在不同别的图像之间差异较大的图像特征,即最具有区分能力的特征。,必要性对分类器性能的影响,分类器性能:正确性低误判率与通用性泛化能力,特征可区分性,维数大小的影响,四、特征表示,特征维数的改变与识别率,2024/8/28,26,四、特征表示,谢 谢!,zjlgdx,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!