资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,模式识别,贝叶斯分类器,第二章 贝叶斯决策理论,2.1,最小错误率准则,各种概率及其关,系,系,先验概率:,后验概率:,类条件概率:,贝叶斯公式:,两个类别,一维,特,特征,两类问题的错误,率,率,观察到特征,x,时作出判别的错误率:,两类问题最小错,误,误率判别准则:,多类问题最小错,误,误率,判别,x,属于,i,的错误率:,判别准则:,则:,贝叶斯最小错误,率,率准则,Bayes,判别准则:,,则,贝叶斯分类器的,错,错误率估计,例,2.1,对一大批人进行,癌,癌症普查,设,1,类代表患癌症,,2,类代表正常人。,已,已知先验概率:,以一个化验结果,作,作为特征,x:,阳性,阴性,,患癌症的人和,正,正常人化验结果,为,为阳性的概率分,别,别为:,现有一人化验结,果,果为阳性,问此,人,人是否患癌症?,2.2,最小平均风险准,则,则贝叶斯分,类,类器,问题的提出,:,有,c,个类别,1,2,.,c,将,i,类的样本判别为,j,类的代价为,ij,。,将未知模式,x,判别为,j,类,的平均风险:,最小平均风险判,别,别准则,利用,Bayes,公式,构造判别函数:,贝叶斯分类器,例,2.2,对一大批人进行,癌,癌症普查,设,1,类代表患癌症,,2,类代表正常人。,已,已知先验概率:,以一个化验结果,作,作为特征,x:,阳性,阴性,,患癌症的人和,正,正常人化验结果,为,为阳性的概率分,别,别为:,判别代价:,11,=0,22,=0,12,=100,21,=25,现有一人化验结,果,果为阳性,问此,人,人是否患癌症?,2.3,贝叶斯分类器的,其,其它版本,先验概率,P(,i,),未知:极小化极,大,大准则;,约束一定错误率,(,(风险):,Neyman-Pearson,准则;,某些特征缺失的,决,决策:,连续出现的模式,之,之间统计相关的,决,决策:,2.4,正态分布的贝叶,斯,斯分类器,单变量正态分布,密,密度函数(高斯分布):,多元正态分布函,数,数,正态分布的判别,函,函数,贝叶斯判别函数,可,可以写成对数形,式,式:,类条件概率密度,函,函数为正态分布,时,时:,情况一,:,判别函数可以写,成,成:,此分类器称为距离分类器,判别函数可以,用,用待识模式,x,与类别均值,i,之间的距离表示,:,:,情况二:,判别函数可以写,成,成:,可以简化为:,称为线性分类器,线性分类器,两类问题,,1,维特征,先验概,率,率相同时:,线性分类器,两类问题,高维,特,特征,先验概率,相,相同时:,线性分类器,两类问题,,1,维特征,先验概,率,率不同时:,线性分类器,两类问题,高维,特,特征,先验概率,不,不同时:,情况三:任意,判别函数可以写,成,成:,判别函数为二次判别函数,分类界面为,2,次曲线(面)。,二次分类曲线,二次分类曲面,演讲完毕,谢谢,观,观看!,
展开阅读全文