资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,基于贝叶斯分类器的手写数字识别,制作人:622081103001 姜晖,622081103003 张然,手写数字识别(Handwritten Numeral,Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支。它研究的对象是:,如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。,研究的实际背景,在整个OCR领域中,最为困难的就是脱机手写字符的识别。,手写数字识别的应用范围广泛,阿拉伯数字组成的各种编号和统计数据如:邮政编码、统计报表、财务报表、银行票据等等。,研究的理论意义,阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关。,目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,。,手写数字的识别方法扩展范围广。,研究的难度,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高。主要原因是:,1.不同数字之间字形相差不大,使得准确区分某些数字相当困难;,2.数字虽然只有十种,笔划简单,但同一数字 写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。,算法的理论基础,贝叶斯定理:,设设有N类样本:,1,,.,,N,,如果以,P,(,i,),表示事件,i,发生的概率,且P(,i,)0(i=1,2,,,n)。对于任一事件x,P(x)0,则有:,P(,j,/x)=p(x/,j,)P(,j,)/P(X/,i,)P(,i,),其中P(x)=P(X/,i,)P(,i,),P(,i,)为先验概率,P(x,/,j,)为条件概率,P(,j,/,x)后验概率。,贝叶斯分类器,:,原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类,。也就是说,贝叶斯分类器是最小错误率意义上的优化。,贝叶斯分类器是用于分类的贝叶斯网络。该网络中应包含类结点C,其中C 的取值来自于类集合(c1,c2,.,cm),还包含一组结点X=(X1,X2,.,Xn),表示用于分类的特征。对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为x=(x1,x2,.,x n),则样本D 属于类别ci 的概率P(C=ci|X1=x1,X2=x 2,.,Xn=x n),(i=1,2,.,m)应满足下式:,P(C=ci|X=x)=Max P(C=c1|X=x),P(C=c2|X=x),.,P(C=cm|X=x),而由贝叶斯公式:,P(C=ci|X=x)=P(X=x|C=ci)*P(C=ci)/P(X=x),其中,P(C=ci)可由领域专家的经验得到,而P(X=x|C=ci)和P(X=x)的计算则较困难。,谢谢,观赏,WPS,Office,Make Presentation much more fun,WPS官方微博,kingsoftwps,
展开阅读全文