资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,基于人工神经网络的英文字母识别,作者:王磊,指导老师:吴清,基于人工神经网络的英文字母识别作者:王磊,1,系统总体结构,系统,图像预处理,BP神经网络,图像灰度化,图像二值化,梯度锐化,去除离散噪声,整体斜度调整,字符分割,字符归一化,紧缩排列,BP网络的训练,BP网络字母的识别,系统总体结构系统图像预处理BP神经网络图像灰度化图像二值化梯,2,BMP格式图片的四部分结构,位图文件头数据结构,它包含BMP图像文件的类型、显示内容等信息,位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息;,调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的BMP)就不需要调色板,位图数据,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引值。,BMP格式图片的四部分结构位图文件头数据结构,它包含BMP图,3,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,4,256色图像预处理图转灰色图,未处理前,处理后,256色图像预处理图转灰色图未处理前处理后,5,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,6,灰度图2值化,该算法的关键就是在阈值的选取上,阈值的选取有很多种算法,该系统采用最简单的预先设置一个阈值220,即灰度值大于220时认为为白色,当小于220时就认为是黑色。,灰度为220,灰度图2值化该算法的关键就是在阈值的选取上,阈值的选取有很多,7,处理结果,二值化前,二值化后,二值化处理,处理结果二值化前二值化后二值化处理,8,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,9,梯度锐化处理,梯度锐化的目的及原理,梯度锐化的方法,梯度锐化处理梯度锐化的目的及原理,10,锐化处理的目的及原理,使边缘和轮廓线模糊的图像变得清晰,并使其细节清晰。图像的模糊实质是因为图像受到平均或者积分运算,为此对其进行逆运算如微分运算,梯度运算就可以使图像清晰。,锐化处理的目的及原理使边缘和轮廓线模糊的图像变得清晰,并使其,11,梯度锐化处理,梯度锐化的目的及原理,梯度锐化的方法,梯度锐化处理梯度锐化的目的及原理,12,梯度锐化的方法,锐化滤波一般有两种方法:一直是空间域微分法,另一种是频域中的高频滤波法。在该系统中采用的是空间域微分法中的,梯度算子,。,梯度锐化的方法锐化滤波一般有两种方法:一直是空间域微分法,另,13,梯度算子,其中:,强度:,梯度算子其中:强度:,14,梯度算法中的问题,由于图像在变化缓慢的地方梯度值会很小,这样容易把图像变灰。因此我设置了一个阈值,当梯度小于阈值的时候将该点设置为白色。该系统中阈值设置为2。,梯度算法中的问题由于图像在变化缓慢的地方梯度值会很小,这样容,15,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,16,去除离散噪声,处理后,去除离散噪声处理后,17,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,18,图像整体斜度调整,字母的有时候会因为各种原因发生一些倾斜,这种变化在某种意义上将对于识别系统是一种噪声,会对识别的结果有一定的影响。在进行识别之前可以进行斜度调整,这样对识别效果有一定的帮助。,图像整体斜度调整字母的有时候会因为各种原因发生一些倾斜,这种,19,图像整体斜度调整,在对图像进行整体斜度调整时,最主要的是求斜度,在本系统中,我采用如下算法:,1.求黑色像素的平均高度,2.通过公式:计算斜度,图像整体斜度调整在对图像进行整体斜度调整时,最主要的是求斜度,20,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,21,字符分割,分割前,分割后,进行分割,字符分割分割前分割后进行分割,22,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,23,尺寸标准归一化,归一化,尺寸标准归一化归一化,24,图像预处理,256色图转灰色图,灰度图2值化,梯度锐化,去除离散噪声,图像整体斜度调整,字符分割,尺寸标准归一化,紧缩重排,图像预处理256色图转灰色图,25,紧缩重排,紧缩排列,紧缩重排紧缩排列,26,小结,至此,我已将图像的预处理工作全部完成。,接下来就到了该系统的核心部分,人工神经网络,小结至此,我已将图像的预处理工作全部完成。,27,BP神经网络,BP网络的训练,BP网络的字母识别,BP神经网络BP网络的训练,28,BP网络的训练,x,1,o,1,V,W,输出层,隐藏层,输入层,x,2,o,2,o,m,x,n,BP网络的训练x1o1VW输出层隐藏层输入层x2o2omxn,29,初始化权值,计数器,输出样本,计算各层输出,:,计算输出误差,计算各层误差信号,调整各层权值,pP,Y,EE,min,N,N,结束,初始化权值,计数器输出样本,计算各层输出:计算输出误差计算各,30,BP网络的训练,(1)初始化:对权值矩阵W,V赋随机数,将样本模式计数器p的训练次数置1,误差E置0,令学习率 为0-1内的小数,网络训练后,精度达到E,min为,正小数,(2)输入训练样本对,计算各层输出。当前样本x,p,d,p,对向量组x,d进行赋值,利用式子:,o,k,=f(net,k,),其中o为输出层,y,i,=f(net,i,)其中y为隐层,BP网络的训练(1)初始化:对权值矩阵W,V赋随机数,将样本,31,BP网络的训练,(3)计算网络输出误差:设共有p对训练样本,网络对不同的样本具有不同的 可将全部样本输出误差的平方 进行累加再开放,作为总输出误差。,即,BP网络的训练(3)计算网络输出误差:设共有p对训练样本,网,32,BP网络的训练,(4)计算各层误差信号,计算:,BP网络的训练(4)计算各层误差信号,33,BP网络的训练,(5)调整各层权值,计算:,BP网络的训练(5)调整各层权值,34,BP网络的训练,(6)检查是否对所有样本完成该轮训练,若pP,计数器p,q自增1,返回步骤(2),否则输出步骤(7),(7)检查网络总误差是否达到精度,当网络的总误差EE,min,训练结束,否则E置0,p置1,返回步骤(2)。,至此,神经网络已经训练完成,最后将训练后的神经网络的相关参数进行保存.,BP网络的训练(6)检查是否对所有样本完成该轮训练,若pP,35,BP网络的英文字母识别,BP网络的英文字母识别,36,结 论1,多层前向BP网络的优点:,网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题;,网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力;,结 论1多层前向BP网络的优点:,37,结 论2,多层前向BP网络的问题:,BP算法的学习速度很慢,网络训练失败的可能性较大,难以解决应用问题的实例规模和网络规模间的矛盾。这涉及到网络容量的可能性与可行性的关系问题,即学习复杂性问题;,结 论2多层前向BP网络的问题:,38,结束语,BP网络是基于多层感知器结构、采用最小误差准则、并反向传递误差以调整网络权值和偏置的这样的一种经典的人工神经网络。,本文利用经典的BP网络模型,配合强大的VC开发环境,实现了基于人工神经网络的英文字母识别。,结束语BP网络是基于多层感知器结构、采用最小误差准则、并反向,39,
展开阅读全文