第8章基于数学原理的神经网络不讲教学课件

资源描述

8.18.1径向基函数径向基函数RBF8.1.1 基于径向基函数技术的函数逼近与内插基于径向基函数技术的函数逼近与内插对于对于RBF网络工作原理的理解可基于网络工作原理的理解可基于2种不种不同的角度：同的角度：当用当用RBF网络解决网络解决非线性映射非线性映射问题时，用问题时，用函数逼近与内插函数逼近与内插的观点来理解；的观点来理解；当用当用RBF网络解决复杂的网络解决复杂的模式分类模式分类任务时，任务时，用用模式可分性模式可分性观点来理解。观点来理解。1 1963年年Davis提出高维空间的多变量插值理论。径向提出高维空间的多变量插值理论。径向基函数是基函数是20世纪世纪80年代后期年代后期Powell解决多变量有限点插解决多变量有限点插值问题时引入的。值问题时引入的。设设N维空间有维空间有P个数据点个数据点 Xp，p=1,2,P，在输出，在输出空间相应的目标值为空间相应的目标值为dp，p=1,2,P。插值问题是寻。插值问题是寻找一个非线性映射函数找一个非线性映射函数F(X)，使其满足下述插值条件，使其满足下述插值条件F(Xp)=d p，p=1,2,P (8.1)式中，函数式中，函数F描述了一个插值曲面。描述了一个插值曲面。严格插值或精确插值严格插值或精确插值：是一种完全内插，即该插值：是一种完全内插，即该插值曲面必须通过所有数据点。曲面必须通过所有数据点。2 选择选择P个基函数，每一个基函数对应一个训个基函数，每一个基函数对应一个训练数据，各基函数的形式为练数据，各基函数的形式为,p=1,2,P (8.2)基于径向基函数技术的插值函数定义为基函数的线基于径向基函数技术的插值函数定义为基函数的线性组合性组合(8.3)3(8.4)4 令令，i=1,2,P，p=1,2,P，则上述方程组可改写为则上述方程组可改写为 Pppdw=11j j1pMMPppdw=21j j2pPppdw=P1j jPp(8.5)5 令令表示元素为表示元素为ip的的PP阶矩阵，阶矩阵，W和和d分别表示系分别表示系数向量和期望输出向量，式数向量和期望输出向量，式(8.5)还可写成下面的向量形还可写成下面的向量形式式 (8.6)式中式中称为插值矩阵。若称为插值矩阵。若为可逆矩阵，就可以从式为可逆矩阵，就可以从式(8.6)中解出系数向量中解出系数向量W，即，即(8.7)63种常见的径向基函数种常见的径向基函数 78 (1)由于插值曲面必须通过所有训练数据点，当训练由于插值曲面必须通过所有训练数据点，当训练数据中存在噪声时，神经网络将拟合出一个错误的插值数据中存在噪声时，神经网络将拟合出一个错误的插值曲面，从而使其泛化能力下降。曲面，从而使其泛化能力下降。(2)由于径向基函数的数量与训练样本数量相等，当由于径向基函数的数量与训练样本数量相等，当训练样本数远远大于物理过程中固有的自由度时，插值训练样本数远远大于物理过程中固有的自由度时，插值矩阵求逆时可能导致不稳定。矩阵求逆时可能导致不稳定。98.1.2 正则化正则化RBF网络网络能够实现完全内插的输入能够实现完全内插的输入-输出映射函数有很多，若输出映射函数有很多，若输入输入-输出映射函数是光滑的，则问题的解是连续的，意输出映射函数是光滑的，则问题的解是连续的，意味着味着相似的输入对应着相似的输出相似的输入对应着相似的输出。正则化理论表明，当映射函数正则化理论表明，当映射函数F(X)的基函数为的基函数为Green函数时，可保证函数的光滑性。函数时，可保证函数的光滑性。Green函数的一个重要例子是多元函数的一个重要例子是多元Gauss函数，定函数，定义为义为 1、正则化、正则化RBF网络的结构与特点网络的结构与特点10正则化正则化RBF网络网络 11 当采用正则化当采用正则化RBP网络结构时，隐节点数即样本数，网络结构时，隐节点数即样本数，基函数的数据中心即为样本本身，参数设计只需考虑基函数的数据中心即为样本本身，参数设计只需考虑扩展扩展常数常数和输出节点的和输出节点的权值权值。2、RBF网络常用学习算法网络常用学习算法 (1).径向基函数的扩展常数径向基函数的扩展常数12 (2).输出层的权值输出层的权值只要得到插值矩阵只要得到插值矩阵，即可由上式解出即可由上式解出W。将所有样本输入一遍，即可得到矩阵将所有样本输入一遍，即可得到矩阵。138.1.3模式可分性观点与广义模式可分性观点与广义RBF网络网络若若N维输入样本空间的样本模式是线性可分维输入样本空间的样本模式是线性可分的，总存在一个用线性方程描述的超平面，使两的，总存在一个用线性方程描述的超平面，使两类线性可分样本截然分开。类线性可分样本截然分开。若两类样本是非线性可分的，则不存在一个若两类样本是非线性可分的，则不存在一个这样的分类超平面。但根据这样的分类超平面。但根据Cover定理，非线性定理，非线性可分问题可能通过非线性变换获得解决。可分问题可能通过非线性变换获得解决。1、模式的可分性、模式的可分性14Cover定理：定理：将复杂的模式分类问题非线性地投将复杂的模式分类问题非线性地投射到高维空间将比投射到低维空间更可射到高维空间将比投射到低维空间更可能是线性可分的。能是线性可分的。15 设有一组函数构成的向量设有一组函数构成的向量，将将N维空间的维空间的P个点映射到个点映射到M维维空间空间(MN)，如果在该，如果在该M维维空间存在空间存在M维向量维向量W，使得，使得则由线性方程则由线性方程WT(X)=0确定了确定了M维维空间中的一个分界空间中的一个分界超平面。超平面。162、广义广义RBF网络网络由于正则化网络的训练样本与由于正则化网络的训练样本与“基函数基函数”是一一对应是一一对应的。当样本数的。当样本数P很大时，实现网络的计算量将大得惊人。为很大时，实现网络的计算量将大得惊人。为解决这一问题，可减少隐节点的个数，即解决这一问题，可减少隐节点的个数，即N M PN为为样本维数，样本维数，P为样本个数，从而得到广义为样本个数，从而得到广义RBFRBF网络。网络。17 广义广义RBF网络的基本思想是：网络的基本思想是：用径向基函数作为非线性变换函数，构成用径向基函数作为非线性变换函数，构成隐层空间。隐层对输入向量进行变换，将低维隐层空间。隐层对输入向量进行变换，将低维输入空间的模式变换到高维隐层空间内，使得输入空间的模式变换到高维隐层空间内，使得在低维空间中线性不可分问题在高维空间中变在低维空间中线性不可分问题在高维空间中变得线性可分。得线性可分。18广广义义RBF网网络络 19广义广义RBF网络与正则化网络与正则化RBF网络有以下几点不同：网络有以下几点不同：径向基函数的数目径向基函数的数目M与样本数与样本数P不相等，且不相等，且MP。径向基函数的中心不再限于数据点，由训练算法确定。径向基函数的中心不再限于数据点，由训练算法确定。各径向基函数的扩展常数不再统一，其值由训练算法确各径向基函数的扩展常数不再统一，其值由训练算法确定。定。输出函数的线性中包含阈值参数，用于补偿基函数在样输出函数的线性中包含阈值参数，用于补偿基函数在样本集上的平均值与目标值之平均值之间的差别。本集上的平均值与目标值之平均值之间的差别。203、广义广义RBF网络设计方法网络设计方法根据数据中心的取值方法，根据数据中心的取值方法，RBF网的设计方法可分网的设计方法可分为两类。为两类。第一类方法：第一类方法：数据中心从样本输人中选取。一般来说，样数据中心从样本输人中选取。一般来说，样本密集的地方中心点可以适当多些，样本稀疏的地方中心点可以本密集的地方中心点可以适当多些，样本稀疏的地方中心点可以少些；若数据本身是均匀分布的，中心点也可以均匀分布，总之，少些；若数据本身是均匀分布的，中心点也可以均匀分布，总之，选出的数据中心应具有代表性。选出的数据中心应具有代表性。第二类方法：第二类方法：数据中心的自组织选择。常采用各种动态数据中心的自组织选择。常采用各种动态聚类聚类算法算法对数据中心进行自组织选择，梯度训练方法、资源分配网络对数据中心进行自组织选择，梯度训练方法、资源分配网络(RAN)法，等等。法，等等。21K-means聚类算法确定数据中心聚类算法确定数据中心初始化。选择初始化。选择M个互不相同的向量作为初始聚类中心：个互不相同的向量作为初始聚类中心：。计算输入空间各样本点与聚类中心点的欧式距离计算输入空间各样本点与聚类中心点的欧式距离 4、广义广义RBF网络数据中心的聚类算法网络数据中心的聚类算法22相似匹配。令相似匹配。令代表竞争获胜隐节点的下标，对每代表竞争获胜隐节点的下标，对每一个输入样本一个输入样本根据其与聚类中心的最小欧式距离根据其与聚类中心的最小欧式距离确定其归类确定其归类，即当，即当时，时，被归为第被归为第类，从而将全部样本划分为类，从而将全部样本划分为M个子个子集：集：，每个子集构成一个以聚类中，每个子集构成一个以聚类中心为典型代表的聚类域。心为典型代表的聚类域。23更新各类的聚类中心。对各聚类域中的样本取均值，更新各类的聚类中心。对各聚类域中的样本取均值，令令Uj(k)表示第表示第 j个聚类域，个聚类域，Nj 为第为第 j 个聚类域中的样个聚类域中的样本数，则本数，则将将k值加值加1，转到第，转到第步。步。重复上述过程直到的改变量小于要求的值。重复上述过程直到的改变量小于要求的值。24 各聚类中心确定后，可根据各中心之间的距离确定各聚类中心确定后，可根据各中心之间的距离确定对应径向基函数的扩展常数。令对应径向基函数的扩展常数。令则扩展常数取则扩展常数取为重叠系数。为重叠系数。25 利用聚类算法得到各径向基函数的中心和扩展常利用聚类算法得到各径向基函数的中心和扩展常数后，混合学习过程的第二步是用有监督学习算法得数后，混合学习过程的第二步是用有监督学习算法得到输出层的权值。到输出层的权值。u最小均方算法最小均方算法(LMS)u伪逆法直接计算伪逆法直接计算u梯度下降算法梯度下降算法 26隐层输出矩阵为隐层输出矩阵为 RBF网络的待定输出权值为网络的待定输出权值为网络输出向量为网络输出向量为 27W可用可用的伪逆的伪逆求出求出 288.1.4 RBF网络与多层感知器的比较：网络与多层感知器的比较：隐层数隐层数隐层和输出层神经元模型隐层和输出层神经元模型隐层和输出层激活函数隐层和输出层激活函数激活函数的自变量激活函数的自变量基基全局逼近与局部逼近全局逼近与局部逼近29

展开阅读全文

第8章基于数学原理的神经网络不讲教学课件

最新文档