chapter5突触动力学Ⅱ有监督学习

上传人:gb****c 文档编号:243023241 上传时间:2024-09-14 格式:PPT 页数:12 大小:105.50KB
返回 下载 相关 举报
chapter5突触动力学Ⅱ有监督学习_第1页
第1页 / 共12页
chapter5突触动力学Ⅱ有监督学习_第2页
第2页 / 共12页
chapter5突触动力学Ⅱ有监督学习_第3页
第3页 / 共12页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,chapter 5,突触动力学 有监督学习,学号:0622310213,姓名: 余 景 景,1,本章内容要点,有监督学习的理论解释,有监督的函数估计,有监督的学习相当于操作性条件反射,有监督的学习相当于有先验知识的随机模式学习,前馈网络的监督学习算法,感知器,最小均方误差(LMS)算法,反向传播(BP) 算法,2,第一部分内容,有监督学习和无监督学习,有监督的函数估计,有监督学习相当于操作性条件反射,有监督学习相当于有先验知识的随机模式学习,3,有监督学习,给定一系列训练样本,其中每个样本都做上了标记,比如说标记出这个样本来自对一个苹果的一次观测。学习的目的是从这些带有标记的样本中学习到一些概念,比如说什么样的数据对应苹果而不是香蕉,并且在未来给出新的样本时,能够正确预测新样本的标记。,4,无监督学习,给定一系列没有任何标记的训练样本,学习的目的时发现隐藏在这些样本中的某种结构,例如样本的聚类情况 。,环境,学习系统,状态向量,5,有监督的函数估计,给定观察得到的随机矢量样本对:,要估计一个未知函数:,使得期望误差函数,EJ,最小。,误差=期望输出-实际输出,6,有监督的函数估计,设N为一个神经网络的传递函数,那么可以定义瞬时误差为 ,这是一个随机向量,由于我们不知道联合概率密度函数p(x,y)无法求出 ,一般用均方差 替代。,随机逼近用观测到的随机量来估计期望值,然后在离散的近似算法中使用这些估计量。,用的比较多的近似算法是随机梯度下降法。如本章将要讲述的Widrows LMS算法中所用的就是随机梯度。,7,有监督学习相当于操作性条件反射,操作性条件反射强化响应,如果输入与期望的输出不同,就调节权值m。,8,无监督学习相当于传统条件反射,传统条件反射强化刺激。这种神经网络直接把输入,x耦合到输出y。,例如,一个生物体学会了一刺激响应对: 那么在条件刺激 S中加一个条件B进行学习,得到,不断强化刺激,直到输入B时反应为R。这样就有:,也就是学会了一条规则。如巴普洛夫条件反射试验。,9,有监督学习相当于 有先验知识的随机模式学习,模式:模式空间 上的点,时变模式:定义在 中的轨迹线,随机模式学习,由已知的样本x(1),x(2)x(n)来估计x的概率密度函数p(x),模式类: 是 的子集,也叫决策类,满足:,10,有监督学习相当于 有先验知识的随机模式学习,类的概率,其中 ,是一个指示器函数,定义为指示函数指出了模式 x 的类隶属关系。如果 S 是将映射到 而不是 。就称模式 x 以不同的程度隶属于不同的类。,类的概率满足,11,区分学习类型的标准:先验知识,在有监督和无监督模式学习中,系统都不知道 它们的区别在于是否有先验知识以及学习系统如何利用,贝叶斯学习中用到了指示器函数,是有监督的学习,噪声随机竞争学习律:,没有使用类成员信息校正突触矢量,是非监督学习,监督随机竞争学习律:,采用增强函数,奖励正确的模式分类1,惩罚错误的模式分类为1。,是有监督模式学习,。,12,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!