多层神经网络MLP快速入门.ppt

资源描述

神经网络学习交流报告目录CONTENTE 神经元模型 1 感知机与多层神经网络 2 应用一 MLP分类器 3 应用二 MLP的3D可视化 4 神经元模型人工神经网络 ann 是一种计算模型启发自人类大脑处理信息的生物神经网络人工神经网络在语音识别计算机视觉和自然语言理领域取得了一系列突破让机器学习研究和产业兴奋了起来神经网络 neuralnetworks 方面的研究很早就已经出现今天神经网络已是一个相当大的多学科交叉的学科领域神经网络中最基本的成分是神经元 neuron 模型一般称作节点 node 或者单元 unit 节点从其他节点接收输入或者从外部源接收输入然后计算输出每个输入都辅有权重 weight 即w 权重取决于其他输入的相对重要性节点将函数f 定义如下应用到加权后的输入总和如图1所示神经元模型还有配有权重b 称为偏置 bias 或者阈值 threshold 的输入1 神经元模型函数f是非线性的叫做激活函数激活函数的作用是将非线性引入神经元的输出因为大多数现实世界的数据都是非线性的我们希望神经元能够学习非线性的函数表示所以这种应用至关重要每个非线性激活函数都接收一个数字并进行特定固定的数学计算在实践中可能会碰到几种激活函数 Sigmoid S型激活函数输入一个实值输出一个0至1间的值 x 1 1 exp x tanh 双曲正切函数输入一个实值输出一个 1 1 间的值tanh x 2 2x 1ReLU ReLU代表修正线性单元输出一个实值并设定0的阈值函数会将负值变为零 f x max 0 x 神经元模型将上述情形抽象就是一直沿用至今的 M P 神经元模型在这个模型中神经元收到来自n个其他神经元传递来的输入信号这些输入信号通过带权重 w 连接进行传递神经元接收到的输入值将与神经元的阈值进行比较然后通过激活函数得到神经元的输出感知机与多层神经网络前馈神经网络是最先发明也是最简单的人工神经网络它包含了安排在多个层中的多个神经元节点相邻层的节点有连接或者边 edge 所有的连接都配有权重感知机与多层神经网络一个前馈神经网络可以包含三种节点 1 输入节点输入节点从外部世界提供信息总称为输入层在输入节点中不进行任何的计算仅向隐藏节点传递信息 2 隐藏节点隐藏节点和外部世界没有直接联系由此得名这些节点进行计算并将信息从输入节点传递到输出节点隐藏节点总称为隐藏层尽管一个前馈神经网络只有一个输入层和一个输出层但网络里可以没有也可以有多个隐藏层 3 输出节点输出节点总称为输出层负责计算并从网络向外部世界传递信息在前馈网络中信息只单向移动从输入层开始前向移动然后通过隐藏层如果有的话再到输出层在网络中没有循环或回路前馈神经网络的这个属性和递归神经网络不同后者的节点连接构成循环感知机与多层神经网络多层感知器 MultiLayerPerceptron 即MLP 包括至少一个隐藏层除了一个输入层和一个输出层以外单层感知器只能学习线性函数而多层感知器也可以学习非线性函数感知机与多层神经网络训练我们的多层感知器BP算法 backpropagation 反向传播误差算法是几种训练人工神经网络的方法之一这是一种监督学习方法即通过标记的训练数据来学习有监督者来引导学习由前向传播和后向传播构成简单说来 BackProp就像从错误中学习监督者在人工神经网络犯错误时进行纠正学习的目的是为分配正确的权重通过输入向量这些权重可以决定输出向量前向传播最初所有的边权重 edgeweight 都是随机分配的对于所有训练数据集中的输入人工神经网络都被激活并且观察其输出后向传播这些输出会和我们已知的期望的输出进行比较误差会传播回上一层该误差会被标注权重也会被相应的调整该流程重复直到输出误差低于制定的标准感知机与多层神经网络上述算法结束后我们就得到了一个学习过的人工神经网络该网络被认为是可以接受新输入的该人工神经网络可以说从几个样本标注数据和其错误误差传播中得到了学习然后我们看一个案例感知机与多层神经网络我们通常在感知器的输出层中使用Softmax函数作为激活函数以保证输出的是概率并且相加等于1 Softmax函数接收一个随机实值的分数向量转化成多个介于0和1之间并且总和为1的多个向量值所以在这个例子中概率 Pass 概率 Fail 1 感知机与多层神经网络感知机与多层神经网络如果我们现在再次向网络输入同样的样本网络应该比之前有更好的表现因为为了最小化误差已经调整了权重如图7所示和之前的 0 6 0 4 相比输出节点的误差已经减少到了 0 2 0 2 这意味着我们的网络已经学习了如何正确对第一个训练样本进行分类应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用一 MLP分类器应用二 MLP的3D可视化 AdamHarley创造了一个多层感知器的3D可视化 http scs ryerson ca aharley vis fc 并已经开始使用MNIST数据库手写的数字进行训练此网络从一个28x28的手写数字图像接受784个数字像素值作为输入在输入层有对应的784个节点网络的第一个隐藏层有300个节点第二个隐藏层有100个节点输出层有10个节点对应10个数字虽然这个网络跟我们刚才讨论的相比大了很多使用了更多的隐藏层和节点所有前向传播和反向传播步骤的计算对于每个节点而言方式都是一样的应用二 MLP的3D可视化应用二 MLP的3D可视化应用二 MLP的3D可视化应用二 MLP的3D可视化应用二 MLP的3D可视化 THANKSFORWATCHING 完

展开阅读全文