深度学习科普和实战肖达

资源描述

深度学习科普和实战肖达 Agenda A two minutes tour of DL fundamentals DL in Action with GPU/Theano/Pylearn2 Deep Learning in a Nutshell深度学习管窥对黑盒子的限定深度：多层非线性信息处理 Input = L1 = L2 = = Ln = Output 学习：内部结构通过学习涌现原始数据对数据的理解（表示）和判断（分类）机器学习与特征表示每层从上层输出中提取特征从原始数据直到分类器，各层结构基本相同所有层的特征都用数据训练得到层次特征学习 Layer 1 Layer 2 Layer 3 Simple Classifierdata 人工设计特征提取可训练分类器图像 /视频 /语音目标分类以监督学习为例，假设我们有训练样本集 (xi, yi)，神经网络算法能够提供一种非线性的假设模型 hw,b(x)，它具有参数 W,b ，以此拟合数据这个 “ 神经元 ” 是一个以 x1,x2,x3及截距 +1为输入值的运算单元，其输出为函数被称为 “ 激活函数 ”这里我们选用 sigmoid函数作为激活函数单个神经元 & 逻辑回归（ LR）神经网络就是将许多个单一 “ 神经元 ” 联结在一起下图神经网络的参数为：神经网络 Rumelhart et al. Nature, 1986 8 反向传播算法（ Back-Prop） xWfa )1( aWh 2softmax 计算每个样本的损失函数（实际输出与预期输出的差别）对各参数的梯度应用链式求导法则 hJ loghJ )2()2( WhhJWJ ahhJaJ )1()1( WaahhJWJ 学习过程 1、前向传播激励响应 2、和目标比较得到损失 3、反向传播修正权重数据获取问题训练依赖有标签数据，通常是稀缺的局部极值问题多层非线性 -求解一个高度非凸的优化问题，非常容易陷入很坏的局部最小梯度弥散问题当深度较深时，梯度传到前面的时候严重衰减，前几层不能有效训练，训练速度很慢训练深层神经网络的问题 Agenda A two minutes tour of DL fundamentals DL in Action with GPU/Theano/Pylearn2 What you need An off-the-shelf PC with 650w+ power supply A GPU (GTX 580/780/Titan) Get familiar with Linux, Python and Numpy Total cost 14.5% A new model in 11 lines of codeclass Hypercolumn(Maxout): def _init_(self, hcol_size, *kwargs): super(Hypercolumn, self)._init_(*kwargs) self.hcol_size = hcol_size def fprop(self, state_below): p = super(Hypercolumn, self).fprop(state_below) w = p.reshape(p.shape0, p.shape1 / self.hcol_size, self.hcol_size) hcol_max = w.max(axis=2).dimshuffle(0, 1, x) * T.ones_like(w) w = w * (w = hcol_max) w = w.reshape(p.shape0, p.shape1) return w Discussion

展开阅读全文

深度学习科普和实战 肖达

最新文档

深度学习科普和实战肖达