资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2016/11/6,#,深度学习综述,报,时间,:2016.11.,深度学习综述报,1,深度学习是什么?,深度学习,的概念源于,人工神经网络,的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。,1,深度学习是,机器学习,领域中对模式(声音、图像等等)进行建模的一种方法,它也是一种基于统计的概率模型。在对各种模式进行建模之后,便可以对各种模式进行识别了,例如待建模的模式是声音的话,那么这种识别便可以理解为语音识别,(,RNN Hinton3 2013,),。,深度学习是什么?深度学习的概念源于人工神经网络的研究。含多隐,2,概念入门,深度学习,神经网络的发展,神经网络,(上世纪五六十年代),深度神经网络,(,Hinton2 2006,),卷积神经网络,(,AlexNet1 2021,),基于深度学习的目标检测进展,概念入门深度学习,3,一、神经网络,的,发展,感知机的出现,神经网络技术起源于上世纪五、六十年代,当时叫感知机(,perceptron,),拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。早期感知机对于计算稍微复杂的函数其计算力显得无能为力。,多层感知机,多层感知机可以摆脱早期离散传输函数的束缚,使用,sigmoid,或,tanh,等连续函数模拟神经元对激励的响应,在训练,算法,上则使用反向传播,BP,算法。对,这就是我们现在所说的,神经网络,(,NN,),!,一、神经网络的发展感知机的出现多层感知机可以摆脱早期离散传输,4,激活函数,激活函数,5,构成:由“神经元”构成,输入、偏置节点、激活函数、,输出,这个“神经元”是一个以 及截距 为输入值的运算单元,其输出,为 ,其中函数 为激活函数,前向参数计算:,构成:由“神经元”构成这个“神经元”是一个以,6,反向传播,损失函数:,我们的目标是针对参数,W,和,b,,来求函数,J(W,b),最小值,梯度下降法中每一次迭代都按照如下公式对参数,是学习率,反向传播,7,二、卷积神经网络,1,、卷积神经网络,二、卷积神经网络1、卷积神经网络,8,二、卷积神经网络,卷积操作,AlexNet1,二、卷积神经网络卷积操作AlexNet1,9,二、卷积神经网络,与传统视觉算法区别:,二、卷积神经网络与传统视觉算法区别:,10,二、卷积神经网络,二、卷积神经网络,11,二、卷积神经网络,主要应用:,图像分类,二、卷积神经网络主要应用:,12,三、基于深度学习的目标检测,目标检测?,其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。,三、基于深度学习的目标检测目标检测?其实刚刚的这个过程就是目,13,传统的,object proposal,方法,What makes for effective detection proposals,?,4,传统的 object proposal 方法What mak,14,三、基于深度学习的目标检测,检测,SelectiveSearch,DL:faster-rcnn,适应不同尺度,多样化,RPN+CNN,三、基于深度学习的目标检测检测SelectiveSear,15,传统目标检测方法,区域选择,采用滑动窗口的策略对整幅图像进行,遍历,而且需要设置不同的尺度,不同的长宽比。,特征提取,这个阶段常用的特征有,SIFT,、,HOG,等,分类器,SVM,、,Adaboost,传统目标检测存在的两个主要问题:,一个是基于滑动窗口的区域选择策略没有,针对性,时间复杂度高,窗口冗余;,二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。,传统目标检测方法区域选择,16,三、基于深度学习的目标检测,Faster-rcnn(,Towards Real-Time Object Detection with Region Proposal Networks),5,),网络结构:,在,region proposal+CNN,分类,的这种目标检测框架中,,region proposal,质量好坏,直接影响到目标检测任务的,精度。,三、基于深度学习的目标检测Faster-rcnn(Towa,17,Faster-rcnn,Region Proposal Networks(RPN),3*3,滑窗对应的每个特征区域同时预测输入图像,3,种尺度(,128,256,512,),,3,种长宽比,(,1:1,1:2,2:1,)的,region proposal,,这种映射的机制称为,anchor,。所以对于这个,40*60,的,feature map,,总共有约,20000(40*60*9),个,anchor,,也就是预测,20000,个,region proposal.,Faster-rcnn3*3滑窗对应的每个特征区域同时预测输,18,Faster-rcnn,RPN,的核心思想是使用卷积神经网络直接产生,region proposal,,使用的方法本质上就是滑动窗口。,RPN,的设计比较巧妙,,RPN,只需在最后的卷积层上滑动一遍,因为,anchor,机制和边框回归可以得到多尺度多长宽比的,region proposal,。,Modify,机制,NMS,(,Non-maximum suppression,)非极大值抑制,消除多余的,bounding box,找到最佳的物体检测位置,NMS,Faster-rcnnRPN的核心思想是使用卷积神经网络直接,19,Intersection-over-union,(,IOU,),Intersection-over-union(IOU),20,Faster-rcnn,1,、网络结构一览(,caffe model,),2,、,Faster R-CNN,将一直以来分离的,region proposal,和,CNN,分类融合到了一起,使用端到端的网络进行目标检测,无论在速度上还是精度上都得到质的提高提高。,Faster-rcnn1、网络结构一览(caffe mod,21,四、基于深度学习的目标检测应用实例,四、基于深度学习的目标检测应用实例,22,个人经验,研究生生活正确的打开方式,研一,:研究什么,研二,:研究出点什么,研三,:科研与工作,个人经验研究生生活正确的打开方式,23,参考文献,1 Krizhevsky A,Sutskever I,Hinton G E.ImageNet Classification with Deep Convolutional Neural NetworksJ.Advances in Neural Information Processing Systems,2012,25(2):2012.,2,Hinton G E,Salakhutdinov R R.Reducing the Dimensionality of Data with Neural NetworksJ.Science,2006,313(5786):504-7.,3,Graves A,Mohamed A R,Hinton G.Speech recognition with deep recurrent neural networksJ.2013,1(2003):6645-6649.,4,Hosang J,Benenson R,Dollar P,et al.What makes for effective detection proposals?J.IEEE Transactions on Pattern Analysis&Machine Intelligence,2015,38(4):814-830.,5,Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time Object Detection with Region Proposal NetworksJ.IEEE Transactions on Pattern Analysis&Machine Intelligence,2016:1-1.,参考文献1 Krizhevsky A,Sutskeve,24,Thanks,Thanks,25,
展开阅读全文