人工智能现状与未来课件

上传人:文**** 文档编号:242759434 上传时间:2024-09-02 格式:PPT 页数:98 大小:11.99MB
返回 下载 相关 举报
人工智能现状与未来课件_第1页
第1页 / 共98页
人工智能现状与未来课件_第2页
第2页 / 共98页
人工智能现状与未来课件_第3页
第3页 / 共98页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*, , , , , , ,*,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*, , , , , , ,*,人工智能现状与未来,人工智能现状与未来,1,人工智能概述,第一节,深度学习与智能围棋,第二节,人工智能,3.0,第,三,节,目录,content,人工智能概述第一节深度学习与智能围棋第二节人工智能3.0第三,人工智能的新革命,第一节,人工智能简述,深度学习算法,知识图谱,人工智能的新革命第一节人工智能简述深度学习算法知识图谱,3,人工智能将引领人类第四次工业革命,智能化,时间,18,世纪末,工业,1、0,创造了机器工厂的,“蒸汽时代”,20,世纪初,电力广泛应用,蒸汽机,信息物联系统,1970,年代初,今天,工业,2、0,将人类带入分工明确、大批量生产的流水线模式与“电气时代”,工业,3、0,应用电子信息技术,进一步提高生产自动化水平,自动化、信息化,工业,4、0,开始应用信息物理融合系统(,CPS,),复,杂,度,悄悄,来临,互联网时代,正在,终结,人工智能,机器人,交通工具(即无人机、无人驾驶等),VR,(虚拟现实),人工智能将引领人类第四次工业革命 智能化时间18世纪末工,AI,将催生,“,无用阶层,”,不?,人工,/,脑力劳动:翻译、记者,、,人工,/,体力劳动:保安、保姆,、,AI将催生“无用阶层”不?人工/脑力劳动:翻译、记者、,什么是人工智能,(AI)?,全面实施战略性新兴产业发展规划,加快人工智能等技术的研发与转化,做大做强产业集群,把发展智能制造作为主攻方向,推进国家智能制造示范区、制造业创新中心建设,人工智能:国家战略,(2017,年政府工作报告,),人工智能(,Artificial Intelligence,),英文缩写为,AI,。它是研究、开发用于模拟、延伸与扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理与专家系统等。,人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样考虑、也估计超过人的智能。,什么是人工智能?,人工智能有那些类型?,弱人工智能,包含基础的、特定场景下角色型的任务,如,Siri,等聊天机器人与,AlphaGo,等下棋机器人;,通用人工智能,包含人类水平的任务,涉及机器的持续学习;,强人工智能,指比人类更聪明的机器;,什么是人工智能(AI)?全面实施战略性新兴产业发展规划,加快,1956,1974,1980,1987,1993,2006,AI,的诞生,1956,达特矛斯 会议,“人工智 能”正式诞生,孕育期,电子计算机 机器翻译与,NLP,图灵测试 计算机下棋 早期神经网络,搜索式推理,聊天机器人,乐观思潮,所有的,AI,程序 都只是“玩具”,运算能力,计算复杂性,常识与推理,专家系统,知识工程,五代机,神经网络重生,未达预期 削减投入,摩尔定律,统计机器学习,AI,广泛应用,大数据,计算能力,应用增多,深度学习,人工智能,2016,人工智能发展历程,195619741980198719932006AI的诞生孕,手机中的,AI,手机中的AI,人工智能相关技术刚刚越过曲线高峰(处于狂热期),是推动透明化身临其境体验技术发展的主要动力,涉及透明化身临其境体验的人本技术(如智能工作空间、互联家庭、增强现实、虚拟现实、脑机接口)是拉动另外两大趋势的前沿技术,数字平台在曲线上处于快速上升期,其中的量子计算与区块链将在今后,510,年带来变革性的影响,AI,处于什么时期?,人工智能相关技术刚刚越过曲线高峰(处于狂热期),是推动透明化,AI Roadmap,AI Roadmap,国人为什么要关注,AI,?,国人为什么要关注AI?,为什么人类能成为地球的主宰?,基因:人与大猩猩的基因,有,98、4%,都是完全一样的,只有,1、6%,有区别,“符号语言”,(口头语言与书面文字):传递、保存、共享知识,“集体知识”,:人类的大脑能够相互共享信息,交换知识,人类个体比其他动物没有多大优势,掌握了符号语言,人类社会的结构发生了突变,有了一个连接在一起的集体大脑。这种物种之间相互关联、相互作用的方式,才是我们与其他物种的真正区别,脑容量:历史上的“尼安德特人”与我们的祖先脑容量是一样的。但后来尼安德特人就没留下来,只有我们这一支留下来了,时间地图:大历史导论,知识与创新是推动人类发展的动力,为什么人类能成为地球的主宰?基因:人与大猩猩的基因,有98、,AI,学科结构,AI学科结构,AI,的几大门派,符号学派,联结学派,行为学派,神经网络,知识表示,机器人,模拟人的心智,模拟脑的结构,模拟人的行为,聪明的,AI,有学识的,AI,深度学习,知识图谱,感知,识别,判断,考虑,语言,推理,贝叶斯学派,进化学派,类推学派,AI的几大门派符号学派联结学派行为学派神经网络知识表示机器人,人工智能,产业生态的三层基本架构,基础资源层,:主要是,计算平台,和,数据中心,,属于计算智能;,技术层,:通过机器学习建模,开发面向不同领域的,算法,和,技术,,包含,感知智能,和,认知智能,;,应用层,:主要实现人工智能在不同场景下的应用。,基础资源支撑,AI,生态逐步形成:基础资源,+,技术,+,应用,人工智能产业生态的三层基本架构基础资源支撑AI生态逐步形成:,人工智能系统的技术架构,智能终端,智能云平台,人工智能系统的技术架构智能终端智能云平台,人工智能的新革命,第一节,人工智能简述,深度学习算法,知识图谱,人工智能的新革命第一节人工智能简述深度学习算法知识图谱,17,推理期,知识期,机器学习期,人工智能的三个研究时期,1950s,1970s,1980s,基于,符号,知识表示 通过演绎推理技术,基于,符号,知识表示 通过获取与利用领域知识 建立专家系统,神经网络第二个高潮,NP(non-deterministic polynomial-time),难题 中获重大进展 助力大量现实问题,神经网络,第一个高潮期,神经网络以深度学 习之名再次崛起 大幅提升感知智能 准确率,2017,90s,中期,统计学习登场并占据主流,支持向量机,、核方法为代表性技术,提出支持向量、,VC,维等概念,统计学的研究成果经由机器学习 研究,形成有效的学习算法,联结学派,对大脑进行逆向分析 灵感来自于神经科学与物理学 产生的是“黑箱”模型 神经网络可归置此类,符号学派,将学习看作逆向演绎 并从哲学、心理学、逻辑学中寻求洞见 代表包括决策树与基于逻辑的学习,机器学习,&,深度学习,从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,机器能够自动“学习”的算法,即,从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法,。目前,机器学习,=,“分类”,人工智能,机器学习,深度学习,推理期知识期机器学习期人工智能的三个研究时期1950s197,深度学习是使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法,深度学习是一种基于对数据进行表征学习的方法。观测值(例如一幅图像)能够使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习与分层特征提取高效算法来替代手工获取特征,用数据优化计算机程序的模型参数,通过经验自动改进的计算机算法,深度学习算法简介:机器学习,机器学习的基本定理,模型的出错率 ,推论:,模型复杂,-,大样本,样本小,-,简化模型,Class label,(Classification),Vector,(Estimation),深度学习是使用包含复杂结构或由多重非线性变换构成的多个处理层,机器学习实施过程,特征提取,特征,1,样本数据,样本数据,样本数据,n,预处理,特征样本集,原始样本集,机器学习算法,训练,预测,输出,验证集,评价,目标,特征,1,n,目标,特征,1,n,目标,特征,1,n,训练集,目标,特征,1,n,目标,特征,1,n,目标,特征,1,n,验证集,目标,特征,1,n,目标,特征,1,n,目标,预测目标,预测目标,预测目标,改进,机器学习实施过程特征提取特征1样本数据样本数据样本数据n预,特征提取,特征提取,特征,1,样本数据,样本数据,样本数据,n,特征样本集,原始样本集,目标,特征,1,n,目标,特征,1,n,目标,统计分析,变换,特征运算,特征提取特征提取特征1样本数据样本数据样本数据n特征样本集,特征选取是成败的关键,人脑是通过分级的、多层网络模型来识别,减少数据量,保留物体的有用信息,低层信息,预处理,特征提取,识别分类,对效果影响极大,手动化特征工程,特别耗时,图像识别的一般流程,人脑识别图像的过程,特征选取是成败的关键人脑是通过分级的、多层网络模型来识别低层,第一个模型是一个线性模型,低度拟合,不能特别好地习惯训练集;第三个模型是一个四次方的模型,过度拟合,尽管能特别好地习惯我们的训练集,但在新输入变量进行预测时估计会效果不行;中间的模型好像最合适,经过算法预测的结果是一个连续的值,我们称如此的问题为回归问题。,算法能够学会如何将数据分类到不同的类里,我们称如此的问题为分类问题。,深度学习算法简介:数学基础,第一个模型是一个线性模型,低度拟合,不能特别好地习惯训练集;,当感知器用于两类模式的分类时,相当于在高维样本空间中,用一个超平面将两类样本分开,神经网络的学习过程就是神经网络参数的设定过程,一个神经元网络结构确定之后,需要对一系列参数(权重、阈值等)进行有效的设定。这个过程叫做学习或训练过程,此时的方法叫学习算法,是一个由线性阈值元件组成的单层(或多层)神经元的神经网络,当输入的加权与大于或等于阈值时,输出为,1,否则为,0,模型假定神经元中间的耦合程度(即加权系数,W,)可变,如此,该模型能够学习,深度学习算法简介:感知器,当感知器用于两类模式的分类时,相当于在高维样本空间中,用一个,监督学习,通过已有的,训练样本(即已知数据以及其对应的输出)训练,得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,从而也就具有了对未知数据进行分类的能力,各种神经网络类型,Logistic,RBM,Auto Encoder,Sparse Coding,Convolutional,(卷积),强化学习,类似人类与环境交互的方式,智能系统从环境到行为映射的学习,以使奖励信号函数值最大。,环境对产生动作的好坏通过奖励信号作评价,,而不是告诉强化学习系统如何去产生正确的动作。,强化学习不能立即得到标记,而只能得到一个反馈,,因此可以说强化学习是一种具有“延迟标记信息”的监督学习,典型案例,:,AlphaGo,深度学习的训练方法,2006,年,Geoffrey Hinton,在,科学,上发表论文提出深度学习主要观点:,多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类,深度神经网络在训练上的难度,能够通过“逐层初始化”(,layer-wise pre-training,)来有效克服,逐层初始化可通过无监督学习实现的,在著名的,ImageNet,问题上将错误率从,26,降低到了,15,同时输入没有用到其他任何人工特征,仅仅是图像的像素,迁移学习,将从拥有大数据的源领域上学习到的东西应用到仅有小数据的目标领域上去,实现个性化迁移,即举一反三、触类旁通。,典型案例,:斯坦福学者使用卫星图像获取的灯光信息来分析非洲大陆的贫穷情况,监督学习通过已有的训练样本(即已知数据以及其对应的输出)训练,深度学习的神经网络训练方法,LeNet-5,:卷积神经网络手写数字识别的应用,卷积过程包括:用一个可训练的滤波器,fx,去卷积一个输入的图像,然后加一个偏置,bx,,得到卷积层,Cx,。,子采样过程包括:每邻域四个像素求和变为一个像素,加权再增加偏置,通过一个激活函数,产生一个缩小四倍的特征映射图,C1,层:,输入图片大小:,32,*,32,卷积窗大小:,5,*,5,卷积窗种类:,6,输出特征图数量:,6,输出特征图大小:,28,*,28(32-5+1),神经元数量:,4707 (28,*,28),*,6),连接数:,12304 (5,*,5+1),*,6,*,(28*28),可训练参数:,156 (5*5+1)*6,深度学习的神经网络训练方法LeNet-5:卷积神经网络手写数,人工智能现状与未来课件,27,局部感受,-,卷积,FeatureMap,局部感受 - 卷积FeatureMap,池化,原理:依照图像局部相关的原理,图像某个邻域内只需要一个像素点就能表达整个区域的信息,常见的方法:,最大值池化(max-pooling),L2,池化(L2 pooling),均值池化(Mean Pooling),池化原理:依照图像局部相关的原理,图像某个邻域内只需要一个像,LeNet-5,Yann Lecun,1989年用美国邮政系统提供的近万个手写数字的样本来,训练,神经网络系统,在独立的测试样本中,错误率只有5%,进一步运用CNN,开发出LeNet-5用于读取银行支票上的手写数字,这个支票识别系统在九十年代末占据了美国接近20%的市场,LeNet-5Yann Lecun,1989年用美国邮政系统,深度学习的训练方法,Hinton in ImageNet,比赛,140,万图像,1000,类,图库,1000,万图像,20000,类,7,层,CNN,准确率,74%-85%,深度学习的训练方法Hinton in ImageNet,深度学习的成功应用,AlphaGo,战胜李世乭,图像识别全面超越人类,语音识别接近人类,将声学模型中混合高斯模型替换为,DNN,模型,获得,30%+,相对提升,Tesla Autopilot,投入商用,Google Translate,投入商用,它把原文例如中文词先翻成一个词向量,变成一个数字向量。,它对这个词向量再编辑,变成一个语义表示的方式。,再把它翻译成它的目标语言,例如英文。,深度学习的成功应用AlphaGo战胜李世乭,人工智能的新革命,第一节,人工智能简述,深度学习算法,知识图谱,人工智能的新革命第一节人工智能简述深度学习算法知识图谱,33,知识图谱,(Knowledge Graph),知识图谱,旨在描述真实世界中存在的各种实体或概念,及其关系,一般用三元组表示,知识图谱亦可被看作是一张巨大的图,节点表示实体或概念,边则由属性或关系构成,中国,国家,美国,日本,英国,北京,9,634,057,平方公里,13.5404,亿,2069.3,万,北纬,3856,东经,11620,3.1525,亿,华盛顿,9,629,091,平方公里,北纬,3853,西经,7702,178,平方公里,16410,平方公里,1.26,亿,377835,平方公里,东京,2188,平方公里,东经,14050,北纬,3544,面积,人口,首都,纬度,经度,面积,人口,知识图谱(Knowledge Graph)知识图谱旨在描述真,知识图谱构建,Web,字典,术语表,百科,书本,知,识,获,取,+,+,已有知识库,知,识,融,合,知,识,验,证,知识图谱,名称,规模,Yago,1,千万实体,35,万类别,1、8,亿事实,100,种属性,100,语言,Dbpedia,4,千万实体,250,类别,5,亿事实,6000,种属性,Freebase,2,千,5,百万实体,2000,主题,1,亿事实,4000,种属性,谷歌知识图谱,5,亿实体名字,35,亿条事实,NELL,3,百万实体名字,300,类别,500,属性,100,万事实,1,千,5,百万学习规则,知识图谱构建Web字典, 术语表, 知+已有知识库知知知识,基于人工规则的语义理解,神话是孙楠与谁合唱的?,文法,解析,知识库,查询,SPARQL,查询语句生成,答案生成,孙楠与韩红合唱了神话,韩红,歌手,6,万,歌曲,260,万,专辑,44,万,标签,2000,类,param:singer,孙楠,#param:song,神话,#predicate:chorusWith,神话是孙楠与谁合唱的,查询神话这首歌曲的演唱者,演唱者要包括孙楠,输出还包括的另外一个演唱者,文法,规则,模板,歌手,6,万,歌曲,260,万,专辑,44,万,标签,2000,类,下载,融合,基于人工规则的语义理解神话是孙楠与谁合唱的?文法知识库SPA,知识图谱的成功应用:现代搜索引擎,半结构化信息抽取,半结构化数据,结构化数据,文本数据,实体对齐,推理补充数据,异构数据整合,重要度计算,实体抽取属性抽取,属性值决策,关系建立,知立方数据,本体,生成系统,索引生成,检索系统,实体识别,本体库,Pattern,挖掘,标签消岐,SPARQL,查询语句,排序,推理,推荐,统计,Query,检索系统,索引生成,知识图谱的成功应用:现代搜索引擎半结构化信息抽取半结构化数据,面向知识图谱的,Sogou,搜索技术,面向知识图谱的Sogou搜索技术,Gene,Ontology,LOD,企业对知识图谱依照内部数据有大量的业务需求,从两方面来建设知识图谱体系,:,知识实体,算法,企业知识图谱的建立,Gene OntologyLOD企业对知识图谱依照内部数据,语义理解,智能检索与问答,数据关联探索,业务动态扩展,非结构化数据计算机难以理解,数据使用专业程度过高,多元异构数据难以融合,数据模式动态变迁困难,结构化数据,数据融合,自由扩展数据模式,行业智能问答,业务需求,技术方案,数据挑战,知识图谱助力企业商业智能,语义理解智能检索与问答数据关联探索业务动态扩展非结构化数据计,通用知识图谱,+,行业知识图谱,通用知识图谱的广度,行业知识图谱的深度,相互补充,形成更加完善的知识图谱,通用知识图谱中的知识,能够作为行业知识图谱构建的基础;而构建的行业知识图谱,再融合到通用知识图谱中,通用知识图谱,行业知识图谱,通用知,识图谱,创投,专利,通用知识图谱 + 行业知识图谱 通用知识图谱的广度,行业知识,深度学习与智能围棋,第二节,从,AlphaGo Lee/Master,讲起,蒙特卡洛树式搜索,AlphaGo,的实现原理,AlphaGo Zero,深度学习与智能围棋第二节从AlphaGo Lee/Maste,42,01,人机大战:深度学习算法的标志性成果,最复杂(注:状态复杂度与博弈复杂度)的智力游戏:看似简单,实为复杂,具有,10,的,170,次方状态复杂空间,涉及逻辑推理,形象思维,优化选择等多种人类智能(注:国际象棋只有逻辑推理,没有形象思维),02,接近人类,公认是人工智能领域长期以来的重大挑战,03,标志性,国际学术界曾经普遍认为解决围棋问题需要,15-20,年时间,04,挑战,为什么做围棋,AI,?,01人机大战:深度学习算法的标志性成果最复杂(注:状态复杂度,创新性,投入力度,业内龙头,目前技术优势:起步早,算法新,技术强,资源雄厚,最近一年专注于强化学习研究,拟于近期公布新论文与数据,并从此退出围棋,AI,领域,Google Deepmind,简介,创新性投入力度业内龙头 目前技术优势:起步早,算法新,技术,人工智能现状与未来课件,45,深度学习与智能围棋,第二节,从,AlphaGo Lee/Master,讲起,蒙特卡洛树式搜索,AlphaGo,的实现原理,AlphaGo Zero,深度学习与智能围棋第二节从AlphaGo Lee/Maste,46,传统围棋,AI,算法,MCTS,(蒙特卡洛树搜索),双人,一人一步,双方信息完备(棋类,完全信息,牌类,不完全信息),零与,动态博弈问题,计算机下棋,棋类要素的数字化,恰当的数据结构,棋盘、棋子、棋规(着法规则,胜负规则),用着法推演局面,博弈树展开,从有利局面选择当前着法,博弈搜索,局面评估,指标定义与综合,传统围棋AI算法 MCTS (蒙特卡洛树搜索)双人动态博,展开深度为,4,的博弈树,本方,本方,本方,对方,对方,Ply 1,Ply 3,Ply 4,Ply 2,Ply 0,根节点为当前局面,叶节点为展开终点,双方轮流出手,偶数层为本方,奇数层为对方,展开深度为4的博弈树 本方本方本方对方对方Ply 1Ply,围棋落子蒙特卡洛数学模型及评估,围棋对弈过程能够看做一个马尔科夫过程:,五元组:,T,S,A(i),P(|i,a),r(i,a),T,:决策时刻,S,:状态空间,S=i,A(i),:可行动集合(可落子点),P(|i,a),:状态,i,下选择行动,a,的概率,r(i,a),:状态,i,下选择行动,a,后课获得的收益,从当前局面的所有可落子点中随机(或者给胜率高的点分配更多的计算力)选择一个点落子,重复以上过程,直到胜负可判断为止,经多次模拟后(计算越多越精确),选择胜率最大的点落子,围棋落子蒙特卡洛数学模型及评估围棋对弈过程能够看做一个马尔科,传统围棋,AI,算法,数学模型,MCTS,(蒙特卡洛树搜索),基本思想与特点:,-,将估计出现的状态转移过程用状态树表示,-,从初始状态开始重复抽样,逐步扩展树中的节点,-,某个状态再次被访问时,能够利用已有的结果,提高了效率,-,在抽样过程中能够随时得到行为的评价,选择,-,从根节点出发自上而下地选择一个落子点,扩展,-,向选定的点添加一个或多个子节点,模拟,-,对扩展出的节点用蒙特卡洛方法进行模拟,回溯,-,依照模拟结果依次向上更新祖先节点估计值,传统围棋AI算法 数学模型 MCTS (蒙特卡洛树搜索),深度学习与智能围棋,第二节,从,AlphaGo Lee/Master,讲起,蒙特卡洛树式搜索,AlphaGo,的实现原理,AlphaGo Zero,深度学习与智能围棋第二节从AlphaGo Lee/Maste,51,13,个卷积层,每层,192,个卷积核,每个卷积核,3*3,,参数个数,800,万,+,GPU 3ms/,步,预测准确率,57%,Policy,Network,(策略网络),在每个分支节点直接判断形势,与,Rollout,随机模拟相结合,互为补充,Value Network,(价值网络),给胜率高的点分配更多的计算力,任意时间算法,计算越多越精确,1,、选取,2,、展开,3,、评估,4,、倒传,MCTS,(蒙特卡洛树搜索),通过随机模拟走子胜率来判定形势,速度很快(,1ms/,盘),随机性与合理性的平衡,Rollout,(随机模拟走子),AlphaGo,的实现原理,控制宽度(,250,),控制深度,(,150,),基本算法,快速模拟,围棋是完全信息博弈,从理论上来说能够通过暴力搜索所有估计的对弈过程来确定最优的走法,13个卷积层,每层192个卷积核,每个卷积核3*3,参数个数,Policy Network,策略网络:落子棋感,深度神经网络的有监督学习,目标是获得在围棋盘面下的落子棋感,学习职业棋手与业余高段棋手的棋谱(数十万份棋谱,上亿数量级的落子方式),把当前局面作为输入,预测下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有估计的下一着给一个分数,用,Policy Network,作为第一感,将计算力分配到最有希望的选点,分枝数从上百个减少到几个,优先计算,PolicyNetwork,分数高的点,计算力充沛时,适当分配到其他分值较低的点,Policy Network策略网络:落子棋感深度神经网络的,PolicyNetwork,输入特征,3,224,2,48,55,2,128,27,2,192,13,2,192,13,2,128,13,2,2048,2048,2048,2048,192,3,2,192,3,2,128,3,2,48,5,2,3,11,2,192,3,2,192,3,2,192,13,2,192,13,2,128,13,2,128,27,2,48,5,2,48,55,2,128,3,2,1000,局部感知域,权重共享,特征训练,卷积层,+,池化层,模型结构,13,个卷积层,每层,192,个,3,*,3,卷积核,数百万个参数,训练数据,KGS 6d,以上对局,17,万,职业对局,8,万。,训练数据量,5000,万,+,训练时间几十天,运算速度,GPU,3ms,预测准确率,57%,PolicyNetwork输入特征3224248552,左右互博,自我进化,Agent,通过与环境,s,的交互,选择下一步的动作,a,这个动作会影响环境,s,给,Agent,一个,reward,Agent,然后接着与环境交互。 依照游戏结果迭代更新转移概率与评估函数,神经网络结构与策略网络相同,训练方法:自我对局,目标:校正价值导向,将策略网络权值作为初始值,自我对弈更新权值,从而提升棋力,Pros:,棋艺更高,(win 80% of the games with SL policy network),Cons:,走法集中,不习惯,MCTS,多搜索范围的需求,强化学习,(RL),左右互博,自我进化Agent通过与环境s的交互,选择下一步的,Fast-Rollout,快速走子,Rollout,(随机模拟走子),通过随机模拟走子胜率来判定形势,速度快,随机性,合理性的平衡,原因:,1、,策略网络的运行速度较慢,(3ms),快速走子在,2us,2、,用来评估盘面。,在同等时间下,模拟走子速度快乃至使用随机走子,尽管单次估值精度低,但能够多模拟几次算平均值,效果未必不行。提升棋力,结构:局部特征匹配,+,线性回归,特征:围棋专业知识,Fast-Rollout 快速走子Rollout(随机模拟走,Value Network,:胜负棋感,深度神经网络的增强型学习(,DeepMind,独创,),通过自我博弈,学习不同盘面下的胜负情况(三千万盘自我对局),获取在围棋盘面的胜负棋感(,注:对每一个落子点给一个当时的快速的胜负感(估算),这个胜负估算并不是依照分析计算出来的,而是直觉,)(,通过,AlphaGo,几千万盘的训练学习得来的,),形势判断:,-1,:白棋必胜,0,:黑棋优势,1,:黑棋必胜,Value Network:胜负棋感深度神经网络的增强型学习,Value Network,模型,模型结构,13,个卷积层,每层,192,个卷积核,每个卷积核,3,*,3,数百万个参数,训练数据,Policy Network,自我对弈棋谱。,3000,万,+,特定盘面,+,胜负结果,训练时间几十天,运算速度,GPU,3ms,方法:,在每个分支节点,使用,Value Network,直截了当判断形势,与,Rollout,随机模拟相结合,互为补充,效果:,职业水平,AlphaGo,Value Network 模型模型结构,MCTS,在对局中实时搜索,Step 1,:基于策略网络落子,估计性大的落子拓展节点,Step 2,:对未来走势进行评估,同时使用估值网络与快速走子,综合两者预测未来走法,Step 3,:评估结果作为下一步走法的,Q,值。重新模拟。,Step 4,:结合下一步走法的,Q,值与策略网络进行再一次模拟。假如出现同样走法,Q,值起平均。新分数,=,调整后的初始分,+ 0、5 *,通过模拟(策略网络,+,快速走棋,),得到的赢棋概率,+ 0、5 *,估值网络的局面评估分,Step 5,:反复循环直到,n,次,或者,timeout,选择被选择次数最多的走法作为下一步,Put-Together,Put-Together,59,深度学习与智能围棋,第二节,从,AlphaGo Lee/Master,讲起,蒙特卡洛树式搜索,AlphaGo,的实现原理,AlphaGo Zero,深度学习与智能围棋第二节从AlphaGo Lee/Maste,60,AlphaGo Zero,第,3,天,下了,490,万局棋,打败老大,老三战绩,老三学棋过程,刚开始,随机下子,热衷于吃子,完全不顾死活,发现了假如先占住棋盘的边与角,后面占廉价,学会了如何打劫、征子,明白得看棋形,第,21,天,败了老二,第,40,天,完整走过了一个人类棋手学棋的全过程,棋盘,/,黑子,/,白子,棋子被围起来就死,规则,棋士柯洁,10,月,19,日,02:22,一个纯净、纯粹自我学习的,AlphaGo,是最强的,、,关于,AlphaGo,的自我进步来讲,、,人类太多余了,老大,AlphaGo Lee,2016,年,3,月,4:1,打败韩国棋手李世石,老二,AlphaGo Master,2017,年,5,月,3:0,打败中国棋手柯洁,老三,AlphaGo Zero,2017,年,10,月宣布 自学围棋,40,天,打败所有人,AlphaGo Zero第3天,下了490万局棋,打败老大老,AlphaGo Zero,解析,人类经验由于样本空间大小的限制,往往都收敛于局部最优而不自知(或无法发现),阿法元不再被人类认知所局限,而能够发现新知识,发展新策略,区别,1,:特征提取层采纳,40,个残差模块,每个模块包含,2,个卷积层。运用残差模块提升了网络深度,更深的网络能更有效地直截了当从棋盘上提取特征,区别,2,:同时训练走子策略,(policy),网络 与胜率值,(value),网络,启发,深度学习训练过程需要消耗大量人类标注样本,而这关于小样本应用领域,(,比如医疗图像处理,),是不估计办到的。因此减少样本与人类标注的方法特别重要,开局与收官与专业棋手的下法并无区别,然而中盘难于理解;机器经验与人类经验有特别大差别,我们又该如何去选择与利用呢?,AlphaGo Zero解析人类经验由于样本空间大小的限制,62,智能围棋与蒙特卡洛树搜索,没有棋感直觉不行,完全依赖棋感直觉也不行,直觉需要通过严格的数学模型与计算方法,对棋感直觉进行验证,AlphaGo,使用蒙特卡洛树搜索,对落子棋感与胜负感进行计算验证。,蒙特卡洛树搜索:搜索验证,基于数学期望的胜负评估模型(胜率),基于蒙特卡洛模拟进行胜负结果采样(模拟采样比直觉更可靠),依照模拟采样结果验证盘面胜负的数学期望,可靠程度与采样规模相关(采样越大,离真理会更近些),蒙特卡洛模拟采样:胜负棋感验证,智能围棋与蒙特卡洛树搜索没有棋感直觉不行,完全依赖棋感直觉也,智能围棋与神经网络,谷歌的,AlphaGo,是深度学习算法的标志性成果;,深度卷积神经网络,(Deep Convolutional Neural Network,DCNN),是近年发展起来,并引起广泛重视的一种高效识别方法。,围棋算法具有高度的复杂性与代表性(,10,808,两个,30,年)。由于天文数字的状态空间与搜索空间,蛮力计算无法解决围棋问题(注:解决国际象棋的,IBM,深蓝是用蛮力方法,就是靠计算,这种方法在围棋这么大的计算与搜索空间是无法进行的),从围棋算法能够推广到深度学习应用的一般情形。,围棋职业棋手的解决方法:棋感直觉,+,搜索验证,AlphaGo,的核心方法完全类似于完全职业棋手的解决方法,AlphaGo,的优势:完全以胜率为目标,不受任何其它因素影响,智能围棋与神经网络谷歌的AlphaGo是深度学习算法的标志性,直觉:不经过考虑过程,特别快就能出现的直截了当想法、感受、信念或者偏好(这个特别重要,其强大的力量。如:落子的直觉,胜负的直觉、棋盘的直觉、棋形的直觉),通过深度神经网络与大数据的训练而获得,人工智能的核心方法:直觉获取,验证:为直觉建立真实性、准确性与可靠性的检验过程,验证是核实直觉不存在偏差的一个充分条件,由于廉价并行计算与大数据的支持,直觉能够通过搜索计算来验证,人工智能的核心方法:搜索验证,人类生活面临一系列的抉择问题(注:有了直觉与验证就能够找一个最好的),A、,手里的股票是持有依然抛售,B、,驾驶员到交通灯前是左拐依然右拐,直觉获取与搜索验证的结合使用,能够提供优化选择,人工智能的核心方法:优化选择,直觉:不经过考虑过程,特别快就能出现的直截了当想法、感受、信,65,人工智能,3.0,第,三,节,AI,技术的新特征,AI,走向,3、0,认知计算,AI3、0,面对的挑战,人工智能3.0第三节AI技术的新特征AI走向3、0认知计算A,66,Q1,:什么领域,AI,能够超过人?,(完全信息博弈)充分的数据:需要有超级大的数据量,它不能举一反三,它要举多反三,(完全信息博弈)信息具有确定性:数据是要有标注的,不是到网上弄一堆数据,(完全信息博弈)完全信息:应用一定是单一领域,这个领域越垂直、越细越好。一个人工智能客服的应用不能够用来做导游,应用单一、一定要特别清楚不跨领域,有明白行的专家去选择有效的神经网络模型,调整各种网络参数,需要超大计算量,机器容易甩开人类,Q1:什么领域AI能够超过人?(完全信息博弈)充分的数据:需,一只乌鸦的启发,图,b,:找到了坚果,砸不开。它就发现一个诀窍,把果子放到路上让车轧过去,图,c,:靠近红绿路灯的路口,车子与人有时候停下了。,图,d,:选择了一根正好在斑马线上方的一根电线蹲下来,图,e,:把坚果抛到斑马线上,等车子轧过去,然后等到行人灯亮了,日本新喀乌鸦,一个完全自主的智能。感知、认知、推理、学习、与执行。远远超过任何机器人,乌鸦向我们证明了,这个解存在。,无大数据学习,无人工标注好的训练数据,没人教它,乌鸦头不到人脑的,1%,大小。人脑功耗大约是,10-25,瓦,它就只有,0、1-0、2,瓦,启发,一只乌鸦的启发图b:找到了坚果,砸不开。它就发现一个诀窍,把,Q2,:,AI+,依然,+AI,?,在,AI,技术成熟之前,这个行业、产品从未存在过。比如自动驾驶,亚马逊的,Echo,智能音箱、苹果的,Siri,语音助手。在人工智能技术未突破前,不存在如此的产品。因为,AI,创造出了一条全新的产业链。,AI+,行业:从,0,到,1,行业本身一直存在,产业链条成熟;往常完全靠人工,效率比较低,现在加入,AI,元素后,使得行业效率有了明显提高。比如安防、医疗等领域。,行业数据控制比,AI,技术更重要,例如医疗,+AI,最重要的是大量准确的被医生标注过的数据。在国内,医疗数据拿出来特别困难。,行业,+AI,:从,1,到,n,AI,应用需要积累足够的数据与经过充分的学习才两个起作用,当一个,AI,应用找到第一批用户时,他们使用的行为与记录被后台记录下来;开发者再对这种行为与记录进行迭代的改进,当再把该应用投向第二批用户的时候,其行为差不多比第一代提升了,涟漪效应,Q2:AI+ 依然 +AI?在AI技术成熟之前,这个行业、产,容错,生产力,成熟,封闭可控,数据,Q3,:什么,AI,项目容易成功?,容错生产力成熟封闭可控数据Q3:什么AI项目容易成功?,新特征,1,:深度学习,+,自我博弈进化技术,与传统博弈人工知识不同,AlphaGo,深度强化学习初步具备了“直觉感知(下一步在哪)”,“棋局推理(全局获胜机会如何)”,与“新颖落子(想人所不敢想)”等能力。,将记忆人类棋局与自我博弈积累棋局结合起来。,新特征1:深度学习+自我博弈进化技术 与传统博弈人工知识不同,DeepMind,算法减少了,40%,用于冷却,的电量,即整体用电量效率提升,15%,2010,年全球数据中心电力消耗为,2355,亿度,约占全球电力消耗,1、3%,(美,2%,中,1、8%,)。谷歌公司电力消耗低于全,球数据中心的,1%,DeepMind,已为谷歌挣钱,DeepMind,的软件控制着数据中心的风扇、制冷系统与窗户等,120,个变量,使谷歌的用电效率提升了,15%,几年内共为谷歌节约电费数亿美元。,据,ICTResearch,统计:,2015,年我国数据中心能耗高达,1000,亿度,相当于整个三峡水电站一年发电量。,DeepMind算法减少了40%用于冷却2010年全球数据中,Science2016,年,1,月,1,日发表 “群智之力量(,The Power of Crowds,Vol、351,issues 6268,)”的论文认为:结合群体智慧与机器性能来解决快速增长难题。,其将群智计算按难易程度分为三种类型:实现任务分配的,众包模式,(,Crowdsourcing,)、,较复杂支持,工作流模式的群(,plex workflows,),以及最复杂的,协同求解问题的生态系统模式(,Problem solving ecosystem,),、,新特征,2,:基于网络的群体智能差不多萌芽,Science2016年1月1日发表 “群智之力量(,大规模个体通过互联网构架的参与,能够表现出超乎寻常的智慧能力,是解决开放复杂问题的新途径,美国普林斯顿大学,Connetome,项目开发了,EyeWire,游戏,玩家对显微图像中单个细胞及其神经元连接按功能进行涂色。第一次提供了哺乳动物视网膜的神经元结构与组织如何产生,检测运动的功能。,145,个国家的,165000,多名科学家(玩家)参与,成功的还有:苹果,AppStore,(,130,万个应用程序)、,Wiki,百科(,4000,万词条)等等,美国普林斯顿大学,Connetome,项目,通过群体参与来探讨大脑结构与功能,之间映射的神经通路,:/、humanconnectomeproject、org/,(接着),大规模个体通过互联网构架的参与, 美国普林斯顿大学Co,各种穿戴设备、人,车共驾、脑控或肌控外骨骼机器人、人机协同手术等实现生物智能系统与机器智能系统的紧密耦合。,新特征,3,:人机一体化技术导向混合智能,各种穿戴设备、人车共驾、脑控或肌控外骨骼机器人、人机协同,自然语言处理,视觉计算,听觉感知,精灵宝可梦,GO : AR :,图形,+,视频,谷歌:,VR,绘画应用,Tilt Brush,Facebook:,视频描述生成,架构跨媒体间桥梁,新特征,4,:跨媒体推理差不多兴起,在语言、视觉、图形与听觉之间语义贯通,是实现联想、推理、概括等智能的重要关键,自然语言处理视觉计算听觉感知 精灵宝可梦GO : AR,新特征,5,:无人系统迅速发展,机械手在工业装配线上发展迅速,在灵活运动的领域中,无人系统迅猛发展的速度远快于机器人,因为人类或类动物的机器人,往往不如对机械进行智能化与自主化升级来得高效,新特征5:无人系统迅速发展机械手在工业装配线上发展迅速,人工智能,3.0,第,三,节,AI,技术的新特征,AI,走向,3、0,认知计算,AI3、0,面对的挑战,人工智能3.0第三节AI技术的新特征AI走向3、0认知计算A,78,我们正在进入,AI3、0,时代,人工智能基础理论与基础学科建立的时期,AI,的具体学科,比如语音识别、机器翻译、自然语言处理、视觉等被建立起来,并形成了人工智能从业的方法论及学派,AI1、0,时代:,1945-2005,年,以,2006,年谷歌翻译上线为标志的,AI2、0,时代,人工智能的发展从学术界到谷歌如此的公司主导,从往常的军用到民用,产品从,ToB,到大规模的,ToC,的过程,人工智能技术被广泛用于各类智能产品之中,算法(深度学习),+,数据(大数据),+,基础设施(计算能力),AI2、0,时代:,2006-2016,年,从软件到,AI,芯片,走向软硬结合,从信息到服务,崭新的、群雄逐鹿、百花齐放的时代,AI3、0,时代:,2017-20xx,年,我们正在进入AI3、0时代人工智能基础理论与基础学科建立的时,浅层次动因:需求、环境与技术,社会新需求爆发:,智能城市、智能医疗、智能交通、智能游戏、无人驾驶、智能制造等等,AI,的基础与目标巨变:,大数据、多媒体、传感器网、增强实现(,AR,)、 虚拟实现(,VR,)等等,计算机模拟人的智能 人机智能 群体智能,信息环境巨变:,互联网、移动计算、超级计算、穿戴设备、物联网、云计算、网上社区、万维网、搜索引擎等等,人工智能迈向新一代,AI,走向,3、0,的原因分析,浅层次动因:需求、环境与技术 社会新需求爆发: AI的基,深层次分析:世界正从原来的二元空间进入新的三元空间,世界原来是二元空间,:,人类社会空间,(,H,)与,物理空间,(,P,)。但近年来,信息力量的迅速壮大,已长成除,P,、,H,两极之外的新一极:,信息空间,(,C,)。,信息来自于人类社会:书籍、交流、媒体、计算机,信息开始互联:互联网、移动通讯与搜索,信息绕过人类,直截了当来自于物理世界:传感器与物联网,产生大数据:信息快速膨胀,人类已无法单独处理,从大数据必定会走向,大知识,并推动人类认识与控制能力的大变化,近,50,年来,信息空间成长壮大的历程,深层次分析:世界正从原来的二元空间进入新的三元空间世界原来是,从,AI,落后人类的原因看大知识(智能大数据)面临的挑战,强在记忆能力与计算能力,然而自我学习、举一反三的能力还不如,5,岁小孩,面对未知环境的变化,未知的任务,决策能力特别弱,AI,智能,学习与创新的能力:理解尤其是对整体环境的理解能力,能够通过经验来学习新事物,获得新知识,并具备触类旁通的能力,关于信息(不完全信息,模糊信息)的分析与决策能力,人类智慧,大知识需要结合大数据资源与,AI,的神经网络、符号智能、知识挖掘、人机交互等技术结合起来,不仅解决可解释性、通用性问题,而且形成新技术,实现新应用,技术融合,依靠大数据的深度学习与增强学习是,AI,当前最普遍成功的技术之一。然而,深度学习需要大量的标注数据,又是黑箱算法,其结果难以解释,而且只能专用,因为它与人类使用的知识形式差距太大,AI,技术现状,从AI落后人类的原因看大知识(智能大数据)面临的挑战强在记忆,从,PH,到,CPH,的人类空间演变并未结束,而正在深化。,AI,走向,3、0,正是这种深化演变为的一个结果,AI2、0,互联网,多媒体、传感器,人机交互,自主装备,大数据,新一代 人 工 智 能,自主智能系统,群体智能,智能大数据,跨媒体智能,人机混合增强智能,AI,走向,3、0,认知智能,能理解会考虑,感知智能,能听会说、能看会认,计算智能,能存会算,新一代,AI,的技术方向,从PH到CPH的人类空间演变并未结束,而正在深化。AI走向3,空间变化带来了认知的新门类、新通道、新计算,P,物理空间,C,信息空间,H,人类社,会,自然科学,工程技术,多媒体与传感信息大数据,自主装备,大数据、互联网社区,VR,AR,人机交互,学习、预测、创造,社会科学,新认知,新门类:认识复杂巨系统:城市运行系统、环境生态系统、健康医疗系统(科学,+,工程,+,社会,+,影响),新通道:给自然科学、工程技术、社会科学提供了新途径、新方法,新计算:,AI2、0,:建立在新老空间的互动,CH,、,CP,之上的,AI,空间变化带来了认知的新门类、新通道、新计算PCH自然科,知识表达,神经网络也能够认为是一类新的知识表达,可标记为,NN+W,(权),W,是数据表达的,可由学习自动生成,NN,是结构,由软件或硬件生成,AI,使用的知识表达还有另两类:,符号型:可表达为概念、命题、推理(逻辑、归纳、联想),形象型:可表达为形象(图形、动画、图像、视频、声音)、结构、情景,其中,形象型还可分为两类:,图形形象类:图形、动画(人工表达),图像形象类:图像、视频、声音(传感器表达),知识表达 神经网络也能够认为是一类新的知识表达,可标记为,知识,表达,面临,的挑战,上表中,x,处,就是大数据,智能,需对付的挑战,图像形象类:机器不可理解模式识别技术,?,机器不能推理跨媒体技术,?,NN+W,:,人不可理解跨知识表达,?,机器不可推理跨知识推理,?,图形形象类的表达只用于图形学,能与其他表达跨越使用不?,知识能综合上述技术而表达不?,知识表达,人可理解,机器可理解,机器推理,符号,图形形象类,图,像,形象类,NN+W,汇总四种表达的优缺点,如右,知识表达面临的挑战上表中x处,就是大数据智能需对付的挑战
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!