资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,吴及,清华大学电子工程系,多媒体信号与智能信息处理实验室,wuji_ee,*,第一级,第二级,第三级,第四级,25,清华大学,电子工程系 ,吴及,*,第一级,第二级,第三级,第四级,*,清华大学,电子工程系,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,*,清华大学,电子工程系 ,吴及,第一级,第二级,第三级,第四级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,李 德 毅,lidy,20,13,年1,2,月,30,日,大数据时代的认知计算,Cognitive Computing in the Petabyte Era,一、人类的认知可以,“,计算,”,吗?,3,认知就是认识智慧,逻辑思维和推理,依据现有知识,计算、分析、,联想、,推导或归纳,产生新知。,脑智(智商),心智(情商),形象思维和创新,通过,意象、直觉、想象、情感、顿悟等,,进行,直观、综合的思考,在创新中起着至关重要的作用。,成功,= 40% IQ,&,60% EQ,一元论?,二元论?,相互作用论?,1956年达特茅斯会议正式使用,“,人工智能,”,术语,目标是开发像人那样思维的人工系统。半个世纪以来,人工智能成为认知计算的智力内核,取得的重要成果已经深刻地改变了我们的日常生活。,认知是可以,“,计算,”,的,图灵机是可计算的,任何形式系统可以是图灵机准确刻画的机械程序。,认知计算是信息处理的过程,存在有符号主义、联结主义和行为主义等范式,有着强大的生命力,并走向计算主义。,认知是可以,“,计算,”,的,6,电脑可以具备人脑的智能吗?,半个世纪的人机大战表明,在与国际象棋领域具有类似复杂性的问题上,电脑可具有人脑的智能。,50,年人机大战实质是,“,人机,-,机人,”,大战,千方百计把人的认知能力放到机器里去和人对抗。从这个意义上,认知是可以计算的。,认知不可以,“,计算,”,停机问题、程序验证问题等都是不可计算的,数学自身是机器程序不可穷尽的,人脑是否能被物化为电脑的首要问题在于人脑能不能够被形式化,可计算性是不依赖于形式系统的选择的,认知科学的困境,用什么方法研究思维和意识,人的意识和精神活动是由大脑不同区域共同作用产生的吗,是由物理和化学规律支配的吗,是由神经元细胞的行为和构成方式、以及影响它们的原子、离子和分子性质所决定的吗,?,?,?,?,有人甚至认为,人是不可能自己把自己搞清楚的!,Nature,专刊(,2008,年,9,月,3,日),大数据来源:,PB,时代对科学的挑战也是对认知科学的挑战,!,自然大数据,生命大数据,社交大数据,11,看病那些事儿,诊查就是治疗!,DNA,测序,核磁,CT,X,光,心电图,化验,B,超,内镜,医学必须越跑越快才能跟上技术发展的步伐!,知道“是什么”,就知道“怎么做”!,医学诺贝尔奖给了谁?,心电图的发明人 :,威廉,.,埃因托芬,X,射线辐射治疗发明人 :,赫尔曼,.,约瑟夫,.,马勒,核磁共振成像发明人 :,保罗,.,劳特布尔,更多的奖给了器械发明人,以及能够从医疗数据发现价值的人!,因果,关联,先导?,是什么?,大数据,为什么?,怎么做?,研究对象,科学,技术,形而上,?,形而下,大数据,大数据时代认知计算的实践,正在,倒逼,认知科学前行!,对人类认知而言,欧盟的“脑科学十年”和“人类大脑计划”,以及奥巴马的“脑计划”可能,错,在哪里?,大脑细胞类型及统计,大脑结构图,大规模神经网络技术,操作神经回路的工具,神经细胞与个体行为关系,大脑成像技术,神经模型和统计的整合,人脑数据搜集,知识传播与培训,认知科学难道就是研究生物脑的自然属性吗?,要研究人类认知的特殊性!,文字、文明和传承,人类认知的社会属性,倒逼什么?,把这两点作为人类认知科学的切入点!,要研究脑认知的后天属性。认知还是后天学习和积累的结果,是与社会环境、社会实践、群体交互等密切相关的,要建立人类认知的成长机制。,倒逼什么?,二、大数据时代的自然语言处理,技术正在改变我们的生活,语言是思想的直接现实,是人类思维的载体,是认知科学和认知计算要应对的首要问题。,语言和文字,在人类走向文明的四个重大里程碑中,语言和文字占了两个位置,语言是外部对象的,“,声音符号,”,,传达的是,信息,文字是信息的,编码,,有文字才有传承,人类运用自然语言进行交流获得的效果中:,讲话内容,7%,强度和语调,38%,面部表情和肢体动作,55%,认知心理学告诉我们,在半个世纪的自然语言理解的研究中,我们对,此关注了多少?,自然语言在人类思维中具有不可替代性,人们在表达、思考和解决任何问题时,通常是定性的,对量的规定性往往是非数值的,科学研究中,即使人们用对象语言(如:物理、数学、,C,语言等)来表述一个特定的精确学科,解释对象语言的,元语言,仍然是自然语言,自然语言是不可以计算的!,自然语言可以计算吗?,在特定语境和语用场合,自然语言理解是可以被形式化表达并进行计算的!,脑科学认为:,计算语言学认为:,如果一个问题不能够全部形式化,那么,其中的局部问题可不可以形式化?如何让这个局部问题尽可能地普遍一些?,自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。,紧紧抓住自然语言中的概念,研究不确定性。,语音大数据举例,以中国移动一个中等规模省级客服中心,客服坐席,500,个,平均日通话,30,万,平均通话时间,100,秒,平均坐席日通话,时间,16.7,小时,日通话累计时长,约为,8333,小时,月客服数据总量:,25,万小时,年客服数据总量:,300,万,小时,4kbps,压缩存储:,5.4TB,一个人不停说话,说上,1,年,如采用人工测听,需,1000,人,移动客服录音大数据,可实现一秒钟对,100,万小时,音频数据的检索,!,引自科大迅飞公司数据,是雇用,500,位客服人员,还是启用一台话音机器人?,人类如何理解自然语音的?,您好亲情话务员,很高兴为您服务。,我问一下我那个,包月,的,上网套餐,现在还能恢复吗?,先生您好您这个套餐是您目前使用的就是一个神州行。免费的,,那是赠送流量吗?,免费赠送您三十兆流量的,怎么了您说。,我不是把那个,GPRS,关了嘛。,您是说您的功能关闭了是吗?,嗯,,开通,还要不要扣费啊。,需要扣费,,有,密码,吗?,有密码,,我能开通那个,GPRS,吗?,是的,您稍后听到语音提示后输入一下您的密码请稍等。,噢行。,先生您好您的密码,。,在半个世纪的自然语言理解的研究中,我们对,此关注了多少?,人类如何理解自然语言的?,研表究明,汉字的序顺并不定一能影响阅读,比如当你看完这句话后,才发这现里的字全是都乱的!再回头仔看细看,真这是样的。,在半个世纪的自然语言理解的研究中,我们对,此关注了多少?,区分计算机和人的全自动公共图灵测试(,CAPTCHA,)还能维持多久?,在半个世纪的语言文本理解的研究中,我们对,此关注了多少?,全自动区分计算机和人类的图灵测试,Completely Automated Public Turing test to tell Computers and Humans Apart,(,CAPTCHA,),reCAPTCHA,,利用大众对验证码的识别,完成扫描仪、,OCR,软件,甚至古籍整理者都难以辨识的古老文献中的字符,精度可以超过,99%,!,群体智能:社会计算的精髓!,网络应用,通讯平台,数字媒体,机器人能听会说正在改变我们的生活!,在线服务机器人,智能耳机?,语音指纹,服务中心,政治语言翻译中心,中英文翻译,服务中心,计算用语翻译中心,方言服务中心,位置服务中心,语言翻译服务云支撑各式各样智能语音,在线翻译:文字,文字,语音合成:文字, 语音,话者识别:,语音,说话人,语音识别:语音,文字,Let data speak! listen & answering carefully,.,不知天高地厚的豪言壮语?,“,先干掉短信,下一个目标是语音通话!,”,高级认知活动:创作对联,唐诗宋词三百首,41850,首,,8,万句,近,35,万字,微软对联,微软亚洲研究院自然语言计算组研发的计算机自动对联系统。,利用从唐诗宋词大数据中学习到的概率模型,,当用户给定上联,能自动提供若干下联; 当用户确定一副对联,能生成若干四字横批。, 仄平平,平平,仄平,平 平仄仄,仄 仄平平,把这些切割后的字串构成数据集,并要求仄平平 、仄平 、仄平平 这,3,类串的韵相同 。,表,1,:,(仄起)五绝(首韵),第一句,第二句,第三句,第四句,X1,X2,X3,X4,X5,X6,X7,X8,1,羞,玉,2,流泪,3,窈窕,4,雪满,5,月色,6,愁空,7,浮云,8,伤别,9,哀苦,0,回首,1,未曾看,2,斩楼兰,3,寄燕然,4,水生烟,5,凤楼酣,6,暗无边,7,绕林间,8,竟不还,9,贵乡还,0,泪遥传,1,燕然,2,芙蓉,3,鸳鸯,4,梅花,5,江南,6,春风,7,佳人,8,斜阳,9,西湖,0,微霜,1,水月牵,2,寻岳仙,3,哀苦寒,4,觉夜寒,5,嬉笑牵,6,独去闲,7,上酒船,8,流泪泉,9,不可攀,0,走百川,1,凤楼,2,故情,3,染香,4,雾花,5,水晶,6,雪恨,7,落花,8,卷珠,9,相思,0,当年,1,人不见,2,留不住,3,追往事,4,空怅望,5,谁念我,6,肠断处,7,多少恨,8,空相忆,9,凝望久,0,都莫问,1,白玉,2,夜郎,3,多苦,4,一笑,5,憔悴,6,无限,7,寂寞,8,惟有,9,疑是,0,远忆,1,晚妆残,2,莫留连,3,憩言欢,4,望长安,5,老红颜,6,醉不,眠,7,见,苍山,8,蔽青天,9,涕衣沾,0,齿开难,仄,仄平平,平平,仄,平,平,平仄仄(非韵),仄,仄平平,第一句,第二句,第三句,第四句,X1,X2,X3,X4,X5,X6,X7,X8,1,羞,玉,2,流泪,3,窈窕,4,雪满,5,月色,6,愁空,7,浮云,8,伤别,9,哀苦,0,回首,1,未曾看,2,斩楼兰,3,寄燕然,4,水生烟,5,凤楼酣,6,暗无边,7,绕林间,8,竟不还,9,贵乡还,0,泪遥传,1,燕然,2,芙蓉,3,鸳鸯,4,梅花,5,江南,6,春风,7,佳人,8,斜阳,9,西湖,0,微霜,1,水月牵,2,寻岳仙,3,哀苦寒,4,觉夜寒,5,嬉笑牵,6,独去闲,7,上酒船,8,流泪泉,9,不可攀,0,走百川,1,凤楼,2,故情,3,染香,4,雾花,5,水晶,6,雪恨,7,落花,8,卷珠,9,相思,0,当年,1,人不见,2,留不住,3,追往事,4,空怅望,5,谁念我,6,肠断处,7,多少恨,8,空相忆,9,凝望久,0,都莫问,1,白玉,2,夜郎,3,多苦,4,一笑,5,憔悴,6,无限,7,寂寞,8,惟有,9,疑是,0,远忆,1,晚妆残,2,莫留连,3,憩言欢,4,望长安,5,老红颜,6,醉不,眠,7,见,苍山,8,蔽青天,9,涕衣沾,0,齿开难,仄,仄平平,平平,仄平,平,平仄仄(非韵),仄,仄平平,第一句,X1,X2,1,羞玉,2,流泪,3,窈窕,4,雪满,5,月色,6,愁空,7,浮云,8,伤别,9,哀苦,0,回首,1,未曾看,2,斩楼兰,3,寄燕然,4,水生烟,5,凤楼酣,6,暗无边,7,绕林间,8,竟不还,9,贵乡还,0,泪遥传,仄,仄平平,第二句,X3,X4,1,燕然,2,芙蓉,3,鸳鸯,4,梅花,5,江南,6,春风,7,佳人,8,斜阳,9,西湖,0,微霜,1,水月牵,2,寻岳仙,3,哀苦寒,4,觉夜寒,5,嬉笑牵,6,独去闲,7,上酒船,8,流泪泉,9,不可攀,0,走百川,平平,仄,平,第三句,X5,X6,1,凤楼,2,故情,3,染香,4,雾花,5,水晶,6,雪恨,7,落花,8,卷珠,9,相思,0,当年,1,人不见,2,留不住,3,追往事,4,空怅望,5,谁念我,6,肠断处,7,多少恨,8,空相忆,9,凝望久,0,都莫问,平,平仄仄(非韵),第四句,X7,X8,1,白玉,2,夜郎,3,多苦,4,一笑,5,憔悴,6,无限,7,寂寞,8,惟有,9,疑是,0,远忆,1,晚妆残,2,莫留连,3,憩言欢,4,望长安,5,老红颜,6,醉不,眠,7,见,苍山,8,蔽青天,9,涕衣沾,0,齿开难,仄,仄平平,秀玉,竟不还,,,西湖,哀苦寒,。,凤楼,留不住,,,夜郎,醉不眠,。,如,毛泽东的生日,18931226,所作的诗是:,自然语言理解,50,年变迁,从五笔字型输入到搜狗拼音输入,从千人一面的搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到野蛮翻译,从确定性认知到不确定性认知,42,自然语言理解:期待中的舞台机器人,文本、歌曲,剧本等,形象,情感,动作,语音,语调,风格,.,以大数据形态反映的语言、交互和理解,是带毛的、鲜活的、有情感的原生态数据,体现了认知过程中在语境、语构、语用和语义方面的不确定性,这正是大数据的魅力所在。,三、视听觉认知中的大数据:智能驾驶初步实践,智能驾驶为什么会火起来?,云计算、移动互联网、物联网、大数据和智慧城市建设背景下,人们迫切需要提高移动生活的品质。智能车成为众目睽睽下的交集!,视听觉认知计算,国家自然科学基金委员会十一五重大研究计划,视听觉认知计算,的科学任务,在正常的环境下,标准的城市和城际公路上,从北京到天津,/,深圳,智能车混迹在正常交通流中,表现出驾驶员的驾驶智能,驾驶员的视听觉认知计算能力。,国家自然科学基金委员会十一五重大研究计划,视听觉认知计算,(,2008,2015,),耗资,1.9,亿元,历时,8,年,资助近百个培育项目、重点项目、集成项目,在原始创新和任务载体(轮式机器人)上取得重大成果。,国家自然科学基金委员会十一五重大研究计划,人类的视听觉认知是不可以计算的!,人类的视听觉认知可以计算吗?,特定情境下,人类的视听觉认知导致特定的行为,是可以被形式化表达并进行计算的!,脑科学认为:,机器人学认为:,智能驾驶试验三步走策略,第一步:,城际道路低智商试验(, 2015,年),第二步:,市区道路中智商试验(, 2020,年),第三步:,特殊道路高智商试验(, 2030,年),自主驾驶!,360,o,旋转的传感器扫描百米范围高精度立体景象,左后轮上方的传感器检测小位移,安装在后视镜部位的摄像头检测交通灯,帮助机载计算机识别自行车和行人,4,个测距雷达,,3,个在前,一个在后,确定障碍物的位置与距离,轮式机器人传感器大数据,车载陀螺:,感知车辆自身姿态和位置,雷达(激光雷达、毫米波雷达、超声雷达、红外雷达等)和摄像头,:感知周边环境,传感器数据常常是海量流数据,工作,1,小时,一部,64,线激光雷达可产生,137GB,数据量,一个高清摄像头可产生,50GB,数据量。,驾驶环境地理信息大数据,数字地图数据,定位和导航数据,云计算:基于位置的服务,围绕位置服务的大量衍生信息,驾驶人行为大数据,飙车手,菜鸟,正常驾驶员,驾驶行为人人都不同,需不需要研制人造的生物眼(仿生眼)?,重要抉择:,需不需要在车上安装三维高精度激光成像雷达再现周边立体场景?,重要抉择:,路边的美女看不看?,智能驾驶难点:,当汽车在高速行驶时需不需要理解所有周边的地理位置信息和交通指示牌信息?,智能驾驶难点:,轮式机器人能不能模拟车主的驾驶行为,具有个性,具有自学习功能?,智能驾驶难点:,驾驶员必须在车辆导航、危险检测、速度 控制和车道保持之间分配注意力,当驾驶员没有将注意力在正确的时间分配给正确的对象时,安全受到影响。统计表明,注意力疲劳、分散和粗心导致撞车事故,移动互联网将使驾驶员的移动生活更丰富多彩,也更可能分散注意力,选择性注意和注意分配,认知计算中的基础科学问题:,遗忘:选择性记忆,选择性注意的后续认知是残留,即记忆。,没有遗忘,就没有选择性记忆。,在驾驶员的认知过程中,对已经成为过去的驾驶活动,时间越长,遗忘越快;对刻骨铭心的瞬间,长期积累为先验知识。,对刚刚过去的周边态势的记忆,如何表现?,认知计算中的基础科学问题,注意的调节,认知计算中的基础科学问题,先验知识优先,动目标优先,全局(大尺度)优先,差异优先,前景优先,注意跟踪和聚焦,京津高速公路试验,3,号智能车在台湖至东丽段高速道路上,使用,3,个摄像头、,5,部雷达、以及速度传感器,,全程自动,无人干预,累计转向,11812,次,成功换道,36,次,,,自主超车,12,次,邻道超车,21,次,油门操作,1816,次,刹车,36,次,油耗,9.69,升,总里程,114,公里,平均车速,70.1km/h,,最高车速,105km/h,,并由第三方检测认证,达到了预期目的 。,第,18,次城际智能驾驶试验结论,轮式机器人:双工双控智能车,驾驶是快乐的享受,只要车内有人,就不存在绝对的无人驾驶。自动驾驶和人工驾驶可以商量,相互学习,自然转换,长期并存,。,车内乘员和轮式机器人之间的视觉、语音、触摸、踩踏等多种自然交互形态、以及交互界面的设计,甚至是智能车成功与否的关键!,自动驾驶和人工驾驶不是简单的非此即彼!要考虑自动驾驶过程中人工如何自然干预?人工驾驶过程中自动监视如何悄悄地工作?,人 工 驾 驶,自 动 驾 驶,如何切换?双控?,双工:人工驾驶和自动驾驶两种工作方式长期并存,轮式机器人和人和谐相处,2024/9/22,71,人和轮式机器人,双工:,互为热备份,不是冷切换,双控:,时刻准备着,实时弥补对方认知中的不智,如果有一天,北京城区出现了,飙车机器人,那灵动的身影、敏捷的姿态、尽兴的奔跑,跑出了自己的风格和智能,你还要问:认知可以计算吗?,四、,不确定性认知的物理学方法: 云模型和数据场,云 模 型,人类思维的载体是自然语言,认知计算最基本的任务是自然语言的形式化,自然语言的形式化首先是概念的形式化,概念的形式化要解决不确定性:软计算和词计算,认知计算要解决概念的形式化,认知计算的,CPU:,C,oncept,P,rocessing,U,nit,概念处理单元,从,模糊集合,理论半个世纪的兴,衰看不确定性认知计算的发展?,2011,年度图灵奖得主,Judea Pearl,教授,加州大学洛杉矶分校的计算机科学家,将,贝叶斯网络和概率方法引入人工智能,,为,iPhone,的,Siri,语音识别和,Google,无人驾驶汽车奠定了基础。,著作, Causality: Models, Reasoning,and Inference,创立了因果推理演算法,奠定了处理不确定性信息的计算基础。,Judea Pearl,(1936,),美国工程院院士,Lotfi Zadeh,1921,.2 ,波兰科学院院士,Zdzislaw Pawlak,1926.11.10 2006.4.7,模糊集合,粗糙集合,二型模糊集合,美国南加州大学教授,Jerry M. Mendel,1938,.5 ,模糊集合理论,模糊集合,模糊逻辑,模糊规则,模糊推理,模糊控制,模糊信息处理,模糊问题求解,经典论文:,Zadeh L A. Fuzzy sets J. Information and Control, 1965,(8):338-353,粒,计算,粒化和粒度,粒空间,粒逻辑,粒推理,粒分析,粒处理,粒问题求解,概率图模型,(,PGM,),以图的方式表达变量间不确定因果关系的模型,从动态、复杂、不确定的信息中提取结构化知识,并进行推理计算。,常见的概率图模型包括:贝叶斯网络、马尔科夫随机场、高斯图模型、动态不确定因果图、隐树模型等。,云模型,用自然语言值表示的某个定性概念与其定量表示之间的不确定性转换双向认知模型。,概念的内涵是,期望,、,熵,和,超熵,,外延是云滴表示的一个个样例。期望是最能代表这个概念的中心值,熵反映概念的粒度,超熵反映概念的共识程度。,云模型,云由许许多多云滴组成,每一个云滴就是定性概念映射到论域空间的一个点,即实现了一次量化,这是一个离散转换过程,云滴在论域空间的分布形成一朵云,这种实现带有不确定性,云模型可给出每个云滴能够代表定性概念的确定度,“年轻人”隶属区间函数,“年轻人”的云模型,一型模糊集合,用,一个精确的隶属函数,表达变量与定性概念之间的隶属关系的模糊性,“年轻人”的隶属函数,二型模糊集合,利用,上、下隶属函数曲线,限定模糊范围,表示隶属度的不确定性,云模型,利用,正向云发生器算法,基于概率测度空间自动,生成隶属度,1.,生成以,En,为中心值,,He,2,为方差的一个正态随机数,En,;,2.,生成以,Ex,为中心值,,En,2,为方差的一个正态随机数,x,;,3.,计算:,4.,x,是论域中的一个云滴,y,是其确定度;,5.,重复步骤,1-4,直,至产生需要数目的云滴。,正向云发生器算法,88,正向云发生器,FCG(Ex, En, He, n),FCG,FCG,(20; 3; 0.1; 1,000),高斯云的概率密度函数,:,在论域,U,上定义均值为,En,、标准差为,He,的高斯随机变量,即,的概率密度函数为,在,=,的条件下,定义在论域,U,上的随机变量,X,的条件概率密度函数为:,随机变量,X,的概率密度为,称,X,的概率分布为高斯云分布 。,高斯云的数学性质,期望,方差(二阶中心距),三阶中心距,四阶中心距,四阶中心矩具有峰度(,kurtosis,)的含义,峰度是统计中描述分布状态的一个重要特征值,用以判断分布曲线相比于正态分布的尖平程度。如果将正态分布视为常峰态,分布曲线的形状比正态分布更高更瘦的称为高峰态,否则称为低峰态。,定义: 随机变量,X,称为是重尾的,如果 ,其中,,,分别为,X,的期望和标准差。正态分布的峰度为,3,,因此该性质被称为超过或大于峰度。,高斯云是重尾分布,幂律分布也是重尾分布。,高斯云随着熵的增大,或者阶数的增加,云滴的分布更加趋向重尾分布。,高阶云模型可以在高斯分布和幂律分布之间游走。,高斯云分布与高斯分布比较,云模型对模糊集合的质疑和背离,云模型的数学基础是概率理论,刻画的问题是人类认知中概念与数据之间的双向转换,实现的手段是计算机算法。云模型给出了定性概念的量的数学表述及其数学性质,用概率和统计的方法解释了曾经用隶属度表示的种种模糊概念和模糊理论,,但,不要求主观给定确定的隶属度值,并指出语义不同的概念的确定度分布,依然具有轮廓的一致性。,傅里叶变换,高斯变换,高斯云变换,:依据数据样本的统计特性,通过高斯变换形成多个概念的期望,通过减少概念含混度确定各个概念的熵和超熵,形成多个不同粒度的概念。,稀疏高斯云变换,云变换,高斯云变换,776,名中国工程院院士年龄分布,(2012.4),分成,5,个概念?,分成,3,个概念?,根据“类内关系强、类间关系弱”的聚类原则,用高斯云变换实现聚类,可减少概念之间的含混度,并,体现人类认知中概念的层次和粒度的不确定性。,天空中大量云滴构成的云,远观有形,近观无边,千姿百态,飘逸不定,有时如朵朵棉花,有时一泻千里,或淡或浓,或卷或舒,自在洒脱,在长空中漂浮着,聚散着,变幻着,引发人类诸多遐想,造就多少不朽诗句。,为什么大家都喜欢云?,数 据 场,103,直觉和想象力离不开视觉形象和形象思维,视觉形象在大脑中残留形成一个形象思维的空间,,可不可以借鉴物理学中的场,描述形象思维空间各个像素之间的相互作用呢?,物理场和数据场,104,数据场,作为描述数据对象之间相互关系的形象、直观的方法,为描述人类认知活动,尤其是从数据到概念、从局部到全局提供了一个有效的工具。,105,数据场中的势,空间,中的数据对象集,及其产生的数据场,任一场点,x,处的势值可计算为:,这里,场点与对象间的距离可以采用欧氏距离来计算,,m,i,0(,i,=1.,n,),为,每个对象的虚拟质量,,0,为影响因子。,106,人脸图像数据场,像素点,数据,对象,灰度值,对象的质量,像素点间的相互作用,人脸数据场,m,n,像素,点,根据势函数公式,场中任一点的势值可以计算为,:,107,人脸图像数据场,下图为表情数据库的一幅标准化人脸图像及其产生的数据势场分布,(,=0.05,),,可以发现,人脸图像数据场的高势区位于脸颊、额头和鼻梁等灰度值较大的面部区域。,a) 128,128,像素,人脸图像,b),数据场等势线分布,c),势场分布的三维视图,108,场的局部特征的非线性扩张,数据场,新场,非线性变换,数据场,局部夸张场,新场,109,为了突出眼睛、嘴巴、眉毛和鼻子根部等低灰度区域,对人脸图像的灰度矩阵进行非线性变换:,非线性变换后的人脸图像数据场的势函数可以计算为:,人脸图像数据场的,MapReduce,110,非线性变换后人脸图像数据场,a),标准化人脸图像,b),数据场等势线分布,c,),势场分布的三维视图,在非线性变换后的势场分布中,势值高的区域可以突显眼睛、嘴巴等重要面部器官。,111,非线性变换后,b),数据场等势线分布,c,),势场分布的三维视图,a),人脸图像,112,核心对象对数据场的贡献,数据场的空间分布主要取决于质量较大的核心对象间的相互作用,其他大多数的对象由于质量太小对数据场的形成几乎不起作用。,核心对象和原始数据集产生的数据场等势线分布比较,113,基于数据场的人脸图像特征提取,基本思想,:人脸图像数据场的空间分布可以近似为少数重要的像素点或特征点间的相互作用,而其他大多数的像素点对场的空间分布的影响非常小。通过优化估计每个像素点对数据场的贡献,可得到少数包含较多人脸信息的重要特征点。,114,像素点贡献的优化估计,量化每个像素点对形成人脸图像数据场的贡献,根据势函数与概率密度函数仅相差一个归一化常数,在总体分布已知时,可以通过最小化势函数与总体分布密度函数间的某个误差准则来优化估计对象的质量。,115,优化目标函数为:,像素点贡献的优化估计,116,算法描述,算法名称,:基于数据场的人脸图像特征提取,输 入,:人脸图像,影响因子,输 出,:重要特征点集合,A,算法步骤,:,对图像灰度进行归一化和非线性变换;,根据目标函数优化估计每个像素点的权值;,抽取所有权值非,0,的像素点组成重要特征点集合,A,并返回;,117,对,128,128,标准人脸图像进行特征提取(,=0.05,),可以得到,48,个权值非零的重要特征点:,可以发现,数据场方法提取的重要特征点不仅包含了眼睛、嘴巴等重要面部器官的局部特征,而且受光照条件影响小,具有良好的稳定性。,数据简约,a),人脸,128,128,个像素特征,b) 48,个重要特征点,118,数据简约,=0.02,=0.05,=0.09,250,个特征点,48,个特征点,28,个特征点,人脸像,128128,越小,特征点个数越多,对人脸图像的描述越细节;反之,,越大,特征点个数越少,对人脸信息的描述越概括。,119,遗忘:记忆衰退的形式化描述,=0.02,=0.05,=0.09,250,个特征点,48,个特征点,28,个特征点,人脸像,128128,越大,特征点个数越少,对人脸图像的描述越宏观,越概括,形成记忆残留。,一个问题的两个方面:,时间,120,遗忘:记忆衰退的形式化描述,时间,(a),人脸图像,(b) 254,个特征点(,=0.02,),(c)7,9,个特征点(,=0.05,),(d) 35,个特征点(,=0.08,),128x128,个数据,269,个数据,254,个数据,76,个数据,79,个数据,40,个数据,35,个数据,121,15,岁,25,岁,35,岁,55,岁,70,岁,大数据时代的认知计算:,80,岁的李德毅?,?,80,岁,1,万张照片,认知科学:,衰老规律;人脸规律,大数据时代,技术的有效性要,比科学的完整性更重要!,2013,年第二版,2005,年第一版,文本语言理解服务中心,以人为本的认知物联网构想,图片图像理解服务中心,语音服务中心,专业认知理解服务中心,穿戴设备服务中心,Nature,专刊(,2008,年,9,月,3,日),倒逼的力量!,但成千上万的、甚至千千万万的特定情境下的认知可以局部的形式化,,如果人类的认知问题不能够全部、完整、统一地形式化,,那么,大数据时代的认知计算是否正在,倒逼,并,逼近,认知科学呢?,认知计算,认知科学,总结,谢谢,
展开阅读全文