资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2014/11/27,#,图像数据,大,数据应用基础,魏炜,1,计算机,视,视觉的,重,重要性,图像是,信,信息的,重,重要载,体,体。,人类获,取,取外界,信,信息中,,,,80%左右来,自,自视觉,。,。,2,计算机,视,视觉的,基,基本原,理,理,首先,,从,从图片,中,中提取,出,出特征,。,。,这个特,征,征不仅,是,是每个,像,像素的,颜,颜色,,更,更重要,的,的是更,高,高级的,特,特征,,例,例如形,状,状、甚,至,至图片,中,中物体,的,的名称,。,。,进而,,可,可以对,大,大量图,片,片进行,聚,聚类、,分,分类、,搜,搜索。,3,计算机,视,视觉的主要,辅,辅助技,术,术,图像压,缩,缩:可,以,以减少,描,描述图,像,像所用,的,的数据,量,量。,图像增,强,强和复,原,原:这,是,是一种,图,图像预,处,处理。,目,目的是,提,提高图,像,像质量,,,,使图,像,像更加,清,清晰。,图像分,割,割:把,图,图像中,有,有意义,的,的部分,提,提取出,来,来,例,如,如边缘,、,、区域,等,等。,图像融,合,合:把,几,几个关,于,于某一,场,场景的,图,图像合,并,并,最,大,大限度,地,地利用,多,多个图,像,像来源,之,之间的,互,互补信,息,息,生,成,成一个,新,新图像,。,。,4,如何对,韩,韩国美,女,女进行,人,人脸识,别,别,2013年韩国,选,选美竞,赛,赛的20名参赛美女。,对参赛,选,选手进,行,行人脸识别颇,有,有难度,。,。发型,识,识别呢,?,?,5,重点:人脸,拍摄人,脸,脸,就,能,能识别,出,出这个,人,人的表,情,情:Emotient、Affectiva,拍摄人,脸,脸,就,能,能在人,脸,脸数据,库,库找出,与,与其相,似,似的人,脸,脸:百,度,度魔图,、,、北京旷,视,视科技的Face+。,人脸数据,库,库可以,是,是明星,脸,脸数据,库,库(百,度,度)、,也,也可以,是,是社交,媒,媒体上,的,的全部,头,头像(Face+)、也,可,可以是,罪,罪犯人,脸,脸数据,库,库(MorphoTrust),从视频,中,中识别,出,出含有,某,某明星,的,的片段,:,:Orbeus,身份识,别,别例如,Face+的云脸,应,应用锁、灏泷智,能,能科技的FaceEID人脸身份,实,实证、,杭,杭州热,和,和科技,检测驾,驶,驶员疲,劳,劳驾驶,精,精神状,态,态,并,进,进行预警:,灏,灏泷智,能,能科技,6,人脸:识,别,别表情,、,、性别,、,、年龄,、,、种族,旷视科技:,目前只,能,能识别,微,微笑程,度,度,不能识,别,别其他,情,情绪,7,人脸验,证,证,8,重点:物品,拍摄任,意,意一个,物,物品,,就,就能给,出,出物品,的,的名称,:,:Camfind、百度,轻,轻拍,拍摄纸媒内,容,容(例,如,如广告,、,、海报,),),就,能,能链接,到,到这个,商,商品的,零,零售网页,,或,或者得,到,到商家,优,优惠券,:,:Target公司的Ina Snap手机应用、,腾,腾讯、基美文,化,化传媒的基美耀,拍,拍APP(与亮风台合作,开,开发),、,、亿拍天下,拍摄一件衣,服,服,就,能,能在零,售,售商数,据,据库中,找,找到这,件,件衣服,,,,或者,相,相似的,衣,衣服:Snap Fashion、Style-Eyes、Slyce、搜鞋,客,客、图,图,图搜衣,、,、亮风台,9,重点:,物,物品,拍摄一,个,个商品,,,,就能,在,在零售,商,商数据,库,库中找,出,出这件,商,商品及,同,同款商,品,品的介,绍,绍、评,论,论,并,进,进行比,价,价,而,且,且能进,行,行购买,:,:Viscovery、北京,同,同创网,讯,讯、百,度,度与唯,品,品会的,合,合作,拍摄一,个,个景点,,,,就能,给,给出这,个,个景点,的,的名称,、,、介绍,:,:亮风,台,台,拍摄一,件,件展品,,,,就能,在,在数据,库,库中找,出,出这件,展,展品的,介,介绍:Guidico,10,11,物品,拍摄葡,萄,萄酒酒,标,标,就,能,能给出,商,商品信,息,息、并,进,进行比,价,价、购,买,买:佛山市,咔,咔嚓购的酒,咔,咔嚓APP。,12,物品,拍摄一,组,组食物,,,,就能,给,给出这,些,些食物,的,的营养,含,含量:芯草莓科技的,微,微营养App。,13,物品,拍一个应用,图,图标,,能,能识别,出,出这是,什,什么APP:亮风台的,应,应用拍,拍,拍APP,14,文字,拍摄外,语,语文字,,,,就能,给,给出翻译:Viscovery、旷视,科,科技,拍摄一,个,个数学,题,题,就,能,能给出,答,答案和,解,解析:,学,学习宝,15,有一些,公,公司采,用,用了深,度,度学习,百度,Orbeus,旷视科,技,技,DNNresearch,IQEngines,Looknow,Clarifai,Jetpac,16,重点:基础服,务,务:基,于,于深度,学,学习的,图,图片搜,索,索,以图搜,图,图:百,度,度、谷歌,百度能识,别,别出图,片,片中的,元,元素,,例,例如河,流,流、倒,影,影、建,筑,筑、树,木,木、白,云,云、蓝,天,天等。,拍摄图片,,就,就能根,据,据图中,包,包含的,元,元素生,成,成一首,诗,诗:百度为你,写,写诗,识别出,画,画作中,的,的视觉,概,概念,,例,例如鸭,子,子、走,路,路、死,尸,尸,进,而,而根据,描,描述性,词,词汇组,成,成的向,量,量,用自然,语,语言处,理,理比较不,同,同画作,之,之间的相似,度,度:达,特,特茅斯,学,学院和,微,微软剑,桥,桥研究,院,院,17,重点:基础服,务,务:基,于,于深度,学,学习的,图,图片自,动,动分类,给照片,自,自动加,标,标签、,归,归类,,进,进而可,以,以用关,键,键词搜,索,索图片,:,:Orbeus、Madbits、百度,云,云,18,和互联,网,网广告,结,结合,根据网,页,页上的,图,图片,,判,判断应,该,该给这,个,个网页,的,的访问,者,者展示,什,什么广,告,告:Cortica,以往的,互,互联网,广,广告都,是,是基于,用,用户访,问,问的网,页,页中的,文,文本内,容,容了解,用,用户的,兴,兴趣,,而,而没有,考,考虑到,图,图片内,容,容。,19,重点:图像输,入,入的来,源,源,手机摄,像,像头,谷歌眼,镜,镜、百,度,度眼镜,20,重点:,物,物品识,别,别准确,率,率的挑,战,战,物品形,变,变会影,响,响某些,物,物品的,识,识别。,例,例如:,同,同一件,服,服装随,着,着人的,姿,姿势不,同,同,会,发,发生很,多,多形状,上,上的变,化,化。相,比,比之下,,,,建筑,物,物的识,别,别要容,易,易很多,。,。,拍摄角,度,度也会,影,影响人,脸,脸、服,装,装等的,识,识别,灯光明,暗,暗、物,体,体反光,也,也会影,响,响物体,识,识别。,拍摄焦距也,会,会影响,物,物体识,别,别。,化妆也,会,会影响,人,人脸识,别,别,干扰图,像,像的遮,挡,挡会影,响,响对商,品,品图片,的,的识别,21,一种加强,人,人脸识,别,别率的,策,策略,把所有,人,人脸图,形,形都调,整,整到正,面,面照角,度,度,然,后,后生成,给,给每个,人,人脸正,面,面照生,成,成一个3D模型。,在这些3D模型之,间,间进行,比,比较,,就,就更加,准,准确。,22,如何降,低,低对于,隐,隐私的,担,担忧,尽量少,把,把图像,存,存储在,云,云端,先不把,技,技术用,于,于涉及,隐,隐私的,行,行业,23,重点:图像识,别,别底层,技,技术的,开,开放,一些公,司,司通过,以,以下方,式,式,把,底,底层的,技,技术开,放,放给广,大,大的、,成,成千上,万,万的开,发,发者,,由,由他们,来,来设计,各,各种各,样,样的应,用,用。,云端API,离线SDK开发包,例如:,腾,腾讯、Face+,24,语音识,别,别技术,也,也一样,有些公,司,司侧重,于,于底层,技,技术,,把,把API和SDK开放给,广,广大的,应,应用开发者,:,:例如,,,,云知,声,声,另一些公,司,司在别,的,的公司,提,提供的,底,底层技,术,术基础,上,上,开,发,发具体,的,的应用app。,还有些,公,公司不,仅,仅做底,层,层,也,做,做应用,:,:例如羽扇智公司,。,。,25,
展开阅读全文