《数字彩色图像基础》PPT课件.ppt

上传人:tia****nde 文档编号:12730990 上传时间:2020-05-20 格式:PPT 页数:47 大小:4.10MB
返回 下载 相关 举报
《数字彩色图像基础》PPT课件.ppt_第1页
第1页 / 共47页
《数字彩色图像基础》PPT课件.ppt_第2页
第2页 / 共47页
《数字彩色图像基础》PPT课件.ppt_第3页
第3页 / 共47页
点击查看更多>>
资源描述
1,数字彩色图像基础,注:本部分内容参考了林福宗多媒体技术基础第四、五、六章,数字媒体技术基础第二讲,2,上一讲内容回顾,数字媒体导论数字媒体的基本概念数字媒体技术的原理数字媒体标准简介数字媒体的应用,3,本讲内容提要,视觉系统对颜色的感知图像的颜色模型图像的基本属性图像的种类数字图像的描述图像文件格式作业2颜色的特性及度量颜色空间及其转换,4,视觉系统对颜色的感知,人们获取的信息的70来自视觉系统颜色是什么从物理学角度,颜色是视觉系统对可见光的感知结果感知到的颜色由光波的频率决定的光波是一种具有一定频率范围的电磁辐射,其波长覆盖的范围很广电磁辐射中只有一小部分能够引起眼睛的兴奋而被感觉,其波长在380780nm的范围里。眼睛感知到的颜色和波长之间的对应关系如下图所示,5,视觉系统对颜色的感知,视觉系统对颜色感知的特性眼睛本质上是一个照相机人的视网膜(humanretina)通过神经元感知外部世界的颜色,每个神经元是一个对颜色敏感的锥体(cone)人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同从理论上说,自然界中的任何一种颜色都可以由R,G,B这三种颜色值之和来确定,它们构成一个三维的RGB矢量空间(三原色)R,G,B的数值不同,混合得到的颜色就不同,6,7,图像的颜色模型,什么是颜色模型(colormodel)定量的描述颜色的一套规则和定义人们提出了各种颜色模型。目前常用的颜色模型按用途可分为面向硬件显示设备的RGB颜色模型面向彩色图像打印的CMY颜色模型电视信号传输中的YUV颜色模型面向彩色图像处理的HIS颜色模型面向特定应用的自定义颜色模型。与颜色空间等价,8,显示彩色图像用RGB相加混色模型-1,一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定CRT使用3个电子枪分别产生红(red)、绿(green)和蓝(blue)三种波长的光,如图所示,并以各种不同的相对强度组合产生不同的颜色RGB相加混色模型组合红、绿和蓝光波来产生特定颜色的方法叫做相加混色法(additivecolormixture),即RGB相加混色模型相加混色是计算机应用中定义颜色的基本方法,彩色显像产生颜色的原理,9,显示彩色图像用RGB相加混色模型-2,任何一种颜色都可用三种基本颜色按不同的比例混合得到颜色R(红的百分比)G(绿的百分比)B(蓝的百分比)三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同。没有光到达眼睛,就是一片漆黑当三基色等量相加时,得到白色;等量的红绿相加而蓝为0时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如图所示,相加混色,三种色彩叠加可形成1670万种颜色,即真彩色,10,打印彩色图像用CMY相减混色模型-1,一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定用彩色墨水或颜料进行混合,绘制的图画是一种无源物体,用这种方法生成的颜色称为相减色在白光照射下,青色颜料能吸收红色而反射青色,黄色颜料吸收蓝色而反射黄色,品红颜料吸收绿色而反射品红。也就是:白色-红色=青色白色-绿色=品红白色-蓝色=黄色另外,如果把青色和黄色两种颜料混合,在白光照射下,由于颜料吸收了红色和蓝色,而反射了绿色,对于颜料的混合我们表示如下:颜料(黄色+青色)=白色-红色-蓝色=绿色颜料(品红+青色)=白色-红色-绿色=蓝色颜料(黄色+品红)=白色-绿色-蓝色=红色以上的都是相减混色,相减混色就是以吸收三基色比例不同而形成不同的颜色的。所以又把青色、品红、黄色称为颜料三基色。颜料三基色的混色在绘画、印刷中得到广泛应用,11,打印彩色图像用CMY相减混色模型-2,CMY相减混色模型用三种基本颜色即青色(cyan)、品红(magenta)和黄色(yellow)的颜料按一定比例混合得到颜色的方法,通常写成CMY,称为CMY模型从理论上说,任何一种颜色都可以用青色(cyan)、品红(magenta)和黄色(yellow)混合得到在相减混色中,当三基色等量相减时得到黑色;。三基色相减结果如图所示按每个像素每种颜色用1位表示,相减法产生的8种颜色如表所示,相减混色,相减色,12,图像属性-1,像素深度(depth)图像中描述每个像素所需的二进制位数,以bit为单位例如,用R,G,B三个分量表示的彩色图像,若每个分量用8位表示,那么一个像素共用24位表示,就说像素深度为24位像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数例如,像素深度为24位时,每个像素可以是224=16777216种颜色中的一种像素深度越深,表达的颜色数目就越多,所占用的存储空间也越大。相反,如果像素深度太浅,则影响图像的质量,图像看起来让人觉得很粗糙和很不自然,13,图像属性-2,阿尔法()通道在每个像素用32位表示的图像表示法中的高8位,其余24位是颜色通道,红色、绿色和蓝色分量各占一个8位的通道通道是一个256级灰阶的图像,用于表示每个像素的透明度(可将图像分成不同的层)例如,用两幅图像A和B混合成一幅新图像,新图像(New)的像素为:Newpixel=(alphaA)(pixelAcolor)+(alphaB)(pixelBcolor)在视频制作中,可把广告的图标、报道题花等图案作为标记或栏目标题叠加在画面上,使用通道可对不同部分产生不同的透明效果,14,图像属性-3,真彩色与伪彩色真彩色(truecolor)每个像素的颜色值用红(R)、绿(G)和蓝(B)表示的颜色通常用24位表示,其颜色数22416777216种。也称24位颜色(24-bitcolor)或全彩色(fullcolor)伪彩色(pseudocolor)在RGB真彩色出现之前,由于技术上的原因,计算机在处理时并没有达到每像素24位的真彩色水平,为此人们创造了索引颜色,即伪彩色将像素值当作彩色查找表(colorlook-uptable,CLUT)的表项入口地址,查找显示图像时要使用的R,G,B值,用查找出的R,G,B值产生的彩色。例如16种颜色的查找表,0号索引对应黑色,.,15号索引对应白色使用查找得到的R,G,B数值显示的彩色是真的,但不是图像本身真正的颜色,它没有完全反映原图的颜色,15,图像的种类-1,矢量图(vectorgraphics)图形一般是由点、线条、曲面等组成的画面,多数是由绘图软件绘制出来的把图形看作一段段具有一定宽度、一定长度和方向性的线段组成,文件记录的是每个线段的起点和终点以及线段的色彩、宽度等信息,该文件可以看成是众多矢量表示的集合。每一个矢量都是独立的图像对象,可以自由无限制的重新组合优点目标图像的移动、缩小或放大、旋转、拷贝、属性(如线条变宽变细、颜色)变更都很容易做到存储空间小局限性很难用来描述真实世界的彩色照片,16,图像的种类-2,位图(bitmap)图像把图片看成是m行n列的小方块组成,每个小方块被称为一个像素,记录每个像素的颜色值对位图进行操作时,只能对图中的像素进行操作,而不能把位图中的物体作为独立实体进行操作。也称光栅图(rastergraphics)特性位图的获取通常用扫描仪、数码相机、摄像机、录像机、视像光盘和相关的数字化设备位图文件占据的存储空间比较大影响位图文件大小的因素图像分辨率:分辨率越高,表示组成一幅图的像素就越多,图像文件就越大像素深度:像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大,17,图像的种类-3,矢量图与位图的差别,18,图像的描述矩阵,黑白图像(二值图像)每个像素只能是黑或者白,像素值为0/1灰度图像每个像素由一个量化的灰度级来表示,一般为8bits的灰度级(0-255,0为纯黑,255为纯白)彩色图像每个像素的信息由RGB三基色构成,18,19,图像文件格式,图像文件格式是存储图形或图像数据的数据结构数字图像有多种存储格式,每种格式一般由不同的开发商支持。因此,要进行图像处理,必须了解图像文件的格式,即图像文件的数据构成每一种图像文件均有一个文件头,在文件头之后才是图像数据,20,BMP文件格式-1,BMP文件格式Bitmap的简写微软公司开发的在Windows环境下的标准位图文件格式BMP文件是一种像素文件,它保存了一幅图象中所有的像素可保存单色位图、16色或256色索引模式像素图、24位真彩色图象每种模式中单一像素的大小分别为1/8字节,1/2字节,1字节和3字节目前最常见的是256色BMP和24位色BMP这种文件格式还定义了像素保存的几种方法,包括不压缩、RLE压缩等。常见的BMP文件大多是不压缩的。,21,BMP文件格式-2,BMP文件组成BMP文件由文件头、位图信息头、颜色信息(调色板)和图形数据四部分组成BMP文件头BMP文件头数据结构含有BMP文件的类型、文件大小和位图起始位置等信息。其结构定义如下:typedefstructtagBITMAPFILEHEADERWORDbfType;/位图文件的类型标识,必须为0 x424D,即字符串”BM”DWORDbfSize;/位图文件的大小,以字节为单位WORDbfReserved1;/位图文件保留字,必须为0WORDbfReserved2;/位图文件保留字,必须为0DWORDbfOffBits;/位图数据的起始位置,以相对于位图/文件头的偏移量表示,以字节为单位BITMAPFILEHEADER;,22,BMP文件格式-3,位图信息头BMP位图信息头数据用于说明位图的尺寸等信息。typedefstructtagBITMAPINFOHEADERDWORDbiSize;/本结构所占用字节数LONGbiWidth;/位图的宽度,以像素为单位LONGbiHeight;/位图的高度,以像素为单位WORDbiPlanes;/目标设备的级别,必须为1WORDbiBitCount/每个像素所需的位数,必须是1(双色),/4(16色),8(256色)或24(真彩色)之一DWORDbiCompression;/位图压缩类型,必须是0(不压缩),/1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之一DWORDbiSizeImage;/位图的大小,以字节为单位LONGbiXPelsPerMeter;/位图水平分辨率,每米像素数LONGbiYPelsPerMeter;/位图垂直分辨率,每米像素数DWORDbiClrUsed;/位图实际使用的颜色表中的颜色数DWORDbiClrImportant;/位图显示过程中重要的颜色数BITMAPINFOHEADER;,23,BMP文件格式-4,颜色表(调色板)颜色表用于说明位图中的颜色,它有若干个表项,每一个表项是一个RGBQUAD类型的结构,定义一种颜色。RGBQUAD结构的定义如下:typedefstructtagRGBQUADBYTErgbBlue;/蓝色的亮度(值范围为0-255)BYTErgbGreen;/绿色的亮度(值范围为0-255)BYTErgbRed;/红色的亮度(值范围为0-255)BYTErgbReserved;/保留,必须为0RGBQUAD;颜色表中RGBQUAD结构数据的个数有biBitCount来确定:当biBitCount=1,4,8时,分别有2,16,256个表项;当biBitCount=24时,没有颜色表项。位图信息头和颜色表组成位图信息,BITMAPINFO结构定义如下:typedefstructtagBITMAPINFOBITMAPINFOHEADERbmiHeader;/位图信息头RGBQUADbmiColors1;/颜色表BITMAPINFO;,24,BMP文件格式-5,位图数据位图数据记录了位图的每一个像素值,记录顺序是在扫描行内是从左到右,扫描行之间是从下到上。位图的一个像素值所占的字节数:当biBitCount=1时,8个像素占1个字节;当biBitCount=4时,2个像素占1个字节;当biBitCount=8时,1个像素占1个字节;当biBitCount=24时,1个像素占3个字节;Windows规定一个扫描行所占的字节数必须是4的倍数(即以long为单位),不足的以0填充一个扫描行所占的字节数计算方法:DataSizePerLine=(biWidth*biBitCount+31)/8;一个扫描行所占的字节数DataSizePerLine=DataSizePerLine/4*4;/字节数必须是4的倍数位图数据的大小(不压缩情况下):DataSize=DataSizePerLine*biHeight;,25,BMP文件格式-6,总结Windows所使用的BMP文件,在开始处有一个文件头,大小为54字节。文件头保存了包括文件格式标识、颜色数、图象大小、压缩方式等信息对24位色不压缩的BMP,文件头中的信息基本不需要注意,只有“大小”这一项对有用。图象的宽度和高度都是一个32位整数,在文件中的地址分别为0 x0012和0 x0016。54个字节以后,如果是16色或256色BMP,则还有一个颜色表,但24位色BMP没有这个,可不考虑。接下来就是实际的像素数据了。24位色的BMP文件中,每三个字节表示一个像素的颜色。注意,通常使用RGB来表示颜色,但BMP文件则采用BGR,就是说,顺序被反过来了每一行的字节数一行的字节数必须是4的整数倍,如果不是,则需要补齐BMP文件的数据存放是从下到上,从左到右的。也就是说,从文件中最先读到的是图像最下面一行的左边第一个像素,然后是左边第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面一行的最右边的一个像素,26,作业2,用VC或者C/C+实现一个包含如下功能的程序打开24位彩色bmp文件,显示该图像将图像内容顺时针旋转90度后显示出来将图像分成等大小的4块,将第1和第3块像素互换后保存将旋转后的图像转换成灰度图像显示,并保存对灰度图像求Sobel边缘图,显示出来,并保存对灰度图像进行Gaussian平滑,并保存(需要体会平滑的作用)对灰度图像进行2值化(可尝试使用不同的阈值,如30,50,128,160)要求不可借助其它SDK,只能用C/C+来实现,可参考网上代码作业提交:源程序+原始图像+各结果图像(可拷贝到word文件中),27,描述颜色的几个术语,颜色是什么颜色是人的视觉系统对可见光的感知结果,感知到的颜色由光波的波长决定视觉系统能感觉的波长范围为380780nm,感知到的颜色和波长之间的对应关系如图所示纯颜色用光的波长定义,称为光谱色(spectralcolors)。单色光用不同波长的光进行组合时可产生相同的颜色感觉国际照明委员会(CIE)定义了三个特性来区分不同的颜色色调(hue)饱和度(saturation)明度(brightness),光谱色,28,颜色的三个特性-1,色调(Hue)视觉系统对一个区域呈现的颜色的感觉,即对可见物体辐射或发射的光波波长的感觉这种感觉就是与红、绿和蓝三种颜色中的哪一种颜色相似,或者与它们组合的颜色相似。色调取决于可见光谱中的光波的频率,它是最容易把颜色区分开的一种属性苹果是红色的,这“红色”便是一种色调,它与颜色明暗无关黑、灰、白则为无色彩色调有一个自然次序:红、橙、黄、绿、青、蓝、靛、紫(red,orange,yellow,green,cyan,blue,indigo,violet)。在这个次序中,当人们混合相邻颜色时,可以获得在这两种颜色之间连续变化的色调,29,颜色的三个特性-2,色调表示法,色调(Hue)在颜色圆上用圆周表示,圆周上的颜色具有相同的饱和度和明度,但它们的色调不同,如图所示,30,颜色的三个特性-3,饱和度(Saturation)指颜色的纯洁性可用来区别颜色明暗的程度当一种颜色掺入其他光成分越多时,就说该颜色越不饱和一种颜色+其他光成分=颜色不饱和完全饱和的颜色是指没有渗入白光所呈现的颜色单一波长的光谱色是完全饱和的颜色半径表示法见图(a),沿径向方向上的颜色具有相同的色调和明度,但它们的饱和度不同图(b)所示的七种颜色具有相同的色调和明度,但具有不同的饱和度,左边的饱和度最浅,右边的饱和度最深,(a)半径表示法,(b)饱和度表示法,31,颜色的三个特性-4,明度(Brightness)视觉系统对可见物体辐射光或发射光多少的感知属性同一物体因受光不同会产生明度上的变化。有色表面的明度取决于亮度和表面的反射率感知的明度与反射率不成正比,认为是一种对数关系明度的主观感觉值目前无法用物理设备测量可用亮度(luminance)即辐射的能量来度量一个极端是黑色(没有光),另一个极端是白色,在这两个极端之间是灰色,32,颜色的三个特性-5,明度(Brightness)明度常用垂直轴表示,见图(a)在图(b)中,七种颜色具有相同色调和饱和度不同的明度底部的明度最小顶部的明度最大,(a)垂直轴表示法(b)示例,33,饱和度和亮度的关系同一色调越亮或越暗越不纯。在饱和的彩色光中增加白光的成分,相当于增加了光能,因而变得更亮了,但是它的饱和度却降低了。若增加黑色光的成分,相当于降低了光能,因而变得更暗,其饱和度也降低了。,34,颜色的三个特性-6,亮度(luminance)由于明度很难度量,因此国际照明委员会定义了一个比较容易度量的物理量,称为亮度(luminance)。亮度的值是可度量的,它用单位面积上反射或者发射的光的强度表示光的强度用“intensity”表示,但在许多中文工具书和科技文献中把“intensity”和“luminance”都翻译成“亮度”总结:色调与光波的波长有直接关系,亮度和饱和度与光波的幅度有关。,35,颜色空间-1,表示颜色的一种数学方法对人,可以通过色调、饱和度和明度来定义颜色对显示设备,用红、绿和蓝发光体的发光量来描述颜色对打印或印刷设备,使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色通常用三维模型表示颜色常用代表三个参数的三维坐标来指定,这些参数描述颜色在颜色空间中的位置,36,颜色空间-2,例:如图表示用色调、饱和度和明度构造的HSB(hue,saturation,andbrightness)颜色空间色调用角度标定,红色标为0,青色标为180饱和度的深浅用半径大小表示明度用垂直轴表示HIS(Intensity),色调-饱和度-明度颜色空间,37,HIS/HSB,(A)HSI圆锥空间模型(B)线条示意图:圆锥上亮度、色度和饱和度的关系。(C)纵轴表示亮度:亮度值是沿着圆锥的轴线度量的,沿着圆锥轴线上的点表示完全不饱和的颜色,按照不同的灰度等级,最亮点为纯白色、最暗点为纯黑色。(D)圆锥纵切面:描述了同一色调的不同亮度和饱和度关系。(E)圆锥横切面:色调H为绕着圆锥截面度量的色环,圆周上的颜色为完全饱和的纯色,色饱和度为穿过中心的半径横轴。,38,颜色空间-3,39,肤色模型(Skinmodel),肤色检测在人脸检测、手势识别、人体跟踪、敏感图像过滤等问题中得到广泛应用它通常被作为预处理环节来降低问题求解的计算复杂度由于种族、光照、背景等因素的影响,准确分割人体肤色区域仍是一个有挑战性的问题,40,肤色模型(Skinmodel),肤色在不同颜色空间上的分布计算机表示中最常用的RGB颜色空间RGBisdevelopedwithCRTasanadditivecolorspaceIthashighcorrelation,non-uniformityandmixingofchrominanceandluminancedata.ThereforeRGBisnotsuitableforcoloranalysisandcolorbasedrecognition,41,肤色模型(Skinmodel),与人类颜色感知一致的HSV颜色空间HSV(hue,saturation,value)表示色调、饱和度和亮度,H-VandH-Ssubspaceplots,DistributionoftheH(Hue)channel,HSV反映了人的视觉系统观察彩色的方式V分量与图像的彩色信息无关;H和S分量与人感受颜色的方式是紧密相联的HSV非常适合借助人的视觉系统来感知彩色特性的图像处理算法,42,肤色模型(Skinmodel),YUV(YCbCr)颜色空间Y分量决定颜色的明亮度U分量和V分量决定了颜色本身(色度),DistributionofY,CbandCr,BoundingplanesforCb-Crsubspace,43,肤色模型(Skinmodel),肤色在更多颜色空间上的分布,44,肤色模型(Skinmodel),肤色建模方法简单定义肤色模型通过实验观察,通过定义一系列规则来定义颜色空间中的肤色区域采用的规则包括有人工定义的简单的线性函数、复杂的非线性函数,或者通过机器学习自动找到规则参数肤色模型假定肤色分布符合某类具体的数学函数,并通过训练数据来确定出相应的参数,模型通常被假定为服从单高斯分布、多高斯分布、椭圆分布等非参数肤色模型通过训练集中的肤色出现频率直接估计每种颜色的肤色概率,常用方法有查表法、Bayes法、SOM等这类模型中的各颜色点的肤色概率值独立,准确性高,但缺乏泛化能力,45,肤色模型(Skinmodel),46,肤色模型(Skinmodel),肤色检测结果,47,作业3,1.实现RGB颜色空间到HSV和YCbCr颜色空间的转换(关于转换公式由自己查阅资料获取)2.(选做)采集些肤色样本,画出这些肤色在RGB,HSV和YCbCr颜色空间上的分布,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!