第2讲媒体及媒体技术

上传人:小**** 文档编号:243143851 上传时间:2024-09-16 格式:PPT 页数:68 大小:830.50KB
返回 下载 相关 举报
第2讲媒体及媒体技术_第1页
第1页 / 共68页
第2讲媒体及媒体技术_第2页
第2页 / 共68页
第2讲媒体及媒体技术_第3页
第3页 / 共68页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二讲媒体及媒体技术,Outline,媒体的种类和特点,听觉类媒体及数字化,视觉类媒体及数字化,触觉类媒体等其它媒体,常见的媒体元素,文本(,Text,),图形(,Graphic,),音频(,Audio,、,Speech,),音频参数:采样频率、采样精度和通道数,静止图像(,Image,):,关键技术,:,图像的扫描、编辑、压缩、解压缩和一致性再现。,三个因素:分辨率、图像灰度和图像文件大小。,视频(,Video,),在视频中几个重要的参数(帧率、数据量、图像质量),动画(,Animation,),媒体的种类,人类的感觉:视觉、听觉、触觉、味觉和嗅觉。,媒体可以分为:,听觉类媒体 (波形声音、语音和音乐),视觉类媒体 (包括位图图像、矢量图形、动画视频、文本等),触觉类媒体 (环境媒体),味觉类媒体,嗅觉类媒体,人类对信息理解途径,听觉媒体技术,声音心理学,音频的数字化和符号化,采样,量化,编码,声音的量纲,声音的物理量:,频率(变化的速度),振幅(变化的强度),相位(开始的时刻),声音的强度相差很大,,1kHz,正弦波所能察觉的最弱音为,2.8310,-4,(达因,/,平方厘米,),,,这个最弱音作为参照声的国际标准。采用分贝作为量纲。分贝是指两个波峰幅度,A,和,B,的比:,dB,20log,10,(A/B),人耳朵感觉最弱的声音到产生痛感的声音的强度相差约一万倍。对于大多数人来说,感觉痛苦的限为,100-120dB,人的听觉频率范围是,20-20kHz,。,声音的心理学量纲,:,响度,音调,其它还有音色、和谐、不和谐以及乐音等等,强度增加,响度增加;频率增加,音调增高。,心理学量纲和物理学量纲不能混淆:,这些关系不是线性的,强度加倍不等于响度加倍,这些关系不是孤立的,声音频率的变化既影响音调也影响响度,这些关系不是完全固定的,对于一个音的响度和音调有什么样的知觉取决于出现的情景,听觉心理变量和物理变量的关系,听觉心理变量,首要的,物理变量,次要的,物理变量,响度,音调,音色,音量,密度,和谐(流畅或粗糙),噪声,骚扰声,声强度,声波频率(,Hz,),声波复合,频率和强度,频率和强度,谐波结构,强度,强度,声波频率,声强,声乐技巧,频率组合,各种时间参量,频率组合,听觉特性,(,1,),等响曲线,等响曲线描述的是,响度与频率、强度,的关系。响度是与频率和强度有关的,在不同的频率上的强度是不同的。,从声音心理学考虑,对同一响度的声音在频率上的强度上可以有很大的差别,这对于多媒体系统的声音表现有重要的意义。,(,2,),掩蔽,声音的响度不仅取决于自身的强度和频率,而且依赖于同时出现的其他声音。声音之间可以互相掩蔽,一种声音的出现可能使另一种声音难于辨别。,由于声音的掩蔽效果,可以欺骗人的听觉。声音的掩蔽特性常用于声音的压缩。,(,3,),临界频带,在频率的某一临界区里,这种声音强度是相互作用的,合成声音的响度由这些频率共同决定。如果超出临界区,声音的响度不再相互作用,随频率而变。这个临界区就是临界频带,其宽度视其中心频率而定。,对于临界频带的确认,使得对声音响度的处理能够有的放矢。,(,4,),相位,从声音的波形来看,声音的起点和方向也反映声音的特性,这就是声音的相位。当两个声音同方向但相位相反时,它们相互抵消;当两个声音同方向且相位也相同时,声音就会得到加强。,相位的确定在多声道系统的设计中非常重要,它可以应用在回声抵消、会议系统的声音设计上等。,(,5,),自然声音的时变现象,声音的音调分成,3,个区域:起始区、稳定状态区和延迟区,研究表明,音调的频谱分量随时间改变。在稳定状态区,频谱保持固定。在起始区,频谱随时间变化。因此自然声音的起始部分是非常难识别的。,对于语音(人的说话,,Speech,),具有短时平稳性,一般认为,5-50ms,左右语音信号保持相对稳定一致的特征。对于语音信号的分析和处理是建立的“短时”的基础上。,(,6,),听觉空间,人耳可听到来自各个方向的声音,并用不同的因素来决定声源,包括强度、时间和频谱。确定声源的位置无论对于增进人们的感受还是增进对声音的理解都是非常重要的。,方位的线索是各种声音到达两耳的精确时间和强度。声音先到达离声源较近的一耳而且强度较大。声音的定位要靠双重机制,一般低频率主要依靠时差,高频率依靠强度。,1-5kHz,的频率范围是转换点,在转换点附件定位误差最大,通过声音的精确再现,就可以构造出听觉空间,对于听觉空间的再现在虚拟现实系统中必不可少。,(,7,),听觉的频谱特性,声音是时间函数,通过傅里叶变换可做出其频谱图。人耳对频谱成分的波峰和波谷是非常敏感的。在语言中,元音很少有频谱快速变换的区域。基频改变,人耳是很敏感的,(,8,),声音的心理模拟,通过仿真的方法,可以对视觉空间的景物进行再造或虚构,也可以对听觉空间的声音进行心理的模拟,就是所谓的可听化(,audiolization,)。,用声音可以表达出一些特殊效果 。例如:对于虚拟的流体,用声音的高低可以表示流体的粘度,低音表示流体很粘,高音则不粘;用声音的单一频率可表示流体的密度小,而多种频率复合则表示密度大;用冷音色(如笛声)可以表示流体的温度低,而暖音色表示流体的温度较高;用声音脉冲的速度可表示流体的流动速度等等,音频的数字化和符号化 (采样、量化和编码),声音在真实世界是模拟的,时间和幅度上是连续的。数字信号只在特定的位置取有限的值,数字表示的声音是一个数据序列,在时间上是不连续的。因此把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,这称为,采样,,这个时间间隔称为采样周期。,量化,是将具有连续幅度值的输入信号转换到只有有限个幅度值的输出信号的过程。,对声音进行采样用,奈奎斯特采样定理,来决定采样频率。 采样频率高于信号中最高频率的两倍,就可以从采样中完全恢复原始信号的波形。,讨论,某数字语音系统的,AD,、,DA,(输入、输出)为宽带音频(,48K,采样),即每秒有,48000,个样点;但是在做信号处理的时候,(,如用,G.723.1,算法编解码)需要按照电话质量来处理(,8K,采样频率),即每秒,8000,个样点,应该如何做转换?,模拟音频信号的采样和重建,低通信号的采样定理,x(t,),频带限制,(0,f,H,),在内,若采样频率,f,S,大于或等于,f,H,的两倍,则可以从采样后的序列,x(nT,S,),无失真地恢复,x(t,),。,采样后的信号可看成是理想采样序列同,x(t,),的乘积,:,采样脉冲序列付氏变换为,由频域卷积定理,有:,由采样后信号恢复原模拟信号,-,内差公式,当采样频率,大于或等于,的两倍时,对,进行理想低通滤波,可以恢复原始信号。,理想低通频域特性为:,时域冲激响应为:,由时域卷积定理,有:,选,:,可看出在,t,=,nT,s,各点上,,其它各点由这些点插值得到。,说明连续信号,x(t,),可以展成正交抽样函数(,Sa,函数)的无穷数级,级数的系数等于抽样值,x(nT,s,),。也就是说若在抽样信号,x,s,(t,),的每个抽样值上画一个峰值为,x(nT,s,),的,Sa,波形,则合称的波形就是,x(t,),。,带通信号采样,设带通信号最高频率和最低频率分别为,f,H,和,f,L,,,如果以两倍的,f,H,采样当然不会产生混叠,但并不一定效率最高的。,若,-,f,L,f,L,在之间可以容纳,个信号频谱,那么在,-,f,H,f,H,在之间可以容纳,个信号频谱,最小采样频率可取,在,2B,到,4B,之间变化,,,当,f,L,是,B,的整数倍时,:,子带编码分带满足这种条件可使采样率最小,,,称为,整数带分割,视觉媒体技术,视觉心理学,视频信号的数字化,视频信号的采样,彩色空间的线性变换标准,彩色电视制式及电视图像数字化,图像子采样,视觉心理特征,光学物理变量:光强、波长和光谱成分等,视觉心理变量: 亮度、彩色、浓度和对比度等,同声音心理学相仿,与视觉相对应的光学物理性质与心理知觉也是不同的。,虽然光的物理特性与心理知觉有关,但不是线性的。把物理波的强度加倍,感觉到的亮度并不是加倍。对光的色调和亮度的感觉不仅和它的频率和强度有关,而且还和它出现的背景有关,和同时出现的周围光有关。将物理性质和心理知觉区分开来,十分重要。,视觉的心理变量和物理变量对应表,视觉心理变量,主要物理变量,次要物理变量,亮度,色调(彩色),饱和度(彩色的浓度),对比度,光强,波长,光谱成分,光强、波长、周围光,光的波长、眼的适应,光谱成分,周围光的强度,亮度和色调,周围光,视觉特性,(,1,)亮度,亮度是人眼对光强的感受,(,2,)彩色,考虑三种心理属性:色调、饱和度(浓度)和亮度,色调,就是通常意义下的彩色,它随波长的变化而变化,放映颜色的基本特性,饱和度,表示了产生所感知到的彩色在白光中必须混入的纯单色光的相对数量,或者说是颜色的深浅程度。对同一色调的彩色光,饱和度越深颜色越鲜艳。色调和饱和度通称为色度。,可见光的波长从,380-780nm,。不同波长呈现不同颜色,随着波长的减小,可见光颜色依次为红、橙、黄、绿、青、蓝、紫,自然界中的任何一种颜色都可以由红绿蓝三种颜色混合而成的。它们构成了一个,3,维的,RGB,矢量空间,(,3,)视觉的时间特性(视觉惰性),人眼的视觉是有惰性的,这种惰性现象也称为视像暂留。当眼前实际的景物已经消失后,所看到的影响却不立即消失 。,视觉惰性被人们巧妙地运用到电影和电视中,使得本来在时间上和空间上都不连续的图像,给人以真实的、连续的感觉。在通常的电影银幕的亮度下,人眼的临界闪烁频率约为,46Hz,。电影中,普遍采用每秒向银幕投射,24,副画面的标准,而在每副画面停留的时间中,用一个机械遮盖阀将投射光遮挡一次,得到每秒,48,次的重复频率,使观众产生亮度是连续、不闪烁的感觉。,对于高亮度的显像管而言,临界闪烁频率可能达到,60-70Hz,。,(,4,)图像的对比度,对比度表示图像相邻面积或者相邻点之间的亮度差别。对比度,C,定义如下:,I,max,I,min,分别代表图像中的最大最小光强。,在自然景物中,对比度经常可以达到,200:1,,甚至更高,而多数电视机和显示器给出,50:1,的对比度都很困难。,(,5,)时间域的掩蔽效应,实验表明,当相邻的画面发生剧烈变化(如场景切换)时,人眼的分辨率会突然下降(下降到原来的,1/10,)。也就是说当新场景突然出现时,人基本上看不清新景物,大约,0.5,秒之后,视力才恢复到正常水平。,影响时域掩蔽效应的因素比较复杂,对于它的研究还处于初试阶级。,(,6,)彩色的掩蔽效应,在亮度剧烈变化的背景上(如黑白跳变的边沿上),人眼对色彩变化的敏感程度明显降低。,视频信号的采样,静止图像的采样:,亮度是,x, y,坐标的函数,其值总大于等于零,设,x, y,方向亮度变化的最高空间频率分别是,采样间隔分别是,那么由采样定理有:,采样后的信号为:,采样前后频域关系为,:,是原始图像信号的付氏变换。采用截止频率分别为,的矩形低通滤波器可以从采样后的信号中滤出原始图像信号。,通常图像尺寸有限,设为,采样点数为,那么应该有:,采样方式有正交结构和斜交结构,如图所示,各样点值可以用矩阵表示,图像尺寸和采样点数确定后,要对原始图像信号进行合适的空间滤波,保证采样后不产生混叠。,通过扫描方法实现采样,每样点用,812bit,量化。,活动图像采样,:,活动图像可以表示成:,按,t,间隔对活动图像进行抽取,再进行空间采样,从而得到活动图像的采样序列。活动图像可以看成是静止图像系列,一幅图像称为一帧图像。,理论上,t,的取值应该满足采样定理的要求。,实际上考虑人眼视觉特性和应用需求。约每秒,30,帧以上无闪烁感,为节省带宽,可采用隔行扫描。,彩色图形的采样:,根据三基色原理,彩色图像可以用红、绿、兰(,RGB,)合成。摄像机输出是经过校正的,RGB,信号,需要对,RGB,分别采样,每个信号分别用,812bit,量化。,彩色空间的线性变换标准:,为了使用人的视角特性以降低数据量,通常把,RGB,空间表示的彩色图像变换到其他彩色空间。目前采用的彩色空间变换有三种:,YIQ, YUV,和,YCbCr,。每一种彩色空间都产生一种亮度分量信号和两种色度分量信号,而每一种变换使用的参数都是为了适应某种类型的显示设备。,YIQ,适用于,NTSC,彩色电视制式,YUV,适用于,PAL,和,SECAM,彩色电视制式,YCbCr,适用于计算机用的显示器。,在彩色电视制式中,使用,YUV,和,YIQ,模型来表示彩色图像。在,PAL,彩色电视制式中使用,YUV,模型(,YUV,不是那几个英文单词的组合词,而是符号,,Y,表示亮度,,UV,用来表示色差,,U,、,V,是构成彩色的两个分量);在,NTSC,彩色电视制式中使用,YIQ,模型,其中的,Y,表示亮度,,I,、,Q,是两个彩色分量,YUV,表示法的重要性是它的亮度信号,(Y),和色度信号,(U,、,V),是相互独立的,也就是,Y,信号分量构成的黑白灰度图与用,U,、,V,信号构成的另外两幅单色图是相互独立的。由于,Y,、,U,、,V,是独立的,所以可以对这些单色图分别进行编码。此外,黑白电视能接收彩色电视信号也就是利用了,YUV,分量之间的独立性。,YUV,表示法的可以利用人眼的特性来降低数字彩色图像所需要的存储容量。人眼对彩色细节的分辨能力比对亮度细节的分辨能力低。若把人眼刚能分辨出的黑白相间的条纹换成不同颜色的彩色条纹,那末眼睛就不再能分辨出条纹来。由于这个原因,就可以把彩色分量的分辨率降低而不明显影响图像的质量,因而就可以把几个相邻像素不同的彩色值当作相同的彩色值来处理,从而减少所需的存储容量。,无论是用,YIQ,、,YUV,和,YCbCr,还是用,HSL,模型来表示彩色图像,由于现在所有的显示器都采用,RGB,值来驱动,这就要求在显示每个像素之前,须要把彩色分量值转换成,RGB,值。这种转换需要花费大量的计算时间。这是一个要在软硬件设计中需要考虑的因素。,YUV,与,RGB,彩色空间变换:,YIQ,与,RGB,彩色空间变换,YIQ,和,YUV,的关系,在,NTSC,制式中使用,YIQ,,,Y,与前面的,Y,相同,,IQ,是由,UV,坐标旋转,33,度得到,YCbCr,与,RGB,彩色空间变换,当,R,,,G,,,B,的取值范围为,0,,,1,,与,RGB,空间的转换关系如下:,当,R,,,G,,,B,的取值范围为,8,位二进制的,0,,,219,,与,RGB,空间的转换关系如下:,彩色电视制式,目前世界上现行的彩色电视制式有三种:,NTSC,制、,PAL,制和,SECAM,制。,NTSC(National,Television Systems Committee),彩色电视制是,1952,年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国台湾采用这种制式。,PAL(Phase,-Alternative Line),制彩色电视广播标准,德国,(,当时的西德,),于,1962,年制定的,称为逐行倒相正交平衡调幅制 。它弥补了,NTSC,制存在相位敏感造成彩色失真的缺点 。德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。,SECAM (,法文:,Sequential,Coleur,Avec,Memoire,),是法国制定的彩色电视广播标准,称为顺序传送彩色与存储制。法国、苏联及东欧国家采用这种制式。世界上约有,65,个地区和国家试验这种制式。,NTSC,制、,PAL,制和,SECAM,制都是兼容制制式。这里说的“兼容”有两层意思:一是指黑白电视机能接收彩色电视广播,显示的是黑白图像,另一层意思是彩色电视机能接收黑白电视广播,显示的也是黑白图像,这叫逆兼容性。为了既能实现兼容性而又要有彩色特性,因此彩色电视系统应满足下列几方面的要求:,(1),必需采用与黑白电视相同的一些基本参数,如扫描方式、扫描行频、场频、帧频、同步信号、图像载频、伴音载频等等。,(2),需要将摄像机输出的三基色信号转换成一个亮度信号,以及代表色度的两个色差信号,并将它们组合成一个彩色全电视信号进行传送。在接收端,彩色电视机将彩色全电视信号重新转换成三个基色信号,在显象管上重现发送端的彩色图像。,PAL,电视制的主要扫描特性,(1) 625,行,(,扫描线,)/,帧,,25,帧,/,秒,(40 ms/,帧,),(2),长宽比:,4:3,(3),隔行扫描,,2,场,/,帧,,312.5,行,/,场,(4),颜色模型:,YUV,一帧图像的总行数为,625,,分两场扫描。行扫描频率是,15625 Hz,,周期为,64,s,;场扫描频率是,50 Hz,周期为,20 ms,;帧频是,25 Hz,,是场频的一半,周期为,40 ms,。在发送电视信号时,每一行中传送图像的时间是,52.2s,,其余的,11.8s,不传送图像,是行扫描的逆程时间,同时用作行同步。每一场的扫描行数为,625/2=312.5,行,其中,25,行作场回扫,不传送图像,传送图像的行数每场只有,287.5,行,因此每帧只有,575,行有图像显示。,NTSC,彩色电视制的主要特性,(1) 525,行,/,帧, 30,帧,/,秒,(29.97 fps, 33.37 ms/frame),(2),长宽比:电视为,4:3,,电影为,3:2,,高清晰度电视为,16:9,(3),隔行扫描,一帧分成,2,场,(field),,,262.5,线,/,场,(4),在每场的开始部分保留,20,扫描线作为控制信息,因此只有,485,条线的可视数据。,(5),每行,63.5,微秒,水平回扫时间,10,微秒,(,包含,5,微秒的水平同步脉冲,),,所以显示时间是,53.5,微秒。,(6),颜色模型:,YIQ,一帧图像的总行数为,525,行,分两场扫描。行扫描频率为,15750 Hz,, 周期为,63.5s,;场扫描频率是,60 Hz,,周期为,16.67 ms,;帧频是,30 Hz,,周期,33.33 ms,。每一场的扫描行数为,525/2=262.5,行。除了两场的场回扫外,实际传送图像的行数为,480,行。,SECAM,彩色电视制的主要特点,这种制式与,PAL,制类似,其差别是,SECAM,中的色度信号是频率调制,(FM),,而且它的两个色差信号:红色差,(R-Y),和蓝色差,(B-Y),信号是按行的顺序传输的。,图像格式为,4:3,,,625,线,,50 Hz,。,6 MHz,电视信号带宽,总带宽,8MHz,。,电视图像数字化,数字电视图像有很多优点:,例如,可直接进行随机存储使电视图像的检索变得很方便,复制数字电视图像和在网络上传输数字电视图像都不会造成质量下降,很容易进行非线性电视编辑。,数字电视系统都希望用彩色分量来表示图像数据,如用,YC,b,Cr,,,YUV,,,YIQ,或,RGB,彩色分量。因此,电视图像数字化常用“分量初始化,(component digitization)”,这个术语,它表示对彩色空间的每一个分量进行初始化,电视图像数字化常用的方法有两种 :,(,1,)先从复合彩色电视图像中分离出彩色分量,然后数字化。通常的做法是首先把模拟的全彩色电视信号分离成,YCbCr,,,YUV,,,YIQ,或,RGB,彩色空间中的分量信号,然后用三个,A/D,转换器分别对它们数字化。,(,2,)用一个高速,A/D,转换器对彩色全电视信号进行数字化,然后在数字域中进行分离,以获得所希望的,YCbCr,,,YUV,,,YIQ,或,RGB,分量数据。,电视图像数字化的标准,在,20,世纪,80,年代初,国际无线电咨询委员会,CCIR(International,Radio Consultative Committee),就制定了彩色电视图像数字化标准,称为,CCIR 601,标准,现改为,ITU-R BT.601,标准。该标准规定了彩色电视图像转换成数字图像时使用的采样频率,,RGB,和,YCbCr,两个彩色空间之间的转换关系等。,ITU-R BT.601,标准摘要,ITU-R BT.601,用于对隔行扫描电视图像进行数字化,对,NTSC,和,PAL,制彩色电视的采样频率和有效显示分辨率都作了规定。,ITU-R BT.601,推荐使用,422,的彩色电视图像采样格式。使用这种采样格式时,,Y,用,13.5 MHz,的采样频率,,Cb,、,Cr,用,6.75 MHz,的采样频率。采样时,采样频率信号要与场同步和行同步信号同步。,彩色电视数字化参数摘要,采样格式,信号形式,采样频率,样本数,/,扫描行,数字信号取值范围(,A/D,),(,MHz,),NTSC,PAL,4:2:2,Y,13.5,858(720),864(720),220,级,(,16,235,),Cr,6.75,429(360),432(360),225,级,(,16,240,),(,128112,),Cb,6.75,429(360),429(360),4:4:4,Y,13.5,858(720),858(720),220,级,(,16,235,),Cr,13.5,858(720),858(720),225,级,(,16,240,),(,128112,),Cb,13.5,858(720),858(720),CIF,、,QCIF,和,SQCIF,为了既可用,625,行的电视图像又可用,525,行的电视图像,,CCITT,规定了称为公用中分辨率格式,CIF(Common,Intermediate Format),,,1/4,公用中分辨率格式,(Quarter-CIF,,,QCIF),和,(Sub-Quarter Common Intermediate Format,,,SQCIF),格式,CIF,格式具有如下特性:,(1),电视图像的空间分辨率为家用录像系统,(Video Home System,,,VHS),的分辨率,即,352288,。,(2),使用非隔行扫描,(non-interlaced scan),。,(3),使用,NTSC,帧速率,电视图像的最大帧速率为,30000/100129.97,幅,/,秒。,(4),使用,1/2,的,PAL,水平分辨率,即,288,线。,(5),对亮度和两个色差信号,(Y,、,Cb,和,Cr),分量分别进行编码,它们的取值范围同,ITU-R BT.601,。即黑色,=16,,白色,=235,,色差的最大值等于,240,,最小值等于,16,。,CIF,和,QCIF,格式参数表,CIF,QCIF,SQCIF,行数,/,帧,像素,/,行,行数,/,帧,像素,/,行,行数,/,帧,像素,/,行,亮度,(,Y,),288,360,(,352,),144,180,(,176,),96,128,色差,(,Cb,),144,180,(,176,),72,90,(,88,),48,64,色差,(,Cr,),144,180,(,176,),72,90,(,88,),48,64,图像子采样,对彩色电视图像进行采样时,可以采用两种采样方法。一种是使用相同的采样频率对图像的亮度信号和色差信号进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。,如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样,(,SubSampling,),图像子采样在数字图像压缩技术中得到广泛的应用,最简便的图像压缩技术就要算图像子采样了。这种压缩方法的基本根据是人的视觉系统所具有的两条特性,:,1.,人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;,2.,利用人眼对图像细节分辨能力有一定的限度的特性,可以把图像中的高频信号去掉而使人不易察觉。,子采样是利用人的视觉系统这两个特性来达到压缩彩色电视信号,试验表明人的视觉系统对采样前后显示的图像质量没有感到有明显差别。,目前使用的子采样格式有如下几种 :,4:4:4,采样格式(不属于子采样格式 ),4:2:2,采样格式,4:1:1,采样格式,4:2:0,采样格式,4:4:4,YCbCr,格式,每条扫描线上每,4,个连续的采样点取,4,个亮度,Y,样本、,4,个红色差,Cr,样本和,4,个蓝色差,Cb,样本,这就相当于每个像素用,3,个样本表示,4:2:2,YCbCr,格式,每条扫描线上每,4,个连续的采样点取,4,个亮度,Y,样本、,2,个红色差,Cr,样本和,2,个蓝色差,Cb,样本,平均每个像素用,2,个样本表示。,4:1:1,YCbCr,格式,每条扫描线上每,4,个连续的采样点取,4,个亮度,Y,样本、,1,个红色差,Cr,样本和,1,个蓝色差,Cb,样本,平均每个像素用,1.5,个样本表示,数字电视盒式磁带,(digital video cassette,,,DVC),上使用的格式,4:2:0,YCbCr,格式,在水平和垂直方向上每,2,个连续的采样点上取,2,个亮度,Y,样本、,1,个红色差,Cr,样本和,1,个蓝色差,Cb,样本,平均每个像素用,1.5,个样本表示。,4:2:0,格式目前有两种:,(,1,),H.261, H.263,和,MPEG-1,(,2,),MPEG-2,H.261, H.263,和,MPEG-1,使用的,4:2:0,格式,在水平方向的,2,个样本和垂直方向上的,2,个,Y,样本共,4,个样本有,1,个,Cb,样本和一个,Cr,样本。如果每个分量的每个样本精度为,8,比特,在帧缓存中每个样本就需要,12,比特。,MPEG-2,中使用的,4:2:0,格式,与,MPEG-1,的,4:2:0,相比,,MPEG-2,的子采样在水平方向上没有半个像素的偏移。,触觉媒体技术,我们的皮肤可以感觉环境的温度、湿度,也可以感觉压力,身体可以感觉振动、运动、旋转等。,触觉媒体是环境媒体,它描述了该环境中的特征和参数。,人体在信息交流过程中起的作用最大的是头部、手和躯干。与外界环境的触觉交互主要包括位置跟踪、力量反馈等方面。,目前对触觉媒体的研究还在初级阶段。,简单指点设备,指点设备是最简单的位置跟踪设备,它的主要作用是输入,如光笔、触摸屏和输入笔,位置跟踪设备,数据手套(,Data Glove,),是带在用户手上的手指跟踪设备,能对用户的手指动作进行检测,确定手指的位置和相互的运动。同时,也可以确定手部在空间中的位置,力反馈,力反馈包括对重量、对阻力和引力的感知,触觉反馈,人体区别出不同物体的质感和纹理结构,热觉反馈,提供对于温度的反应,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!