多媒体数据压缩技术教学

资源描述

单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,网络与多媒体技术,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,第十章多媒体数据压缩技术,计算机网络与多媒体技术,多媒体关键技术,数据压缩概述,10.1,音频数据的压缩,10.2,静态图像的数据压缩,10.3,运动图像的数据压缩,10.4,10.1,数据压缩概述,由于多媒体数据量非常大，造成计算机的存储和网络传输负担,若帧速率为25帧秒，则1,s,的数据量大约为25,MB，,一个640,MB,的光盘只能存放大约25,s,的动态图像,一幅640480分辨率的24位真彩色图像的数据量约为900,KB；,一个100,MB,的硬盘只能存储约100幅静止图像画面,解决办法之一就是进行,数据压缩,，压缩后再进行存储和传输，到需要时再解压、还原。,以目前常用的位图格式的图像存储方式为例，像素与像素之间无论是在行方向还是在列方向都具有很大的相关性，因而整体上数据的,冗余度,很大，在允许一定限度失真的前提下，能够对图像数据进行很大程度的压缩。,数据压缩方法,无损压缩：,利用数据的统计冗余进行压缩，可完全恢复原始数据而不引入任何失真，但压缩率受到统计冗余度理论限制，一般为2：1到5：1。,多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方案，如游程编码(,run length)、Huffman,编码、算术编码和,LZW,编码等等。,常用工具：,WinRar,、,WinZip,、,ARC,等,10.1,数据压缩概述,10.1,数据压缩概述,数据压缩方法,有损压缩：,利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性，允许在压缩过程中损失一定的信息；虽然不能完全恢复原始数据，但是所损失的部分对理解原始图像或声音的影响较小，却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。,常用的有损压缩方法有：,PCM(,脉冲编码调制)、预测编码、变换编码(主要是离散余弦变换方法)、插值和外推法(空域亚采样、时域亚采样、自适应)等等。,常用工具：,JPEG、MPEG,等,10.1,数据压缩概述,衡量一种数据压缩技术的好坏有三个重要的指标,压缩比,图像质量或音质,压缩和解压的速度,数据压缩原理,原始的多媒体信源数据,存在着客观上的大量冗余。,信息理论认为：若信源编码的熵大于信源的实际熵，该信源中一定存在冗余度。去掉冗余不会减少信息量，仍可原样恢复数据；但若减少了熵，数据则不能完全恢复。不过在允许的范围内损失一定的熵，数据仍然可以近似恢复。,10.1,数据压缩概述,数据压缩原理,因为人的感觉的某些不敏感性，多媒体数据中还存在着,从主观感受角度,看去的大量冗余，即：,在人眼允许的误差范围之内，压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差别的。,统计编码,：无失真编码。根据信息出现概率的分布特性进行的压缩编码。,预测编码,：有失真编码。根据原始的离散信号之间存在关联性的特点，利用前面的一个或多个信号对下一个信号进行预测，然后对实际值和预测值的差进行编码。,10.1,数据压缩概述,数据压缩原理,变换编码,。有失真编码。对原始数据从初始空间或时间域进行数学变换，使得信号中最重要的部分在变换域中易于识别，并且集中出现，可以重点处理；相反使能量较少的部分较分散，可以进行粗处理。,三个步骤：变换、变换域采样和量化。,分析,合成编码,。有失真编码。通过对原始数据的分析，将其分解成一系列更适合表示的,“,基元,”,或,“,参数,”，,编码仅对这些基本单元或参数进行。而译码时则借助于一定的规则或模型，按照一定的算法将这些基元或参数再,“,综合,”,成原数据的一个逼近。,10.1,数据压缩概述,数据压缩技术标准,H.26X,。由,CCITT,（,Consultative Committee of International Telegraph and Telephone,国际电报电话咨询委员会，从,1993,年,3,月,1,日起，改组为,ITU,）制定的标准。包括,H.261,、,H.263,、,H.264,，简称为,H.26X,主要应用于实时视频通信领域,H.261,：是,ITU-T,为在综合业务数字网（,ISDN,）上开展双向声像业务（可视电话、视频会议）而制定的，速率为,64kb/s,的整数倍。,H.261,只对,CIF,（,352288,）和,QCIF,（,176144,）两种图像格式进行处理。,H.261,是最早的运动图像压缩标准。,10.1,数据压缩概述,数据压缩技术标准,H.263,：在,H.261,的基础上发展而来的加强版，它借鉴了,MPEG-1,的优点，支持,PSTN,，能在低带宽上传输高质量的视频流。,H.264,：由,ISO/IEC,（,IEC,，国际电工委员会）与,ITU-T,组成的联合视频组（,Joint Video Team,，,JVT,）制定的新一代视频压缩编码标准。在相同的重建图像质量下，,H.264,比,H.263+,和,MPEG-4,减小,50%,码率，对信道时延的适应性较强，既可工作于低时延模式以满足实时业务，如会议电视等，又可工作于无时延限制的场合，如视频存储等；提高网络适应性，加强对误码和丢包的处理，提高解码器的差错恢复能力。,音频信号压缩编码的主要依据是人耳的听觉特性，主要有两点：,1.,人的听觉系统中存在一个,听觉阈值电平,，低于这个电平的声音信号人耳听不到,.,2.,人的听觉存在,屏蔽效应,。当几个强弱不同的声音同时存在时，强声使弱声难以听到，并且两者之间的关系与其相对频率的大小有关,.,声音编码算法就是通过这些特性来,去掉更多的冗余数据,，来达到压缩数据的目的。,10.2,音频数据的压缩,10.2,音频数据的压缩,声音信号的基本参数：,频率,：信号每秒钟变化的次数。次声、可听声和超声,振幅,：声波波形的最大位移。,音频压缩标准：,电话质量的语音压缩标准,：,300Hz3.4KHz。,当采样频率为,8KHz,，量化位数为,8bit,时所对应的速率为,6kbit/s,。,调幅广播质量的音频压缩标准,：,50Hz7KHz。,当使用,16KHz,的抽样频率和,14bit,的量化位数时，信号速率为,224kbit/s,。符合,1988,年,ITU,制定的,G.722,标准。,高保真立体声音频压缩标准,：,50Hz20KHz。,在,44.1KHz,抽样频率下用,16bit,量化，信号速率为每声道,705kbit/s。,目前比较成熟的标准为,“MPEG,音频,”。,在多媒体中，音频有很多压缩编码标准：,1.MP3,音频,MP3,的全名是,MPEG Audio Layer-3,，简单地说就是一种声音文件的压缩格式。是目前最普及的音频压缩格式，是典型的有损压缩。,MPEG-1,音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案，按照压缩质量,(,每,Bit,的声音效果,),和编码方案的复杂程度分别是,Layer1,、,Layer2,、,Layer3,。,10.2,音频数据的压缩,MPEG-1,音频的层次与压缩比率,Layer1(,相当于,384kbps,立体声信号,),4:1,Layer2(,相当于,192256kbps,立体声信号,),6:18:1,Layer3(,相当于,112154kbps,立体声信号,),10:112:1,MP3,是利用,MPEG Audio Layer 3,的技术，将音乐以,1:10,甚至,1:12,的压缩率，压缩成容量较小的文件，换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为,MP3,体积小，音质高的特点使得,MP3,格式几乎成为网上音乐的代名词。每分钟音乐的,MP3,格式只有,1MB,左右大小，这样每首歌的大小只有,3-4,兆字节。使用,MP3,播放器对,MP3,文件进行实时的解压缩,(,解码,),，这样，高品质的,MP3,音乐就播放出来了。,MP3,音频,2.MP3PRO,MP3PRO,，它是,Thomson Multimedia,多媒体公司推出的一个,MP3,格式的升级版本，,MP3PRO,可以把声音文件压缩到原有,MP3,格式的一半大小，但却可以保持相同的音质。,MP3Pro,制式是利用,低转送速率技术,（,bit per sec,），即平常一首,MP3,的频率大多是,128kbit,，而,MP3Pro,则固定于,80kbit,，降低码率就可以降低文件大小,把每首,MP3,所占空间减低到原有的,5,至,6,成；但音质却丝毫无损。,10.2,音频数据的压缩,2.MP3PRO,MP3PRO,文件在播放上完全与,MP3,兼容，也就是说，老的,MP3,文件可以在新的,MP3PRO,播放器上进行播放，同时，新的,MP3PRO,可以在标准的,MP3,软件和设备上播放，但效果可能较差，因为两者录制方式不同。,10.2,音频数据的压缩,3.OGG,Ogg,是一种先进的有损的音频压缩技术，正式名称是,Ogg Vorbis,，是一种免费的开源音频格式。,OGG,编码格式远比,90,年代开发成功的,MP3,先进，它可以在相对较低的数据速率下实现比,MP3,更好的音质。,Ogg Vorbis,支持,VBR,（可变比特率）和,ABR,（平均比特率）两种编码方式，,Ogg,还具有比特率缩放功能，可以不用重新编码便可调节文件的比特率。,10.2,音频数据的压缩,3.OGG,OGG,格式可以对所有声道进行编码，支持多声道模式，而不像,MP3,只能编码双声道。多声道音乐会带来更多临场感，欣赏电影和交响乐时更有优势，这场革命性的变化是,MP3,无法支持的。在而且未来人们对音质要求不断提高，,Ogg,的优势将更加明显。,10.2,音频数据的压缩,4.WMA,WMA(Windows MediaAudio),格式是来自于微软的重量级选手，后台强硬，音质要强于,MP3,格式，更远胜于,RA,格式，它是以减少数据流量但保持音质的方法来达到比,MP3,压缩率更高的目的，,WMA,的压缩率一般都可以达到,1,：,18,左右,.,WMA,的另一个优点是内容提供商可以通过,DRM,（,DigitalcentersManagement,）方案如,Windows Media centersManager7,加入防拷贝保护。,10.2,音频数据的压缩,4.WMA,WMA,还支持音频流技术，适合在网络上在线播放，更方便的是不用象,MP3,那样需要安装额外的播放器，而,Windows,操作系统和,WindowsMediaPlayer,的无缝捆绑让你只要安装了,windows,操作系统就可以直接播放,WMA,音乐，新版本的,WindowsMediaPlayer7.0,更是增加了直接把,CD,光盘转换为,WMA,声音格式的功能，在新出品的操作系统,WindowsXP,中，,WMA,是默认的编码格式,.,音质好的可与,CD,媲美，压缩率较高,可用于网络广播。,10.2,音频数据的压缩,4.WMA,WMA(Windows MediaAudio),格式是来自于微软的重量级选手，后台强硬，音质要强于,MP3,格式，更远胜于,RA,格式，它是以减少数据流量但保持音质的方法来达到比,MP3,压缩率更高的目的，,WMA,的压缩率一般都可以达到,1,：,18,左右,.,WMA,的另一个优点是内容提供商可以通过,DRM,（,DigitalcentersManagement,）方案如,Windows Media centersManager7,加入防拷贝保护。,10.2,音频数据的压缩,4.WMA,WMA,还支持音频流技术，适合在网络上在线播放，更方便的是不用象,MP3,那样需要安装额外的播放器，而,Windows,操作系统和,WindowsMediaPlayer,的无缝捆绑让你只要安装了,windows,操作系统就可以直接播放,WMA,音乐，新

展开阅读全文

多媒体数据压缩技术教学

最新文档