音频数据的压缩

上传人:豆**** 文档编号:240728043 上传时间:2024-05-03 格式:PPT 页数:44 大小:1.67MB
返回 下载 相关 举报
音频数据的压缩_第1页
第1页 / 共44页
音频数据的压缩_第2页
第2页 / 共44页
音频数据的压缩_第3页
第3页 / 共44页
点击查看更多>>
资源描述
音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术多媒体关键技术多媒体关键技术数据压缩概述数据压缩概述10.1音频数据的压缩音频数据的压缩10.2静态图像的数据压缩静态图像的数据压缩10.3运动图像的数据压缩运动图像的数据压缩10.4网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v由于多媒体数据量非常大,造成计算机的存储和网络传输负担由于多媒体数据量非常大,造成计算机的存储和网络传输负担若帧速率为25帧秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约100幅静止图像画面v解决办法之一就是进行解决办法之一就是进行数据压缩数据压缩,压缩后再进行存储和传输,压缩后再进行存储和传输,到需要时再解压、还原。到需要时再解压、还原。以目前常用的位图格式的图像存储方式为例,像素与像素之间无论是在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大,在允许一定限度失真的前提下,能够对图像数据进行很大程度的压缩。网络与多媒体技术网络与多媒体技术v数据压缩方法数据压缩方法无损压缩:无损压缩:利用数据的统计冗余进行压缩,可完全恢复原始数利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到统计冗余度理据而不引入任何失真,但压缩率受到统计冗余度理论限制,一般为论限制,一般为2:1到到5:1。多媒体应用中经常使用的无损压缩方法主要是基于多媒体应用中经常使用的无损压缩方法主要是基于统计的编码方案,如游程编码统计的编码方案,如游程编码(run length)、Huffman编码、算术编码和编码、算术编码和LZW编码等等。编码等等。常用工具:常用工具:WinRar、WinZip、ARC等等 10.1 数据压缩概述数据压缩概述网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩方法数据压缩方法有损压缩:有损压缩:利用了人类视觉和听觉器官对图像或声音中的某些频利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性,允许在压缩过程中损失一定的率成分不敏感的特性,允许在压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像或声音的影响较小,却换来了大得分对理解原始图像或声音的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。数据的压缩。常用的有损压缩方法有:常用的有损压缩方法有:PCM(脉冲编码调制脉冲编码调制)、预、预测编码、变换编码测编码、变换编码(主要是离散余弦变换方法主要是离散余弦变换方法)、插值、插值和外推法和外推法(空域亚采样、时域亚采样、自适应空域亚采样、时域亚采样、自适应)等等。等等。常用工具:常用工具:JPEG、MPEG等等 网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v衡量一种数据压缩技术的好坏有三个重要的指标衡量一种数据压缩技术的好坏有三个重要的指标压缩比压缩比图像质量或音质图像质量或音质压缩和解压的速度压缩和解压的速度v数据压缩原理数据压缩原理原始的多媒体信源数据原始的多媒体信源数据存在着客观上的大量冗余。存在着客观上的大量冗余。信信息理论认为:若信源编码的熵大于信源的实际熵,该息理论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。去掉冗余不会减少信息量,信源中一定存在冗余度。去掉冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,数据则不能完全仍可原样恢复数据;但若减少了熵,数据则不能完全恢复。不过在允许的范围内损失一定的熵,数据仍然恢复。不过在允许的范围内损失一定的熵,数据仍然可以近似恢复。可以近似恢复。网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩原理数据压缩原理因为人的感觉的某些不敏感性,多媒体数据中还存在因为人的感觉的某些不敏感性,多媒体数据中还存在着着从主观感受角度从主观感受角度看去的大量冗余,即:看去的大量冗余,即:在人眼允许在人眼允许的误差范围之内,压缩前后的图像如果不做非常细致的误差范围之内,压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差别的。的对比是很难觉察出两者的差别的。统计编码统计编码:无失真编码。根据信息出现概率的分布特:无失真编码。根据信息出现概率的分布特性进行的压缩编码。性进行的压缩编码。预测编码预测编码:有失真编码。根据原始的离散信号之间存:有失真编码。根据原始的离散信号之间存在关联性的特点,利用前面的一个或多个信号对下一在关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编个信号进行预测,然后对实际值和预测值的差进行编码。码。网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩原理数据压缩原理变换编码变换编码。有失真编码。对原始数据从初始空间或时。有失真编码。对原始数据从初始空间或时间域进行数学变换,使得信号中最重要的部分在变换间域进行数学变换,使得信号中最重要的部分在变换域中易于识别,并且集中出现,可以重点处理;相反域中易于识别,并且集中出现,可以重点处理;相反使能量较少的部分较分散,可以进行粗处理。使能量较少的部分较分散,可以进行粗处理。三个步骤:变换、变换域采样和量化。三个步骤:变换、变换域采样和量化。分析分析合成编码合成编码。有失真编码。通过对原始数据的分。有失真编码。通过对原始数据的分析,将其分解成一系列更适合表示的析,将其分解成一系列更适合表示的“基元基元”或或“参数参数”,编码仅对这些基本单元或参数进行。而译码时则借编码仅对这些基本单元或参数进行。而译码时则借助于一定的规则或模型,按照一定的算法将这些基元助于一定的规则或模型,按照一定的算法将这些基元或参数再或参数再“综合综合”成原数据的一个逼近。成原数据的一个逼近。网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩技术标准数据压缩技术标准H.26X。由。由CCITT(Consultative Committee of International Telegraph and Telephone 国际电报电国际电报电话咨询委员会,从话咨询委员会,从1993年年3月月1日起,改组为日起,改组为ITU)制定)制定的标准。包括的标准。包括H.261、H.263、H.264,简称为,简称为H.26X主要应用于实时视频通信领域主要应用于实时视频通信领域H.261:是:是ITU-T为在综合业务数字网(为在综合业务数字网(ISDN)上开展)上开展双向声像业务(可视电话、视频会议)而制定的,速双向声像业务(可视电话、视频会议)而制定的,速率为率为64kb/s的整数倍。的整数倍。H.261只对只对CIF(352288)和)和QCIF(176144)两种图像格式进行处理。)两种图像格式进行处理。H.261是是最早的运动图像压缩标准。最早的运动图像压缩标准。网络与多媒体技术网络与多媒体技术10.1 数据压缩概述数据压缩概述v数据压缩技术标准数据压缩技术标准H.263:在:在H.261的基础上发展而来的加强版,它借鉴的基础上发展而来的加强版,它借鉴了了MPEG-1的优点,支持的优点,支持PSTN,能在低带宽上传输高,能在低带宽上传输高质量的视频流。质量的视频流。H.264:由:由ISO/IEC(IEC,国际电工委员会)与,国际电工委员会)与ITU-T组成的联合视频组(组成的联合视频组(Joint Video Team,JVT)制定)制定的新一代视频压缩编码标准。在相同的重建图像质量的新一代视频压缩编码标准。在相同的重建图像质量下,下,H.264比比H.263+和和MPEG-4减小减小50%码率,对信道码率,对信道时延的适应性较强,既可工作于低时延模式以满足实时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等,又可工作于无时延限制的场时业务,如会议电视等,又可工作于无时延限制的场合,如视频存储等;提高网络适应性,加强对误码和合,如视频存储等;提高网络适应性,加强对误码和丢包的处理,提高解码器的差错恢复能力。丢包的处理,提高解码器的差错恢复能力。网络与多媒体技术网络与多媒体技术 音频信号压缩编码的主要依据是人耳的听音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:觉特性,主要有两点:1.1.人的听觉系统中存在一个人的听觉系统中存在一个听觉阈值电平听觉阈值电平,低,低于这个电平的声音信号人耳听不到于这个电平的声音信号人耳听不到 .2.2.人的听觉存在人的听觉存在屏蔽效应屏蔽效应。当几个强弱不同的。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且声音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关两者之间的关系与其相对频率的大小有关 .声音编码算法就是通过这些特性来声音编码算法就是通过这些特性来去掉更去掉更多的冗余数据多的冗余数据,来达到压缩数据的目的。,来达到压缩数据的目的。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术10.2 音频数据的压缩音频数据的压缩声音信号的基本参数:声音信号的基本参数:频率频率:信号每秒钟变化的次数。次声、可听声和超声:信号每秒钟变化的次数。次声、可听声和超声 振幅振幅:声波波形的最大位移。:声波波形的最大位移。音频压缩标准:音频压缩标准:电话质量的语音压缩标准电话质量的语音压缩标准:300Hz3.4KHz。当采样频当采样频率为率为8KHz,量化位数为,量化位数为8bit时所对应的速率为时所对应的速率为6kbit/s。调幅广播质量的音频压缩标准调幅广播质量的音频压缩标准:50Hz7KHz。当使用当使用16KHz的抽样频率和的抽样频率和14bit的量化位数时,信号速率为的量化位数时,信号速率为224kbit/s。符合。符合1988年年ITU制定的制定的G.722标准。标准。高保真立体声音频压缩标准高保真立体声音频压缩标准:50Hz20KHz。在在44.1KHz抽样频率下用抽样频率下用16bit量化,信号速率为每声道量化,信号速率为每声道705kbit/s。目前比较成熟的标准为目前比较成熟的标准为“MPEG音频音频”。网络与多媒体技术网络与多媒体技术 在多媒体中,音频有很多压缩编码标准:在多媒体中,音频有很多压缩编码标准:1.MP31.MP3音频音频 MP3 MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,简单地,简单地说就是一种声音文件的压缩格式。是目前最普说就是一种声音文件的压缩格式。是目前最普及的音频压缩格式,是典型的有损压缩。及的音频压缩格式,是典型的有损压缩。MPEG-1MPEG-1音频压缩标准里包括了三个使用高性音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案能音频数据压缩方法的感知编码方案 ,按照压,按照压缩质量缩质量(每每BitBit的声音效果的声音效果)和编码方案的复杂程和编码方案的复杂程度分别是度分别是Layer1Layer1、Layer2Layer2、Layer3Layer3。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术vMPEG-1MPEG-1音频的层次与压缩比率音频的层次与压缩比率 Layer1(相当于384kbps立体声信号)4:1Layer2(相当于192256kbps立体声信号)6:18:1Layer3(相当于112154kbps立体声信号)10:112:1网络与多媒体技术网络与多媒体技术 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术,将的技术,将音乐以音乐以1:10 1:10 甚至甚至 1:12 1:12 的压缩率,压缩成容量的压缩率,压缩成容量较小的文件,换句话说,能够在音质丢失很小较小的文件,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为常好的保持了原来的音质。正是因为MP3MP3体积小,体积小,音质高的特点使得音质高的特点使得MP3MP3格式几乎成为网上音乐的格式几乎成为网上音乐的代名词。每分钟音乐的代名词。每分钟音乐的MP3MP3格式只有格式只有1MB1MB左右大左右大小,这样每首歌的大小只有小,这样每首歌的大小只有3-43-4兆字节。使用兆字节。使用MP3MP3播放器对播放器对MP3MP3文件进行实时的解压缩文件进行实时的解压缩(解码解码),这样,高品质的,这样,高品质的MP3MP3音乐就播放出来了。音乐就播放出来了。MP3MP3音频音频网络与多媒体技术网络与多媒体技术 2.MP3PRO2.MP3PRO MP3PRO MP3PRO,它是,它是 Thomson MultimediaThomson Multimedia多媒体多媒体公司推出的一个公司推出的一个MP3MP3格式的升级版本,格式的升级版本,MP3PROMP3PRO可可以把声音文件压缩到原有以把声音文件压缩到原有MP3MP3格式的一半大小,格式的一半大小,但却可以保持相同的音质。但却可以保持相同的音质。MP3Pro MP3Pro制式是利用制式是利用低转送速率技术低转送速率技术(bit bit per secper sec),即平常一首),即平常一首MP3MP3的频率大多是的频率大多是128kbit128kbit,而,而MP3ProMP3Pro则固定于则固定于80kbit80kbit,降低码率,降低码率就可以降低文件大小就可以降低文件大小,把每首把每首MP3MP3所占空间减低所占空间减低到原有的到原有的5 5至至6 6成;但音质却丝毫无损。成;但音质却丝毫无损。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 2.MP3PRO2.MP3PRO MP3PRO文件在播放上完全与MP3兼容,也就是说,老的MP3文件可以在新的MP3PRO播放器上进行播放,同时,新的MP3PRO可以在标准的MP3软件和设备上播放,但效果可能较差,因为两者录制方式不同。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 3.OGG3.OGG Ogg是一种先进的有损的音频压缩技术,正式名称是Ogg Vorbis,是一种免费的开源音频格式。OGG编码格式远比90年代开发成功的MP3先进,它可以在相对较低的数据速率下实现比MP3更好的音质。Ogg Vorbis支持VBR(可变比特率)和ABR(平均比特率)两种编码方式,Ogg还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 3.OGG3.OGG OGG格式可以对所有声道进行编码,支持多声道模式,而不像MP3只能编码双声道。多声道音乐会带来更多临场感,欣赏电影和交响乐时更有优势,这场革命性的变化是MP3无法支持的。在而且未来人们对音质要求不断提高,Ogg的优势将更加明显。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 4.WMA 4.WMA WMA(Windows MediaAudio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右.WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 4.WMA 4.WMA WMA还支持音频流技术,适合在网络上在线播放,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统WindowsXP中,WMA是默认的编码格式.音质好的可与CD媲美,压缩率较高,可用于网络广播。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 4.WMA 4.WMA WMA(Windows MediaAudio)格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右.WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术 4.WMA 4.WMA WMA还支持音频流技术,适合在网络上在线播放,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统WindowsXP中,WMA是默认的编码格式.音质好的可与CD媲美,压缩率较高,可用于网络广播。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术5 5、MP4MP4vMP4MP4并并不不是是MPEG-4MPEG-4或或者者MPEG-1Layer4MPEG-1Layer4,它它的的出出现现是是针针对对MP3MP3的大众化、无版权的一种保护格式。的大众化、无版权的一种保护格式。vMP4MP4使使用用的的是是MPEG-2 MPEG-2 AACAAC技技术术也也就就是是俗俗称称的的a2ba2b或或AACAAC。其其中中,MPEG-2MPEG-2是是MPEGMPEG于于19941994年年1111月月针针对对数数码码电电视视(数数码码影影像像)提提出出的的。它它的的特特点点就就是是,音音质质更更加加完完美美而而压压缩缩比比更更加加大大(1:15)(1:15)。MPEG-2 MPEG-2 AAC(ISO/IEC AAC(ISO/IEC 13818-7)13818-7)在在采采样样率率为为8 896KHz96KHz下下提提供供了了1 14848个个声声道道可可选选范范围围的的高高质质量量音音频频编编码码。AACAAC就就是是Advanced Advanced Audio Audio Coding(Coding(先先进进音音频频编编码码)的的意意思思,适适用用于于从从比比特特率率在在8kbit/s8kbit/s单单声声道道的的电电话话音音质质到到160kbit/s160kbit/s多多声声道道的的超超高高质质量量音音频频范范围围内内的的编编码码,并并且且允允许许对对多多媒媒体体进行编码进行编码/解码。解码。10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术vAACAAC与与MP3MP3相比,增加了诸如对立体声的完美再现、比特流相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等效果音扫描、多媒体控制、降噪优异等MP3MP3没有的特性,使没有的特性,使得在音频压缩后仍能完美的再现得在音频压缩后仍能完美的再现CDCD音质。音质。v AACAAC技术主要由以下三个部分组成。技术主要由以下三个部分组成。第一,第一,AT&TAT&T的音频压缩技术专利的音频压缩技术专利。它可以将它可以将AACAAC压缩比提高压缩比提高到到20:120:1而不损失音质。这样,一首而不损失音质。这样,一首3 3分钟的歌仅仅需要分钟的歌仅仅需要2.25MB2.25MB,这在互联网上的下载速度是很惊人的。,这在互联网上的下载速度是很惊人的。第二、第二、安全数据库安全数据库。它可以为你的它可以为你的AAC MusicAAC Music创建一个特定创建一个特定的密钥,将此密钥存于其数据库中。同时,只有的密钥,将此密钥存于其数据库中。同时,只有AACAAC的播放的播放器才能播放含有这种密钥的文件。器才能播放含有这种密钥的文件。第三、第三、协议认证协议认证。这个认证包含了复制许可、允许复制副本这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。息。MP4网络与多媒体技术网络与多媒体技术vMP4MP4技术的优越性要远远高于技术的优越性要远远高于MP3MP3,因为它更适合多媒体技,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,术的发展以及视听欣赏的需求。但是,MP4MP4是一种商品,它是一种商品,它利用改良后的利用改良后的MPEG-2 AACMPEG-2 AAC技术并强加上由出版公司直接授技术并强加上由出版公司直接授权的知识产权协议作为新的标准;而权的知识产权协议作为新的标准;而MP3MP3是一种自由音乐格是一种自由音乐格式,任何人都可以自由使用。此外,式,任何人都可以自由使用。此外,MP4MP4实际上是由音乐出实际上是由音乐出版界联合授意的官方标准;版界联合授意的官方标准;MP3MP3则是广为流传的民间标准。则是广为流传的民间标准。相比之下,相比之下,MP3MP3的灵活和自由度要远远大于的灵活和自由度要远远大于MP4MP4,这使得音,这使得音乐发烧友们更倾向于使用乐发烧友们更倾向于使用MP3MP3。更重要的一点是,。更重要的一点是,MP3MP3是目是目前最为流行的一种音乐格式,它占据着大量的网络资源,前最为流行的一种音乐格式,它占据着大量的网络资源,这使得这使得MP4MP4的推广普及难上加难。的推广普及难上加难。MP4网络与多媒体技术网络与多媒体技术 6.6.WAVE WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播 10.2 音频数据的压缩音频数据的压缩网络与多媒体技术网络与多媒体技术10.3 静态图像的数据压缩静态图像的数据压缩JPEG标准标准:用于灰度或彩色图像的压缩标准。适用于不太复杂或一般取自真实景象的图像压缩。压缩比率可达20:1或25:1。无损模式通常采用2:1压缩JPEG2000:高压缩率、无损压缩、渐进传输、兴趣区域压缩、色彩模式、图像处理简单。静态图像压缩技术主要是对空间信息进行压缩,目的是在满足一定图像质量的条件下,缩小图像文件所占用的存储空间,从而减小存储容量和占用尽量小的网络带宽。网络与多媒体技术网络与多媒体技术 JPEG JPEG标准标准 国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合图像专家组”JPEG(Joint Photograph coding Experts Group)于1991年提出的“多灰度静止图像的数字压缩编码”(简称JPEG标准)。这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准,是最常用的图像文件格式,是一种有损压缩,压缩比很大。10.3 静态图像的数据压缩静态图像的数据压缩网络与多媒体技术网络与多媒体技术 JPEG-2000标准 随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求。针对这些问题,专家们开始了下一代JPEG 2000标准的制定,最终标准于2000年12月出台。JPEG 2000的特点:高压缩率高压缩率 有损有损/无损压缩无损压缩 渐进传输渐进传输 感兴趣区域压缩感兴趣区域压缩 色彩模式色彩模式 图像处理简单图像处理简单 10.3 静态图像的数据压缩静态图像的数据压缩网络与多媒体技术网络与多媒体技术标准JPEGJPEG 2000主要编码技术离散余弦变换(DCT)知觉量化Zigzag扫描霍夫曼编码算术编码离散小波变化(DWT)EBCOT核心算法ROI编码空间可扩展编码质量可扩展编码面向对象编码位图形状编码容错编码、TCQ、零数扫描压缩比230250算法效率30:1以上急剧下降100:1以上急剧衰减速率失真特性比JPEG提高30%应用场合Internet数字照相图像视频编辑Internet数字照相数字图书馆电子商务打印、扫描、传真、遥感JPEG与与JPEG 2000的性能比较的性能比较网络与多媒体技术网络与多媒体技术10.4 运动图像的数据压缩运动图像的数据压缩v 视频视频视频视频:运动图像即静止图像的连续播放状态:运动图像即静止图像的连续播放状态v 压缩目标压缩目标压缩目标压缩目标:尽可能保证视觉效果的前提下减少视频数据率。:尽可能保证视觉效果的前提下减少视频数据率。v 压缩比压缩比压缩比压缩比:压缩后的数据量与压缩前的数据量之比。:压缩后的数据量与压缩前的数据量之比。v 运动图像的数据压缩方法运动图像的数据压缩方法运动图像的数据压缩方法运动图像的数据压缩方法 有损和无损压缩有损和无损压缩有损和无损压缩有损和无损压缩 帧内和帧间压缩帧内和帧间压缩帧内和帧间压缩帧内和帧间压缩 对称和不对称压缩对称和不对称压缩对称和不对称压缩对称和不对称压缩网络与多媒体技术网络与多媒体技术MPEG(运动图像专家组Moving Pictures Experts Group)标准是一系列视频、音频、数据的压缩标准。分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比。压缩比可达到200:1,同时图像和音频的质量也非常高。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术v最初最初MPEGMPEG专家组的工作项目是专家组的工作项目是3 3个,即在个,即在1.5Mbps1.5Mbps,l0Mbpsl0Mbps,40Mbps40Mbps传输速率下对图像编码,分别传输速率下对图像编码,分别命名为命名为MPEG-1MPEG-1,MPEG-2MPEG-2,MPEG-3MPEG-3。l992l992年,年,MPEG-MPEG-2 2适用范围扩大到适用范围扩大到HDTVHDTV,能支持,能支持MPEG-3MPEG-3的所有功能,的所有功能,因而因而MFEG-3MFEG-3被取消。被取消。v主要有:主要有:MPEG-1MPEG-1、MPEG-2 MPEG-2、MPEG-4 MPEG-4、MPEG-7 MPEG-7、MPEG-21MPEG-2110.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术MPEG-1 MPEG-1 MPEG-1 MPEG-1 标准标准标准标准vMPEG-1MPEG-1即即“用于数字存储媒体运动图像及其用于数字存储媒体运动图像及其伴音速率为伴音速率为1.5Mbps1.5Mbps的压缩编码的压缩编码”,于于19921992年年正式出版。正式出版。vMPEG-1MPEG-1的任务主要是,将视频信号及其伴音的任务主要是,将视频信号及其伴音以可接收的重建质量压缩到约以可接收的重建质量压缩到约1.5Mbps1.5Mbps的码率,的码率,并复合成一个单一的并复合成一个单一的MPEGMPEG位流,同时保证视位流,同时保证视频和音频的同步。频和音频的同步。vMPEG-1 MPEG-1 是是VCDVCD视频的压缩标准。视频的压缩标准。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术MPEG-1MPEG-1标准标准分4个部分MPEGMPEG系统:系统:定义音频、视频及有关数据的同步;定义音频、视频及有关数据的同步;MPEGMPEG视频:视频:定义视频数据的编码和重建图像所定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为需的解码过程,亮度信号分辨率为360240360240,色度信号分辨率为色度信号分辨率为180120180120;MPEGMPEG音频:音频:定义音频数据的编码和解码;定义音频数据的编码和解码;一致性测试一致性测试。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 MPEG-2 MPEG-2标准标准 MPEG-2 MPEG-2标准于标准于19941994年公布,包括系统部分、视频年公布,包括系统部分、视频部分、音频部分及符合性测试部分。部分、音频部分及符合性测试部分。MPEG-2MPEG-2编码标准希望囊括数字电视、图象通信各编码标准希望囊括数字电视、图象通信各领域的编码标准,领域的编码标准,MPEG-2MPEG-2按压缩比大小的不同分成五按压缩比大小的不同分成五个档次个档次(profile)(profile),每一个档次又按图象清晰度的不,每一个档次又按图象清晰度的不同分成四种图象格式,或称为级别同分成四种图象格式,或称为级别(level)(level)。五个档。五个档次四种级别共有次四种级别共有2020种组合,但实际应用中有些组合不种组合,但实际应用中有些组合不太可能出现,较常用的是太可能出现,较常用的是1111种组合。种组合。MPEG-2 MPEG-2 是是DVDDVD视频的压缩标准。视频的压缩标准。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 MPEG-4 标准 MPEG-MPEG-4 4标准于标准于1991998 8年公布,是为了播放流式媒体的年公布,是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,采高质量视频而专门设计的,它可利用很窄的带度,采用了全新的压缩理念,通过帧重建技术,压缩和传输用了全新的压缩理念,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量,并数据,以求使用最少的数据获得最佳的图像质量,并将之作为将之作为网络上传送网络上传送之用。之用。MPEG-4 MPEG-4 可把可把DVDDVD内内MPEG-2MPEG-2的视频文件转换为体积更的视频文件转换为体积更小的文件。还包含了以前小的文件。还包含了以前MPEGMPEG压缩标准所不具备的比压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。一些特殊功能。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 MPEG-7 标准 MPEG-MPEG-7 7 是是“多媒体内容描述接口多媒体内容描述接口”,”,(Multimedia Content Description Interface)。准确说来,准确说来,MPEG-7MPEG-7并不是一种压缩编码方法,继并不是一种压缩编码方法,继 MPEG-4MPEG-4之后,要解决的之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。搜索。MPEG7MPEG7就是针对这个矛盾的解决方案。就是针对这个矛盾的解决方案。其目标就是产生一种描述多媒体信息的标准其目标就是产生一种描述多媒体信息的标准,并将并将该描述与所描述的内容相联系该描述与所描述的内容相联系,以实现以实现快速有效的检快速有效的检索索。只有首先解决了多媒体信息的规范化描述后。只有首先解决了多媒体信息的规范化描述后,才才能更好地实现信息定位。该标准不包括对描述特征的能更好地实现信息定位。该标准不包括对描述特征的自动提取。自动提取。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 MPEG-7 MPEG-7 标准可以独立于其他标准可以独立于其他 MPEG MPEG 标准使用标准使用,MPEG-7 MPEG-7 的适用范围广泛的适用范围广泛,既可以应用于存储既可以应用于存储,也可以也可以用于流式应用用于流式应用,它还可以在实时或非实时的环境下应用。它还可以在实时或非实时的环境下应用。MPEGMPEG7 7的应用领域包括:的应用领域包括:数字图书馆数字图书馆(如图像目录、音乐词典等如图像目录、音乐词典等);多媒体目录服务多媒体目录服务(如黄页如黄页);广播媒体的选择;广播媒体的选择(如如无线电频道、无线电频道、TVTV频道等频道等);多媒体编辑多媒体编辑(如个人电子新闻服务如个人电子新闻服务,多媒体创作等多媒体创作等)。潜在的应用领域包括:教育、娱乐、新闻、旅游、潜在的应用领域包括:教育、娱乐、新闻、旅游、医疗、购物、地理信息系统等领域医疗、购物、地理信息系统等领域。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 MPEG-21 MPEG-21 标准标准 MPEG-21 MPEG-21 标准是多媒体框架和综合应用方面的框架。标准是多媒体框架和综合应用方面的框架。该标准致力于在大范围的网络上实现透明的传输和对该标准致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。多媒体资源的充分利用。其目标就是将各种标准集成起来以协调各种技术,管其目标就是将各种标准集成起来以协调各种技术,管理多媒体商务。理多媒体商务。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术 RM/RMVB RM/RMVB RM(Real Media)是RealNetworks公司所制定的音频视频压缩规范,是一种流媒体格式。用户可以使用RealPlayer或RealOne Player对符合RealMedia技术规范的网络音频/视频资源进行实况转播,并且RealMedia还可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用RealPlayer播放器可以在不下载音频/视频内容的条件下实现在线播放。10.4 运动图像的数据压缩运动图像的数据压缩网络与多媒体技术网络与多媒体技术本章小结本章小结v 多媒体数据压缩的必要性和可能性多媒体数据压缩的必要性和可能性v 多媒体数据压缩技术及其标准多媒体数据压缩技术及其标准v 多媒体数据压缩的技术指标多媒体数据压缩的技术指标v 常用多媒体数据压缩标准常用多媒体数据压缩标准
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!