音频数据压缩编码

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,多媒体中心庄伯金 ,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,多媒体中心庄伯金 ,*,1,多媒体通信,第5讲音频数据压缩编码,2,人耳结构图,3,人的听觉特性,人耳可听声音的频率范围：16,Hz20KHz,人耳可听声音,最灵敏,的频率范围：2,KHz5KHz,频域掩蔽效应,：强信号会降低人耳对该信号频率附近其他弱信号的敏感度。,时域掩蔽效应,：人耳在听一个强音之后，需要经过一个短暂的延时才能听到较弱的声音。,4,静音阈值与掩蔽阈值,5,SMR,信号屏蔽比,（,Signal-to-Mask Ratio,）：掩蔽声的大小与掩蔽阈值之比值。,6,MPEG Audio,压缩技术,数据压缩的主要依据：是人耳朵的听觉特性，使用“心理声学模型(,psychoacoustic model)”,去掉低于“听觉阈值电平”的声音信号（听阀与频率、具体的人有关）,利用“听觉掩蔽特性”，听觉阈值电平会随听到的不同频率的声音而发生变化。（例如，安静房间里的谈话和吵闹环境中的谈话）,7,MPEG Audio,压缩技术,感知子带编码（,MPEG-1 Audio,采用）,Dolby AC3（MPEG-2 Audio,采用）,8,感知子带编码,分割子带,对每个子带分别进行量化和编码,将各子带的编码进行复合,9,感知子带编码,10,Dolby AC3,分析滤波器组把用,PCM,时间样本表示的声音信号变换成用频率系数块表示的声音信号。,谱包络编码的功能是对,“,分析滤波器组,”,输出的指数进行编码。指数代表粗糙的信号频谱,位分配使用,“,谱包络编码,”,输出的信息确定尾数编码所需要的位数,尾数量化按照位分配信息对尾数进行量化。,AC-3,帧格式将输出的频谱包络组成,AC-3,帧。,11,Dolby AC3,12,心理声学模型,

展开阅读全文

音频数据压缩编码

最新文档