资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,多媒体中心 庄伯金 ,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,多媒体中心 庄伯金 ,*,1,多媒体通信,第5讲 音频数据压缩编码,2,人耳结构图,3,人的听觉特性,人耳可听声音的频率范围:16,Hz20KHz,人耳可听声音,最灵敏,的频率范围:2,KHz5KHz,频域掩蔽效应,:强信号会降低人耳对该信号频率附近其他弱信号的敏感度。,时域掩蔽效应,:人耳在听一个强音之后,需要经过一个短暂的延时才能听到较弱的声音。,4,静音阈值与掩蔽阈值,5,SMR,信号屏蔽比,(,Signal-to-Mask Ratio,):掩蔽声的大小与掩蔽阈值之比值。,6,MPEG Audio,压缩技术,数据压缩的主要依据:是人耳朵的听觉特性,使用“心理声学模型(,psychoacoustic model)”,去掉低于“听觉阈值电平”的声音信号(听阀与频率、具体的人有关),利用“听觉掩蔽特性”,听觉阈值电平会随听到的不同频率的声音而发生变化。(例如,安静房间里的谈话和吵闹环境中的谈话),7,MPEG Audio,压缩技术,感知子带编码(,MPEG-1 Audio,采用),Dolby AC3(MPEG-2 Audio,采用),8,感知子带编码,分割子带,对每个子带分别进行量化和编码,将各子带的编码进行复合,9,感知子带编码,10,Dolby AC3,分析滤波器组把用,PCM,时间样本表示的声音信号变换成用频率系数块表示的声音信号。,谱包络编码的功能是对,“,分析滤波器组,”,输出的指数进行编码。指数代表粗糙的信号频谱,位分配使用,“,谱包络编码,”,输出的信息确定尾数编码所需要的位数,尾数量化按照位分配信息对尾数进行量化。,AC-3,帧格式将输出的频谱包络组成,AC-3,帧。,11,Dolby AC3,12,心理声学模型,
展开阅读全文