资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.1,音频信号,人们之所以能听到各种声音,是因为不同频率的声波通过空气产生振动,对人耳刺激的结果。规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。,模拟音频信号有两个基本参数:,频率,和,振幅,。,声源每秒钟可产生成百上千个波峰,每秒钟波峰所发生的数目就是音频信号的频率,声音的频率体现音调的高低,音频信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。,第,2,章 字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,如果要用计算机对音频信息进行处理,则首先要通过,A/D,(模,/,数),转换将模拟音频信号变成数字信号,实现音频信号的数字化。数字化的声音易于用计算机软件处理,现在几乎所有的专业化声音录制器、编辑器都是数字的。对模拟音频的数字化过程涉及到音频的,采样、量化和编码,。,第,2,章 数字音频处理技术,采样,量化,编码,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,1,采样,为实现,A/D,转换,把模拟音频信号波形进行分割,以转换成数字信号,这种方法称为,采样,(,Sampling,)。,采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。,采样频率,是指计算机每秒钟采集多少个声音样本。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。,最常用的采样频率有:,11.025kHz,、,22.05kHz,、,44.1kHz,等。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,2,量化,采样所得到的声波上的幅度值,影响音量的高低,该值的大小需要用某种数字化的方法来表示。通常把对声波波形幅度的数字化表示称之为,量化,。,量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的采样值归为一类,并赋于相同的量化值。采样信号的量化值采用二进制表示,表示样信号的幅度二进制的位数称量化位数。,在相同的采样频率之下,量化位数愈高,声音的质量越好。同样,在相同量化位数的情况下,采样频率越高,声音效果也就越好。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,3,编码,所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有效的数据中加入一些用于纠错同步和控制的数据。在数据回放时,可以根据所记录的纠错数据判别读出的声音数据是否有错,如果有错,可加以纠正。,音频信号编码常用的是,波形编码方法,,它是直接对波形采样、量化和编码,算法简单,易于实现。而且,声音恢复时能保持原有的特点,因此被广泛应用。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,4,用录音机录制声音文件,(,1,)配置好录音设备,选择输入声源。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,4,用录音机录制声音文件,(,2,)打开“属性”对话框,选择录制音源设备。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.2,模拟音频的数字化过程,4,用录音机录制声音文件,(,3,)启动“录音机”,第,2,章 数字音频处理技术,(,4,)开始录音。结束录音后存为,.WAV,文件。,2.1,数字音频基础,2.1.3,数字音频信息的质量与存储量,采样、量化和编码技术是音频数字化的关键技术。而采样频率、每个采样值的量化位数以及音频信息的声道数目,是影响数字化音频信息质量和容量的三个重要因素。采样频率越高、量化为数越大、声道数目越多,音频的质量就越高,但存储量就越大。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.3,数字音频信息的质量与存储量,1,音频质量的评价,(,1,)客观质量的度量,对声波的测量包括评价值的测量、声源的测量和音质的测量,其测量与分析工作,是使用带计算机处理系统的高级声学测量仪器来完成。度量声音客观质量的一个主要指标是信噪比,SNR,信噪比是有用信号与噪声之比的简称,其单位是分贝(,dB,)。信噪比越大,声音质量越好。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.3,数字音频信息的质量与存储量,1,音频质量的评价,(,2,)主观质量的度量,采用客观标准方法很难真正评定编码器的质量,在实际评价中,主观的质量度量比客观质量的度量更为恰当和合理。主观的质量度量通常是对某编码器的输出的声音质量进行评价。例如播放一段音乐,记录一段话,然后重放给一批实验者听,再由实验者进行综合评定,得出平均判分。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.3,数字音频信息的质量与存储量,1,音频质量的评价,(,2,)主观质量的度量,第,2,章 数字音频处理技术,MOS,标准,2.1,数字音频基础,2.1.3,数字音频信息的质量与存储量,1,音频质量的评价,(,3,)常用的数字化声音技术指标及音质,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.4,数字音频编码标准,1,G.711,2,G.721,G.721,和,G.711,标准都适用于,2003400Hz,窄带话音信号,可用于公共电话网。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.4,数字音频编码标准,5,MPEG,中的音频编码,国际标准化组织,/,国际电工委员会(,ISO/IEC,)所属,WG11,工作组,制定推荐了,MPEG,标准。,ISO/IEC11172,视频、音频的总数据率为,1.5Mb/s,。音频使用的采样率为,32kHz,,,44.lkHz,和,48kHz,。编码输出的数据率有许多种,由相关的参数决定。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.4,数字音频编码标准,6,AC-3,编码和解码,AC-3,音频编码标准起源于由美国的杜比(,DOLBY,)公司推出的,DOLBY AC-1,。,AC-1,应用的编码技术是自适应增量调制(,ADM,),它把,20kHz,的宽带立体声音频信号编码成,512kb/s,的数据流。,AC-1,曾在卫星电视和调频广播上得到广泛应用。,1990,年,DOLBY,实验室推出了立体声编码标准,AC-2,,应用在,PC,声卡和综合业务数字网等方面。,1992,年,DOLBY,实验室在,AC-2,的基础上,又开发了,DOLBY AC-3,的数字音频编码技术。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.4,数字音频编码标准,6,AC-3,编码和解码,AC-3,提供了五个声道从,20Hz,到,20kHz,的全通带频,即正前方的左(,L,)、中(,C,)和右(,R,),后边的两个独立的环绕声通道左后(,LS,)和右后(,RS,)。,AC-3,同时还提供了一个,100Hz,以下的超低音声道供用户选用,以弥补低音之不足,此声道仅为辅助而已,故定为,0.1,声道。所以,AC-3,被称为,5.1,声道。,AC-3,将这,6,个声道进行数字编码,并将它们压缩成一个通道,而它的比特率仅是,320kb/s,。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.5,音频文件的格式,1,WAV,文件,WAV,文件又称波形文件,是,Microsoft,公司的音频文件格式。,WAV,格式作为,Microsoft,的标准文件格式,用于保存,Windows,的音频信息资源,被,Windows,平台及其应用程序所广泛支持。,WAV,文件来源于对声音的模拟波形的采样,并以不同的量化位数把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了波形文件。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.5,音频文件的格式,3,MP3,文件,符合,MPEG,音频格式的文件称为,MPEG,音频文件。其压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为,3,层(,MPEG Audio Layer1/2/3,),分别对应,MP1,、,MP2,和,MP3,这三种声音文件。,CD,音质的音乐,未经压缩需要,10MB,存储空间,而经过,MP3,压缩编码后只有,1MB,左右,其音质基本保持不失真。,第,2,章 数字音频处理技术,2.1,数字音频基础,2.1.5,音频文件的格式,4,RealAudio,文件,RealAudio,文件是,RealNetworks,公司开发的一种新型流式音频(,Streaming Audio,)文件格式;它包含在,RealNetworks,所制定的音频、视频压缩规范,RealMedia,中,主要用于在低速率的广域网上实时传输音频信息。支持,RealAudio,格式的文件有:,.RA,,,.RM,,,.RAM,。,第,2,章 数字音频处理技术,2.2,音乐合成和,MIDI,规范,2.2.1,音乐合成,一个乐音必备的三要素是:音高、音色和音强。运动的旋律中的乐音还应具备时值,即持续时间。,音高:音高指声音的基频。声音的基频越高,给人的感觉就越激越;相反,声音的基频越低,给人的感觉就越低沉。,音色:音色是由声音的频谱决定的:各阶谐波的比例不同,随时间衰减的程度不同,音色就不同。各种乐器的音色是由其自身结构特点决定的。要用计算机模拟具有强烈真实感的旋律,音色的变化非常重要的。,音强和时值:音强也叫响度,是指声音信号的强弱程度,是由声波振动的振幅决定的。,声波振动的持续时间称为时值,它具有明显的相对性,一个音只有在包含了比它更短的音的旋律才会显得长。,第,2,章 数字音频处理技术,2.2,音乐合成和,MIDI,规范,2.2.1,音乐合成,任何一种波形信号都可以被分解成若干个频率不同的正弦波,一个乐器的声音也可以由若干个正弦波合成得到。调频(,FM,)是使高频振荡波的频率按调制信号规律变化的一种调制方式。采用不同调制波频率和调制指数,就可以方便地合成具有不同频谱分布的波形,再现某些乐器的音色。我们可以采用这种方法得到具有独特效果的“电子模拟声”,创造出丰富多彩的、真实乐器所不具备的音色。,第,2,章 数字音频处理技术,2.2,音乐合成和,MIDI,规范,2.2.2 MIDI,规范,1,什么是,MIDI,MIDI,(,Musical Instrument Digital Interface,,乐器数字接口)是一种技术规范,定义了为把电子乐器连接到计算机所需要的电缆和端口的硬件标准,计算机和具有,MIDI,接口的设备之间进行信息交换的规则,电子乐器之间传送数据的通信协议。,MIDI,声音是记录电子乐器键盘的弹奏过程,是将乐曲进行一种数字化的描述,这种描述称为,MIDI,消息(,MIDI Message,)。,第,2,章 数字音频处理技术,2.2,音乐合成和,MIDI,规范,2.2.2 MIDI,规范,MIDI,声音的优点:,(,1,)存储容量小,因为,MIDI,文件中记录的是一系列指令的集合,所以,,MIDI,文件所占的存储量非常小。,(,2,)可以提供背景音乐或音响效果的配音功能,当多媒体计算机播放图像、文字、图表时,或者播放波形音频、语音时,可以同时播放,MIDI,音乐作为背景音响效果。,(,3,)便于编辑和修改,MIDI,声音记录的是符号,是乐谱的数字化表示。因此,它可以在计算机中很方便地任意修改乐曲的速度、音调,甚至可以更换的乐器,从而得到不同的效果。,(,4,)可以在,MIDI,合成器中完全重现原来的演奏,MIDI,是把,MIDI,设备上产生的每个活动记录下来,形成,MIDI,文件,把它再传送到,MIDI,合成器时,就可以完全重现原来的演奏效果。,第,2,章 数字音频处理技术,2.3,声卡的应用,2.3.
展开阅读全文