数字音频技术课件

上传人:29 文档编号:242685198 上传时间:2024-08-31 格式:PPT 页数:43 大小:2.54MB
返回 下载 相关 举报
数字音频技术课件_第1页
第1页 / 共43页
数字音频技术课件_第2页
第2页 / 共43页
数字音频技术课件_第3页
第3页 / 共43页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数字音频技术,数字音频技术,主要内容,声音及其属性,数字化音频,音频压缩技术,音频文件类型,编辑制作数字音频素材,GoldWave,录音机,主要内容声音及其属性,一、声音及其属性,声音是由空气中分子的振动而产生的。它是通过空气传播的一种连续的波,叫声波。自然界的声音是一个随时间而变化的连续信号,可近似地看成是一种周期性的函数。通常用模拟的连续波形描述声波的形状,单一频率的声波可用一条正弦波表示。,一、声音及其属性声音是由空气中分子的振动而产生的。它是通过空,声音的分类,语音:,人的说话声不仅是一种波形, 而且还通过语气、语速、语调携带着比文本更加丰富的信息。这些信息往往可以通过特殊的软件进行抽取。,音乐:,音乐是一种符号化了的声音,这种符号就是乐谱,音乐则是转变为符号媒体形式的声音。,音效:,为增进场面之真实感、气氛或戏剧信息,而加于声带上的杂音或声音。简单地说,音效就是指由声音所制造的效果。,声音的分类,声音的三要素,音调:声音的高低(物理学定义);与声音的频率正相关。高音和低音,音强:声音的响亮程度,与振幅相关,取决于声波信号的强弱,与声音信号的幅度成正比。分贝,dB,。常说的“音量”指的是音强。,音色:音的感觉特性,与波形相关,取决于声波的频谱,由混入基音的泛音所决定。若中、高泛音丰富,音色就明亮;若低频泛音丰富,音色就低沉。,声音的三要素,二、数字化音频,音频,定义:人类听觉所感知范围内的频率,也称声频,按照人们听觉的频率范围,对声音的分类:,次声波:频率低于,20Hz,的信号,也称为亚音频,音频:频率范围在,2020kHz,的声音信号,人耳能够听到的声音信号。属于多媒体音频信息范畴。,超声波:频率高于,20kHz,的声音信号,也称为超音频,二、数字化音频音频,次声波,超声波,音频信号,语音信号,f/Hz,20,300,3000,20000,图:按频率分类的声音,次声波超声波音频信号语音信号f/Hz203003000200,声音数字化,音频信号(,Audio,)是指带有语音、音乐和音效的有规律的声波的频率、幅度变化的信息载体。它分为模拟音频信号和数字音频信号两种。其中,模拟音频用模拟电压的幅度表示声音强弱,模拟声音在时间上是连续的。而数字音频是一个数据序列,在时间上是离散的,是由许多二进制数,1,和,0,组成的。,声音数字化音频信号(Audio)是指带有语音、音乐和音效的有,声音数字化,(,续,1),模拟音频数字化:,采样、量化、编码,采样,-,每隔一定时间间隔在模拟波形上取一个幅度值。,量化,-,将每个采样点得到的幅度值以数字存储。,编码,-,将采样和量化后的数字数据以一定的格式记录下来。,模拟信号,采样,量化,编码,数字信号,振幅,频率,1/T,采样点,T,振幅,1/T,T,声音数字化(续1)模拟音频数字化:采样、量化、编码采样-每,声音数字化(续,2,),数字音频的技术指标:,采样频率: 每秒钟的采样次数,奎斯特采样理论:采样频率,f,(,1/T,)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。,CD,激光唱盘采样的三个标准频率分别为,44.1kHz,,,22.05kHz,和,11.025kHz,量化位数,(,采样精度、量化精度,),:存放采样点振幅值的二进制位数。通常量化位数有,8,位、,16,位,分别表示有,2,8,、,2,16,个等级。,声道数 :声音通道的个数 ,即一次同时产生的声波组数。,声音数字化(续2)数字音频的技术指标:,单声道,比较原始的声音复制形式,缺乏位置感 。,立体声,声音在录制过程中被分配到两个独立的声道,很好的声音定位效果。,准立体声,在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道。,四声道环绕,规定了,4,个发音点:前左、前右,后左、后右,可以提供多个不同方向的声音环绕。,5.1,声道,来源于,4.1,环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于,80Hz,的声音信号,在欣赏影片时有利于加强人声。美国杜比,AC-3,(,Dolby Digital,)、欧洲,DTS,等。,7.1,声道,在,5.1,的基础上又增加了中左和中右两个发音点,单声道,数字化声音的质量和存储量,数据量(,Byte,)(采样频率,量化精度,声道数,声音持续时间),/8,例如,,CD,音乐,用,44.10 kHz,的采样频率,,16,位的精度存储,,一般是立体声(两个声道),则录制,1,秒钟的立体声节目,,其,WAV,文件所需的存储量为:,44 100162/8=176 400,(字节),0.176MBps,一个小时的,CD,音乐需要约,635MB,的存储空间,如果使用,5.1,声道,则存储量为:,44 100165.1/8=0.45MBps,一个小时的,CD,音乐需要约,1.62G,的存储空间,数字化声音的质量和存储量数据量(Byte)(采样频率量化,不同类型信号的采样频率和量化精度,信号类型,频率范围,(,Hz,),采样频率,(,kHz),量化精度(,bit,),单声道,/,立体声,数据率,(,未压缩,),(,kB/s,),电话话音,2003400,8,8,单声道,8,调频广播,(,AM),2015000,11.025,8,单声道,11.0,宽带音频,(,FM),507000,22.050,16,立体声,88.2,CD,2022000,44.1,16,立体声,176.4,DAT,2022000,48,16,立体声,192.0,不同类型信号的采样频率和量化精度 信号类型频率范围(Hz)采,三、音频压缩技术,对原始数字音频信号流(,PCM,)编码运用恰当的数字信号处理技术,在不损失有用信息量,或引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。,音频数据压缩比压缩后的音频数据,/,压缩前的音频数据,三、音频压缩技术对原始数字音频信号流(PCM)编码运用恰当的,音频压缩算法的主要分类,无损压缩,利用信息相关性进行的数据压缩并不损失原信息的内容。是一种可逆压缩,即经过文件压缩后可以将原有的信息完整保留的一种数据压缩方式,如,wav,、,flac,、,ape,等格式。,有损压缩,经压缩后不能将原来的文件信息完全保留的压缩,是不可逆压缩。如,JEPG,、,MPEG,压缩,常见格式如,mp3,、,wma,。,音频压缩算法的主要分类无损压缩,音频压缩技术标准,国际电报电话咨询委员会,CCITT(,现国际电信联盟,ITU-T),标准,16Kbps CCITT,标准化方案,G.728,:面向带宽为,64Kbps,的,ISDN,线路的可视电话上,32Kbps CCITT,标准化方案,G.721,:应用于电视会议系统的语音编码和数字电话的语音合成,64Kbps CCITT,标准化方案,G.722,:面向,7kHz,带宽以语音和音乐为对象的标准化音响编码方案,MPEG-1,:规定了音频压缩三种模式,层,I,、层,II,(,MP2,)、层,III,(,MP3,),Dolby AC-3,:多声道音频信号压缩,MPEG-2BC,:多声道音频信号压缩,音频压缩技术标准国际电报电话咨询委员会 CCITT(现国际电,四、音频文件格式,声音文件格式,MIDI,文件格式,四、音频文件格式声音文件格式,声音文件格式,波形文件,,Windows,本身存放数字声音的标准格式,扩展名,.wav,,是一种未经压缩处理的音频数据。体积大(,1,分钟的波形文件需要,10MB,)。,CD Audio,,亦称,CD,音乐,扩展名,.cda,。记录的是波形流,无法编辑,文件大。,Real Audio,,扩展名,.ra,、,.ram,,,Real,公司开发的主要适用于网上实时数字音频流技术的文件格式。高保真方面不及,mp3,。需要使用,Real Player,。,MPEG-3,,扩展名,.mp3,。压缩率大。音质不及波形文件。,MIDI,,扩展名,.mid,,目前最成熟的音乐格式,实际上已经成为一种产业标准。优点是短小,缺点是播放效果因软、硬件而异。,RMI,文件,,Microsoft,公司的,MIDI,文件格式,可以包括图片标识和文本。,声音文件格式 波形文件,Windows本身存放数字声音的标准,声音文件格式 (续,1,),Creative Musical Format,,扩展名,.cmf,,,Creative,公司的专用音乐格式,和,MIDI,差不多,在音色和效果上有些特色,专用于,FM,音频卡,兼容性差,VOC,文件,,Creative,公司的波形文件格式,也是声霸卡使用的音频文件格式。每个,VOC,文件由文件头块,Header Block,和音频数据块,Data Block,组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据静音标识,ASCII,码文件重复的结果及终止标志、扩展块等,PCM,文件,模拟音频信号经,A/D,转换直接形成的二进制序列,该文件没有附加的文件头和文件结束的标志。,声音文件格式 (续1)Creative Musical Fo,MIDI,什么是,MIDI,MIDI,(,Musical Instrument Digital Interface,)是乐器数字接口的英文缩写,它是指数字乐器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的可以直接插入在计算机串口上的一个小部件,通过它可以使数字乐器与计算机相互“沟通”信息。,MIDI,的特点是其文件内部记录的是演奏数字音乐的全部动作过程。比如,音色、音符、延时、音量、力度等信息,所以其数据量很小。,MIDI什么是MIDI,MIDI,端口:一台,MIDI,设备可以有一至三个,MIDI,端口,,MIDI In,、,MIDI Out,、,MIDI Thru,。,MIDI In,接收来自其它,MIDI,设备的,MIDI,信息;,MIDI Out,发送本设备上生成的,MIDI,信息到其它设备;,MIDI Thru,将从,MIDI In,端口传来的信息转发到相连的另一台,MIDI,设备上。,MIDI,键盘:用于,MIDI,乐曲演奏,本身不发出声音,当作曲人员触动键盘上的按键时,就发出按键信息,所产生的仅仅是,MIDI,音乐消息,再由音序器录制生成,MIDI,文件。,音序器:用于记录、编辑、播放,MIDI,的声音文件。,合成器:解释,MIDI,文件中的指令符号,生成所需要的声音波形,经放大后由扬声器输出 。,MIDI端口:一台MIDI设备可以有一至三个MIDI端口,M,MIDI,文件格式,MIDI,扩展名为,.mid,,目前最成熟的音乐格式。,RMI,文件,Microsoft,公司的,MIDI,文件格式。,MIDI文件格式MIDI,五、编辑制作数字音频素材,五、编辑制作数字音频素材,常见数字音频处理软件,Vegas,SONY,公司推出的一款整合视频与音效编辑的软件。将剪辑、特效、专长、烧录等功能正合为一体。适用与专业人士或个人用户。,Cool Edit/ Adobe Audition,以前是数字音频软件制作公司,Syntrillium Software,的产品,,Syntrillium,的旗舰软体就是,-Cool Edit Pro,。现在被,Adobe,公司收购了,并升级为,Adobe Audition,SoundForge,SonicFoundry,公司开发的产品。,SoundForge,处理的是相对比较庞大的音频和视频文件,对磁盘空间和碎片等指标都有一定的要求。,常见数字音频处理软件Vegas,GoldWave,可对音频编辑、播放、录制、转换,体积小巧。,可打开的音频文件包括,WAV, OGG, VOC, IFF, AIF, AFC, AU, SND, MP3, MAT, DWD, SMP, VOX, SDS, AVI, MOV, APE,等格式。,可从,CD,或,VCD,或,DVD,或其它视频文件中提取音频。,GoldWave可对音频编辑、播放、录制、转换,体积小巧。,菜单栏,工具栏,左声道,右声道,状态栏,菜单栏工具栏左声道右声道状态栏,数字音频技术课件,如何从,CD,中获取音频,把,CD,放入光驱,在,GoldWave,中,选择工具菜单,/CD,读取器,选择相应的曲目,选取“保存”,修改保存路径后,单击“确定”。,如何从CD中获取音频把CD放入光驱,录音前的准备,录音之前,一定要调整声音控制面板参数,录音前的准备录音之前,一定要调整声音控制面板参数,在,GoldWave,中录音,新建文档:“文件”菜单,/,新建,设置采样频率、持续时间,单击控制器上的红色录音按钮,开始录音,(,如录制一首诗,),保存文件,在GoldWave中录音,选择要处理的音频,如何选择一段音乐,在播放过程中,设置开始和结束标志,可以选出你需要的部分。特点是边听边选,比较精确。,编辑,/,标记,/,放置开始标记 或 放置结束标记,在非播放状态,首先选择选示按钮,然后利用鼠标拖动画框,就可以选择相应的部分。,如何选择一个声道,编辑,/,声道,/,左声道,shift+ctrl+L,编辑,/,声道,/,右声道,shift+ctrl+R,选择要处理的音频如何选择一段音乐,简单声音编辑,删除声音片断,不选择声道的时候,删除片断,选择某声道的时候,删除片断,剪贴片断,静音处理,选择编辑区域,编辑,/,静音,与删除声音片断不同的是,变成静音的编辑区域仍然存在,其时间长度不变,简单声音编辑删除声音片断,声音的淡入淡出效果,选择需要设置淡入或淡出效果的区域,可以是单声道,也可以是双声道,单击淡入或淡出效果按钮,设置淡入或者淡出效果,混响设置,选择区域,设置混响,声音的淡入淡出效果,特殊音效,机器人声音:,把原始声音加工成类似机器发出的声音。,倒序声音:,将声音数据反相排列。,时间调整,改变声音的长度(缩短或者加长),整个声音文件,或者局部编辑区域,特殊音效,去噪,先选择波形,然后点击,【,效果,】,菜单中的“滤波器”中的“降噪”,在预置中选择“减少嗡嗡声”,点击确定,去噪,制作实例:语音和背景音乐的合成,如何实现声音合成:背景音乐和人的声音,打开背景音乐,并复制,新建一个文件,把背景音乐粘贴过来,打开人声文件,并复制,在刚才新建的文件中,编辑,/,混音,制作实例:语音和背景音乐的合成如何实现声音合成:背景音乐和人,如何去掉不想要的部分,比如开头部分,在最开始的地方,单击右键,设置开始标志,播放音乐,在需要的地方暂停,单击右键,设置结束标志,删除即可,如何去掉不想要的部分,比如开头部分,音乐淡出,-,朗读声,-,音乐淡出,首先在英语朗读文件的前面添加,10,秒钟的静音效果,同时把朗读文件后部不必要的部分删除。,在背景音乐的前部和后部设置淡出和淡入效果,中间部分设置音量变化(把声音变小),把英语朗读文件与背景音乐文件进行混音合成,音乐淡出-朗读声-音乐淡出,如何调整背景音乐的音量?,打开背景音乐,选择需要调整音量的部分,效果,/,音量,/,更改,调整相关的参数即可,如何调整背景音乐的音量?,交叉减弱效果,比如音乐逐渐减弱,语音逐渐增强,或者相反,打开语音文件,打开音乐文件,并选择某段音乐复制,点击语音文件,编辑,/,交叉减弱,设置是在文件头还是文件尾,设置交叉减弱的时间、曲线等。,交叉减弱效果,比如音乐逐渐减弱,语音逐渐增强,或者相反,GoldWave,软件主要功能,以不同的采样频率录制声音信号:语音、,CD,等,声音剪辑:截取声音、去掉某段声音、移动某段声音、连接两段声音等,增加特殊效果:混响、回声、改变频率产生特殊效果、声音的淡入淡出效果等,文件操作:新建、调入、保存或删除数字音频文件,GoldWave软件主要功能,录音机的使用,录音机的使用,程序,/,附件,/,娱乐,/,录音机,如何录制声音,录音机的使用录音机的使用如何录制声音,如何处理声音,如何处理声音,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!