数字语音处理基础课件

上传人:仙*** 文档编号:241398781 上传时间:2024-06-23 格式:PPTX 页数:64 大小:3.91MB
返回 下载 相关 举报
数字语音处理基础课件_第1页
第1页 / 共64页
数字语音处理基础课件_第2页
第2页 / 共64页
数字语音处理基础课件_第3页
第3页 / 共64页
点击查看更多>>
资源描述
第二章 数字语音处理基础2.1 语音信号的基本特性2.2 发音的生理器官与过程2.3 听觉和感知2.4 语音信号的特性分析方法简介语音信号的特性分析方法简介2.5 语音学基础及波形特征第第1页页/共共64页页2.1 语音信号的基本特性(1)语音信号(Speech Signal):一般地,语音信号是指由人的发音器官所发出的声音信号;广义地说,我们所研究地语音信号可能包括人或其他动物所发出的声音信号以及环境噪声和其他机械装置(如乐器)所产生的声音信号。其能量(信息)主要集中在 04000Hz带宽范围内。音频信号(Audio Signal):人的听觉系统所能感知的声音信号,其频率范围在2020,000Hz。电话语音信号 由于语音信号的能量主要集中在04000Hz的频带内,因此传统的电话语音通信系统中采用3003400Hz的带通滤波器来限制通过电话网络传输的语音信号。语音信号处理研究的对象主要还是由人的发音器官所产生的语言声音信号。第第2页页/共共64页页语音信号的基本特征:n频谱分量集中在3003400Hzn短时平稳性在 550ms 的短时内,信号的其本特征具有平稳性:能量 过零率 频谱 周期性n语音信号的组成结构音素是语音信号的基本组成单位。音素(Phoneme)-音节(Syllable)-词(Word)-句子(Sentence)元音(Vowel)辅音(Consonant)音素音素浊音(Voice)清音(UnVoice)静音(Silence)2.1 语音信号的基本特性(2)第第3页页/共共64页页浊音 声带振动有周期性频谱上表现出共振峰特性清音声带不振动频谱上有噪声特性静音环境噪声产生的信号,与人的发音系统无关2.1 语音信号的基本特性(3)第第4页页/共共64页页清音与浊音n浊音(Voiced Speech)n声带的振动产生准周期的声门脉冲激励声道产生浊音;n在时域是准周期的(quasi-periodic),在频域具有谐波结构;n周期脉冲的频率就是基频(Fundamental Frequency)或基音(Pitch);n清音(Unvoiced Speech)n当气流在声道中受到阻碍时,产生湍流,此时生成清音。n清音在时域类似随机噪声,在频域具有宽带特征;第第5页页/共共64页页语音信号的时域波形时变特性:有时准周期性 、有时随机噪声特性 平稳性:在短时内保持相同特性幅度特性:幅度时大时小男人可以在社会上参加一切活动男。人可。以。第第6页页/共共64页页语音信号的短时谱(1)语音短时谱:从语音信号流中利用加窗的方法取出其中的一段,再对其进行傅立叶变换,可以得到该“短时语音”的短时频谱。浊音谱清音谱第第7页页/共共64页页语音信号的短时谱(2)浊音谱:频谱曲线比较规则,频谱中具有几个明显的周期性起伏点。这些峰值点称为共振峰(Formant),其对应的频率成为共振峰频率,用F1、F2.表示,分别成为第一共振峰、第二共振峰、。一般地,共振峰有57个,其中前三个携带大量地语音信息,对区分不同地语音非常重要。清音谱:谱结构较平坦,无明显的周期性起伏结构;没有明显的共振峰特性;类似一般的随机噪声谱特性。第第8页页/共共64页页2.2 发音的生理器官与过程第第9页页/共共64页页2.2 发音的生理器官与过程 发声器官主要由四个功能部分构成:肺和气管:动力部分喉:激励生成机构声道:受激励系统,它对声音进行调制,形成语音嘴:完成声道气流的辐射,形成声波第第10页页/共共64页页2.2 发音的生理器官与过程语音产生的机理图肺活量肺活量 声带声带(声门)(声门)咽腔咽腔软腭软腭鼻腔鼻腔口腔口腔气管及支气管气管及支气管鼻音鼻音口音口音主声道 :声门以上,经咽喉、口腔的管道。鼻 道 :经小舌和鼻的管道称为鼻道。次声门系统:经肺、气管和支气管的管道。肌力肌力第第11页页/共共64页页喉的构造n肺部气流通过喉部构成发音的动力激励部分激励部分n喉部发音器官的关键部位声带声带n声带之间的空隙声门声门声带功能:吃东西时闭合,防止食物误入肺中;来自肺部的发音气流通过声门时,声带的开放与闭合,形成一个气流脉冲,构成发音的动力部分。u发浊音时,气流冲击声带振动,产生周期性的气流脉冲u发清音时,声带张开,气流顺利通过声门 2.2 发音的生理器官与过程激励第第12页页/共共64页页125Hz基因频率时,声带开启的面积和时间的关系声带每开启/闭合一次的时间(即声带的振动周期)就是语音的基因周期,其倒数称为基因频率,通常约为50450Hz成年男性:50250 成年女性:2004502.2 发音的生理器官与过程第第13页页/共共64页页n通过声门的周期性气流的周期Tp称为基音周期基音周期(Pitch Period)nFp1/Tp称为基音频率(基音频率(Fundamental Frequency)n不同年龄、不同性别的人发出的声音的基因频率有不同的特征:n老年人的声带松弛,基因频率低n小孩的声带短,基因频率高n女人的基因频率普遍比男人高Fp男人50250女人200450基音频率是我们区分不同人的声音的主要特征之一2.2 发音的生理器官与过程第第14页页/共共64页页2.2 发音的生理器官与过程声道纵剖面图调制第第15页页/共共64页页2.2 发音的生理器官与过程n气流从喉向上经过口腔或鼻腔后从嘴或鼻孔辐射出来所经过的通道,即为声道声道。声道由咽喉、口腔和鼻腔组成。口腔是声道最重要的部分,大小和形状可通过调制舌、唇、齿和腭来改变。在调制发音时,舌是最活跃的部分n声道是发音系统中的受激励部分,声道器官构成的空腔系统对来自喉部的激励信号进行调制(滤波),形成语音信号。n声道具有短时平稳性,即其在短时间内(如20-50ms)的机械特性保持不变。n声道中决定其空腔特性的两个重要器官:n软腭其位置决定鼻音和非鼻音;n舌决定声道最小橫截面积出现的位置,也是声道频率特性的决定因素。第第16页页/共共64页页2.2 发音的生理器官与过程声道可以看作一种具有某种谐振特性的腔体,其腔体不同位置的谐振频率就是对应的共振峰频率。语音信号的频率特性一方面取决于声门脉冲串特性,另一方面取决于声道特性。一般成年男子声道长约为17cm,最大横截面积可达20cm2声门鼻孔软腭嘴唇鼻孔和嘴唇完成声道气流的辐射,产生声波。嘴的形状会影响语音的频谱特性,但较之声道是次要的。一般成年男子鼻腔长约为10cm第第17页页/共共64页页2.2 发音的生理器官与过程发不同音时咽腔的形状变化第第18页页/共共64页页2.3 听觉和感知(1)n人的发音器官构成了语音产生系统,人的听觉器官则是语音信号的接收系统。n具有显著的物理机械特性,比较客观,因此目前人类对发音器官的研究已经比较透彻;但是听觉系统则比较复杂,它与人的大脑和神经系统紧密结合,形成人类对语言声音的理解能力,目前对该领域的研究还很不完善。n虽然人们对听觉和感知系统的研究还很肤浅,但其中的很多成果仍在语音编码、语言合成和语音识别系统中发挥了显著效果。例如人耳的听觉掩蔽效应广泛应用于中低速率语音编码系统;在MP3编码器中采用的心理声学模型;在语音识别系统中,根据听觉系统的处理特点所采用的预处理模块。以下对人耳的基本结构和人耳的感知特性作一个基本介绍。第第19页页/共共64页页听觉和感知-人耳的基本结构(2)n外耳,其主要作用是(1)对声源的定位;(2)对声音的放大。外耳道共振峰频率约3000Hz。n中耳,其主要作用是(1)三块听小骨构成的链连接外耳和内耳,实现声阻抗的匹配;(2)保护内耳。n内耳,其主要构成部分是耳蜗。它是听觉的受纳器,声音的机械振动在耳蜗被转换成神经脉冲信号,并通过神经系统传送到大脑语言中枢。第第20页页/共共64页页听觉和感知-耳蜗的频率响应(3)听觉产生过程 声波 骨膜振动 听小骨传递 耳蜗基底膜振动 产生神经脉冲第第21页页/共共64页页听觉和感知-人耳的感知特性(4)n声音的物理参数:频率,振幅,频谱特性,时间长度n人耳对声音的心里响应:音调,响度,音色1。听觉阈人耳能接收的声音信号频率范围:2020000Hz 人耳能忍受且感知的声音强度:130dB几个声学量概念定义如右:第第22页页/共共64页页听觉和感知-响度和响度级(5)响度和响度级Loudness and Loudness Leveln响度单位:Sone(宋)1kHz单音,声强级40dB时听到的响度。n响度级单位:Phon(方)数值上等于具有等响度的1kHz的单音的声强级。第第23页页/共共64页页听觉和感知-响度和响度级(6)第第24页页/共共64页页听觉和感知-音调(7)第第25页页/共共64页页听觉和感知-掩蔽效应(8)掩蔽效应 Masking Effect同时有两个声音进入耳朵,响度比较大的声音对弱的声音有干扰,使人的耳朵对弱的声音反映不敏感,称为掩蔽效应。纯音对纯音的掩蔽通常低音容易掩蔽高音 噪声对纯音的掩蔽临界带宽:当白噪声的总能量与纯音的能量相同时所对应的带宽。第第26页页/共共64页页与声音有关的几个术语n音高是人对声波频率的主观属性,它首先与声波的频率有关。声波的振动频率高,我们听到的声音就高,反之亦然,但它们之间并非线性关系。n音色是声波波形的主观属性。不同的发音体所发出的音波都有自己的特异性。声波的类型是多种多样的,一般可分为纯音和复合音两大类。n语音是特殊的复合音。语音由元音和辅音所构成。元音是一种能连续发出的乐音,辅音主要是不能连续发出的短促的噪音,元音与辅音合成汉语音节。n响度是声波振幅的主观属性,它是由声波的振幅引起的。振幅越大则响度越大,但它们之间也不是线性关系。第第27页页/共共64页页声音质量的评价n我们经常会对某一位歌手的歌声发表意见,并与其他歌手进行比较,这其实是在对声音的质量进行评价。声音质量的评价是一个很困难的问题,也是一个值得研究的课题。目前来看,声音质量的度量有两种基本方法,一种是客观质量度量,另一种是主观质量的度量。第第28页页/共共64页页声音客观质量的度量方法声波的测量与分析传统的方法是先用机电换能器把声波转换为相应的电信号,然后用电子仪表放大到一定的电压级进行测量与分析。由于计算技术的发展,使许多计算和测量工作都使用了计算机或程序实现。这些带计算机处理系统的高级声学测量仪器,能完成下列一些测量工作:第第29页页/共共64页页n评价值的测量 响度和响度级,噪音级,清晰度指数,噪音评价数。n声源的测量 频谱的时间变化,声功率,指向性,效率,频谱特征,幅值分布等。n音质的测量 混响时间,隔音量,吸音量。声音客观质量的度量方法第第30页页/共共64页页n声测量的基本仪器是声级计。声级计是一种能对声音作出类似人耳的反应的仪器,同时,它能进行客观而可重复的声压和声级测量。声压测量的好处很多:它能帮助音乐厅提高音响效果;能对烦扰声音进行精密的、科学的分析。声级测量还能明确地告诉我们什么声音会引起听力损害,并提醒人们采用适当的听力保护措施。因此,声测量是不可少的。n 度量声音客观质量的一个主要指标是信噪比SNR(Signal to Noise Ration),信噪比是有用信号与噪声之比的简称。其单位是分贝(dB)。声音客观质量的度量方法第第31页页/共共64页页声音主观质量的度量n采用客观标准方法很难真正评定某种编码器的质量,在实际评价中,主观的质量度量比客观质量的度量更为恰当和合理。通常是对某编码器的输出的声音质量进行评价,例如播放一段音乐,记录一段话,然后重放给实验者听,再由实验者进行综合评定。可以说,人的感觉机理最具有决定意义。当然,可靠的主观度量值是较难获得的。第第32页页/共共64页页n平均判分(Mean Opnion Scose-MOS)过程是召集一批实验者,请每个实验者对某个编解码器的输出进行质量判分,采用类似于考试的五级分制,不同的MOS分对应的质量级别和失真级别见表4-。声音主观质量的度量第第33页页/共共64页页声音主观质量的度量MOS质量级别失真级别5优(Excellent)不察觉4良(Good)刚察觉但不可厌3中(Fair)察觉及稍微可厌2差(Poor)可厌(但不令人反感)1劣(Unacceptable)极可厌(令人反感)第第34页页/共共64页页声音质量分级与带宽n声音的质量与它所占用的频带宽度有关,频带越宽,信号强度的相对变化范围就越大大,音响效果也就越好。第第35页页/共共64页页按照带宽可将声音质量分为4级:n数字激光唱盘质量,通常又CD-DA质量,这种质量也就是我们常说的超高保真,即Super HiFi(High Fidelity)。n调频无线电广播,简称FM(Frequency Modulation)质量。n调幅无线电广播,简称AM(Amplitude Modulation)质量。n电话(Telephone)质量。第第36页页/共共64页页4级声音质量的频率范围第第37页页/共共64页页2.4 语音信号的特性分析方法简介语音信号的特性分析方法简介语音信号的特性:语音信号的特性:主要指其声学特性、主要指其声学特性、时域波形时域波形、频谱频谱特性特性以及信号的统计特性。以及信号的统计特性。声学特性:声学特性:包括前面讲述的语音信号的产生机理、感知过包括前面讲述的语音信号的产生机理、感知过程、屏蔽效应等。程、屏蔽效应等。统计特性:统计特性:包括波形振幅概率密度函数和一些统计量如均包括波形振幅概率密度函数和一些统计量如均值和自相关函数等。如概率密度的估算方法就是根据长时值和自相关函数等。如概率密度的估算方法就是根据长时间范围内一段话音信号的大量样本数据的幅度绝对值计算间范围内一段话音信号的大量样本数据的幅度绝对值计算出幅度直方图,然后,再根据统计的振幅直方图,寻找近出幅度直方图,然后,再根据统计的振幅直方图,寻找近似的概率密度表达式。似的概率密度表达式。第第38页页/共共64页页语音信号的时域波形语音信号的时域波形实例实例1采样频率:8kHz量化精度:16bitA点开始s,C点开始k,都是清辅音,波形似白噪声,振幅小,没明显周期性;B点开始ou,D点开始的e,都是元音,波形具有明显的周期性,振幅较大,它们的周期对应的就是声带振动的频率,即基音频率,它是声门脉冲的间隔从波形可计算估计值;考察其中一小段元音语音波形,从频率特性大体可以看出它们的共振峰特性。第第39页页/共共64页页语音信号的频谱特性语音信号的频谱特性元音元音ou作法:从波形图180ms处开始,取256个样本:采样率8k,则该音段持续时间为32ms。做FFT前,用hamming窗加权,并用附加零点的办法将信号延长一倍,以提高频率分辨率。在01.83k之间有6个峰点,因此基音频率约为301Hz。观察波形图225250ms之间大约有8个周期,由此可推断周期约为300Hz.另外,图中明显的几个凸起点,它们出现的频率即为共振峰频率。元音频谱具有明显的共振峰特性元音频谱具有明显的共振峰特性第第40页页/共共64页页语音信号的频谱特性语音信号的频谱特性清辅音清辅音k可以看出,频谱峰点之间的间隔是随机的,表明清辅音k中没有周期分量,与原来预计是一样的。第第41页页/共共64页页语音信号的语谱图语音信号的语谱图实例实例2“同舟共济”的波形图及对应语图窄带语谱窄带语谱图图宽带语谱宽带语谱图图第第42页页/共共64页页语谱图相关概念语谱图相关概念实现方法:实现方法:横轴为时间,纵轴为频率,沿时间轴计算给定时刻范围(窗函数)的短时谱,任一给定频率成分在指定时刻的强弱用相应点的灰度或色调的浓淡来表示。其本质是一种动态的频谱。窄带语谱图,采用至少为两个基音周期的“长”窗,通常选择45Hz的带宽。窄带语谱图具有较好的频率分辨率,有利于显示基音频率及其各次谐波。但它的时间分辨率较差,不利于观察共振峰(声道谐振)的变化。宽带语谱图:宽带语谱图:选择长度小于一个基音周期的“短”窗,通常带宽为300Hz,频域上表现为一个较宽的滑动窗,有良好的时间分辨率和较差的频率分辨率。宽带谱能给出语音共振峰频率及清辅音的能量汇集区,在语图上共振峰呈现为黑色的条纹。第第43页页/共共64页页语谱图相关概念语谱图相关概念语谱图特点:花纹有语谱图特点:花纹有横杠横杠(bar)、乱纹乱纹和和竖直条竖直条等。等。横杠:在(c)中与时间轴平行的几条深黑色带纹,相应于短时谱中的几个凸起点,即共振峰。从横杠对应的频率和宽度可确定相应的共振峰频率和带宽。竖直条:又叫直冲条,是语图中出现与时间轴垂直的一条窄黑条。每个竖条相当于一个基音,条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音的周期,条纹越密表示基音频率越高。如图中的tong中的0,ji 中的 i,指示了共振峰的存在。乱纹:轻擦音在语图中的表现形式。如图中的 zh 和 j。乱纹的深浅和上下限反映了噪声能量在频域着那个的分布。第第44页页/共共64页页2.5 语音学基础及波形特征语音流的单位语音流的单位:音素、音节、词、节奏群和句子音素、音节、词、节奏群和句子音素音素:语音信号的最基本组成单位,音素可分为清音和语音信号的最基本组成单位,音素可分为清音和浊音两大类浊音两大类音节音节:由音素结合而成的语音流最小单位,是发声的最小由音素结合而成的语音流最小单位,是发声的最小单位单位词词:由音节结合而成的更大单位由音节结合而成的更大单位节奏群和句子节奏群和句子:词的进一步结合词的进一步结合同一音素与不同音素结合时,发音不同同一音素与不同音素结合时,发音不同,如音素,如音素sh在发在发“诗诗”这个音与发这个音与发“书书”这个音时,发音方式不完全一样,前者是非这个音时,发音方式不完全一样,前者是非圆唇音,后者是圆唇音。这种同一音素的不同发音方式称为圆唇音,后者是圆唇音。这种同一音素的不同发音方式称为音素变体音素变体第第45页页/共共64页页语音分类语音分类第第46页页/共共64页页音节的构成音节音节:包括元音和辅音包括元音和辅音元音(元音(Vowel):由声带振动发出来的乐音,构成了一个由声带振动发出来的乐音,构成了一个音节的主干,元音在音节中占主要部分。所有元音都是浊音音节的主干,元音在音节中占主要部分。所有元音都是浊音辅音辅音(Consonant):由呼出的声流克服发音器官的阻碍而由呼出的声流克服发音器官的阻碍而产生的产生的发辅音时如果声带不振动,发出的辅音称为发辅音时如果声带不振动,发出的辅音称为清辅音清辅音如果声带振动,发出的辅音则称为如果声带振动,发出的辅音则称为浊辅音浊辅音辅音出现在音节的前端或后端或前后端辅音出现在音节的前端或后端或前后端在汉语普通话中,每个音节都是由在汉语普通话中,每个音节都是由“辅音辅音元音元音”构成构成(C V结构)结构)在汉语语音中,辅音也称为声母,元音也称为韵母在汉语语音中,辅音也称为声母,元音也称为韵母第第47页页/共共64页页14段属于段属于声母声母(辅音)(辅音)69段属于段属于韵母韵母(元音)(元音)第第5段是声母和韵母的过度段段是声母和韵母的过度段对一个具体指定的音节,有可能只包含其中的某几段,但对一个具体指定的音节,有可能只包含其中的某几段,但第第7段(主要元音段)是每一个音节都具有的段(主要元音段)是每一个音节都具有的一个音节的发音都可能由一个音节的发音都可能由9部分组成部分组成第第48页页/共共64页页汉语的四声汉语的四声在在汉汉语语语语音音中中,通通常常采采用用声声、韵韵、调调的的系系统统分分析析方方法法,即即每每个个“字字音音”分分析析为为声声母母(21个个)和和韵韵母母(39个个)两两部部分分,每每个个“字音字音”又有阴平、阳平、上声和去声四种声调又有阴平、阳平、上声和去声四种声调声声调调:发发浊浊音音时时,声声带带振振动动的的基基频频轨轨迹迹。无无论论在在说说一一个个单单音音节节或或说说一一段段连连续续语语音音时时,各各个个音音节节中中韵韵母母段段的的基基频频都都是是随随时间变化的。时间变化的。声调的构字辨意作用声调的构字辨意作用:相同声母和韵母构成的音节随声相同声母和韵母构成的音节随声调的不同而具有完全不同的意义,对应着不同的汉字,例如调的不同而具有完全不同的意义,对应着不同的汉字,例如搭搭、达达、打、打、大。大。在许多其它语种中在许多其它语种中,声调没有这样的重要,声调没有这样的重要作用作用。第第49页页/共共64页页声调的曲线或轨迹开始于韵母的声调的曲线或轨迹开始于韵母的起始端,到韵母的终止端结束。起始端,到韵母的终止端结束。阴平:阴平:曲线几乎与时间横轴线平曲线几乎与时间横轴线平行,且平均值很高。行,且平均值很高。阳平:阳平:曲线从较低的频率一直上曲线从较低的频率一直上升到较高的频率升到较高的频率,或起始处稍或起始处稍下降后一直上升。下降后一直上升。上声:上声:曲线先降后升曲线先降后升。普通话普通话4种声调的典型曲线种声调的典型曲线去声:去声:曲线从较高频率出发一直下降到极低的频率。曲线从较高频率出发一直下降到极低的频率。注意:注意:连续语音中的声调曲线与单独说一个音节的声调曲连续语音中的声调曲线与单独说一个音节的声调曲线不完全相同。线不完全相同。第第50页页/共共64页页元音元音(vowels)是因素中成员最多的一类,元音根据舌头贴近上腭的位置(前部、中部和后部)分为三个子类。声源:元音声源是准周期气流,声带会以某一基本频率振动系统:每个元音对应一种不通的声道形态:第第51页页/共共64页页元音波形、语谱图及共振峰表示元音特征元音特征会由于说话人的不同而有很大变化,舌头隆起的位置和收紧程度、声道截面积和长度,进而声道的共振锋,都会随说话人的不同而变化,因而有利于说话人的识别。语谱图:声道的形状决定了它的共鸣特性。元音/a/的第一共振锋占主导作用的大致在800Hz,第二、第三稍弱,分别在1200Hz和2300Hz;元音/i/,第一共振锋大致在400Hz,第二、第三分别在2000Hz和3000Hz,第三共振锋幅度比/a/的第三共振锋要强。第第52页页/共共64页页鼻音鼻音(nasals):最接近元音。声源:也是从振动的声带处喷射出的准周期性气流。系统:软腭下沉,气流主要通过鼻腔,口腔通道紧缩,声音从鼻孔处辐射出来。鼻音根据口腔通道中舌头成阻的位置进行区分:第第53页页/共共64页页鼻音波形、语谱图及共振峰表示语谱图:鼻腔有较大容积,频谱成分主要为低频谐振。高频能量较低。第第54页页/共共64页页摩擦音浊摩擦音和清摩擦音清摩擦音声源:声带处于放松状态,不振动,口腔通道中某个收紧处的湍流会产生噪声声源,摩擦音声道的收紧程度比元音还要窄。清摩擦音系统:舌头成阻的位置位于口腔通道后部、中部或前部,以及牙齿和嘴唇处。浊摩擦音有着类似清摩擦音的噪声般声源和系统特征,不同处是声道收紧处产生噪声时,声带经常会同时振动,能看到噪声气流的周期现象。第第55页页/共共64页页摩擦音波形、语谱图及共振峰表示浊摩擦音浊摩擦音有音有音栅结构,对应栅结构,对应的频谱就具有的频谱就具有相应的谐波结相应的谐波结构。构。清摩擦音清摩擦音没有没有类似特征。类似特征。第第56页页/共共64页页爆破音浊爆破音和清爆破音声源和系统清爆破音:“爆破”产生原因是因为口腔通道中完全受阻处后方的气压积聚并释放所致。浊爆破音:不同的是释放气流的同时时,声带发生振动。第第57页页/共共64页页爆破音VOT结论:浊爆破音比清爆破音的VOT短得多,通常,VOT在20ms以内,认为是浊音,否则为清音。VOT:爆破与随后元音开始发生之间的时延第第58页页/共共64页页爆破音音波形、语谱图及共振峰表示清爆破音/k/,从静默然后出现突然的爆破,然后是送气噪声。浊爆破音/g/,爆破之前有一段低频的音栅,VOT短。第第59页页/共共64页页过渡语音双元音:类似元音的特征,即声带发生振动。但双元音不能在声道保持稳定形态下产生,他们是由时变的声道在两个元音间平滑过渡而得到的,其特征在于从一个元音向另一个“目标”元音移动。如:hide,out,boy,new等。可以看出共振锋会快速移动,这种共振锋过渡构成了双元音的本质特征第第60页页/共共64页页共振峰(Formant)进一步说明:共振峰:气流流过声道时在腔体内产生的一组谐振频率,是元音的一个重要声学特征共振峰参数:是区别不同元音的重要参数,一般包括共振峰频率的位置和频带宽度(Formant Bandwidth)。不同的元音对应于一组不同的共振峰参数。一般的浊音中可以辨别的共振峰有5个,为精确描述语音,应尽可能使用多个共振峰,但实际中,用前三个即可:F1、F2和F3,头三个共振峰对于区别不同语音至关重要。共振峰产生原因:声道可看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当元音激励进入声道时会引起共振特性,产生一组共振频率。声道的频谱特性:声道的频谱特性:由共振峰的位置及峰的宽度决定声道的形状和尺寸:声道的形状和尺寸:决定共振峰频率及其带宽第第61页页/共共64页页第三共振峰F2:虽与舌位关系不密切,但受舌尖活动的影响,舌尖抬高卷起时,F3明显下降。F1和 F2和 嘴 唇的圆展程度也有关系,如圆唇可使F2降低等第一共振峰F1:与舌位高低有关,舌位高,F1低;舌位低,F1高。第二共振峰F2:与舌位前后密切相关,舌位靠前,F2高;舌位靠后,F2低。如前元音i的舌位靠前,它的F2高达2000Hz;后元音u的舌位靠后,它的F2只有500Hz。共振峰(Formant)进一步说明:第第62页页/共共64页页舌位、唇形和开口度对F1和F2的影响第第63页页/共共64页页表2.3 汉语拼音七个韵母的共振峰频率(Hz)第第64页页/共共64页页
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!