期末多媒体习题答案

上传人:痛*** 文档编号:127000529 上传时间:2022-07-29 格式:DOC 页数:21 大小:108.50KB
返回 下载 相关 举报
期末多媒体习题答案_第1页
第1页 / 共21页
期末多媒体习题答案_第2页
第2页 / 共21页
期末多媒体习题答案_第3页
第3页 / 共21页
点击查看更多>>
资源描述
多媒体技术基本(第2版) 练习与思考题参照答案 第1章多媒体技术概要 1.1 多媒体是什么? 多媒体是融合两种或者两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体涉及文字、图形、图像、声音、动画和电视图像(video)。 1.2 超文本的核心思想是什么?超文本系统和超媒体系统有什么差别? (1) 超文本是通过复杂的、非顺序的关联关系连接在一起的一种文本,其真正含义是“链接”的意思。 (2) 超文本系统是以文本为主并使用超链接构成的信息系统;超媒体系统除文本外还涉及图像、音乐、动画或其她元素构成并使用超链接构成的全球信息系统。 1.3 超媒体是什么?多媒体与超媒体之间有什么关系? (1) 使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。 (2) 多媒体是超媒体系统中的一种子集 。1.4 SGML是什么语言?HTML是什么语言?它们之间有何关系? (1) 1986年国际原则化组织(ISO)采用的一种信息管理原则。该原则定义独立于平台和应用的文本文档的格式、索引和链接信息,为顾客提供一种类似于语法的机制,用来定义文档的构造和批示文档构造的标签。 (2) HTML是万维网上的文档所用的标记语言。 (3) HTML是SGML的一种子集。SGML使用标签来标志文档中的文本或图形之类的元素,并告诉Web浏览器该如何向顾客显示这些元素,以及应当如何响应顾客的行为,例如当顾客通过按键或鼠标单击某个链接时该如何响应。 1.5 有人觉得“因特网就是万维网”,这种见解对不对?为什么? (1) 不对。 (2) 因特网是专指全球范畴内最大的、由众多网络互相连接而成的、基于TCP/IP合同的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。 1.6 多媒体、万维网和因特网之间有何关系? 多媒体构成了超媒体系统,超媒体系统构成了万维网,万维网是因特网上使用TCP/IP合同和UDP/IP合同的应用系统。 第2章数字声音及MIDI简介 2.1 音频信号的频率范畴大概多少?话音信号频率范畴大概多少? (1) Audio: 200 Hz (2) Speech: 3003400 Hz 2.2 什么叫做模拟信号?什么叫做数字信号? (1) 幅度或频率发生持续变化的一种信号。 (2) 以二进制代码形式表达有无或者高下的一种信号。 2.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化? (1) 采样:在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化:幅值持续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化:在量化时,信号幅度的划分是等间隔的量化。 (4) 非线性量化:在量化时,信号幅度的划分是非等间隔的量化。 2.4 采样频率根据什么原则来拟定? 奈奎斯特理论和声音信号自身的最高频率。 2.5 样本精度为8位的信噪比等于多少分贝? 48 分贝 2.6 声音有哪几种级别?它们的频率范畴分别是什么? 见表2-01。 2.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的状况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=10241024B) (2205022260)/(10241024) 10.09 MB 2.8 什么叫做MIDI?它有什么特点? (1) 音乐合成器、乐器和计算机之间互换音乐信息的一种原则合同。 (2) 文献比较小;容易编辑等 2.9 用自己的语言阐明FM合成声音和乐音样本合成声音的思想。 (1) 把几种乐音的波形用数字体现,用计算机把它们组合起来,通过数模转换器(DAC)来生成乐音。 (2) 把真实乐器发出的声音以数字的形式记录下来,播放时变化播放速度,从而变化音调周期,生成多种音阶的音符。 第3章话音编码 3.1 用自己的语言说出下面3种话音编译码器的基本想法。 波形编译码器,音源编译码器,混合编译码器 (1) 波形编译码器:不运用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽量地一致。 (2) 企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 (3) 企图弥补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量,但数据率低于16 kb/s的状况下,在技术上还没有解决音质的问题;声码器的数据率虽然可降到2.4 kb/s甚至更低,但它的音质主线不能与自然话音相提并论。 3.2 列出你所懂得的话音编译码器的重要指标(至少2个) 音质,数据速率 3.3 试说混合编译码器的发展过程 为了得到音质高而数据率又低的编译码器,历史上浮现过诸多形式的混合编译码器,但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis,AbS)编译码器。这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding,LPC)使用的模型相似,不使用两个状态(有声/无声)的模型来寻找滤波器的输入鼓励信号,而是企图寻找这样一种鼓励信号,使用这种信号鼓励产生的波形尽量接近于原始话音的波形。AbS编译码器由Atal和Remde在1982年初次提出,并命名为多脉冲鼓励(multi-pulse excited,MPE)编译码器,在此基本上随后浮现的是等间隔脉冲鼓励(regular-pulse excited,RPE)编译码器、码鼓励线性预测CELP(code excited linear predictive)编译码器和混合鼓励线性预测(mixed excitation linear prediction,MELP)等编译码器。 3.4 什么叫做均匀量化?什么叫做非均匀量化? (1) 均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。 (2) 非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。 3.5 什么叫做率压扩?什么叫做A率压扩? (1) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)原则。在北美PCM电话网中,使用率压扩算法,详见“3.2.4 律压扩”。 (2) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)原则。在欧洲电话网,使用A律压扩算法,详见“3.2.5 A律压扩” 对于采样频率为8 kHz,样本精度为13比特、14比特或16比特的输入信号,使用律压扩编码或使用A律压扩编码,通过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kb/s。 3.6 G.711原则定义的输出数据率是多少?T1的数据率是多少?T2的数据率是多少? (1) G.711使用率和A率压缩算法,信号带宽为3.4 kHz,压缩后的数据率为64 kb/s。 (2) T1总传播率:1.544 Mb/s。 (2) T2总传播率:6.312 Mb/s。 3.7 图3-23是DM编码器的原理图,如果你已经学过模拟电路和数字电路技术基本,请分析该电路是如何完毕增量调制编码的。 (略) 3.8 自适应脉冲编码调制(APCM)的基本思想是什么? 根据输入信号幅度大小来变化量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几种样本就变化,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。 3.9 差分脉冲编码调制(DPCM)的基本思想是什么? 运用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一种样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表达每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就减少了传送或存储的数据量。此外,它还能适应大范畴变化的输入信号。 3.10 自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么? ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是: 运用自适应的思想变化量化阶的大小,虽然用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。 使用过去的样本值估算下一种输入样本的预测值,使实际样本值和预测值之间的差值总是最小。 第4章无损数据压缩 4.1 既有8个待编码的符号m 0,m7它们的概率如表练习_表1所示。使用哈夫曼编码算法求出这8个符号的所分派的代码,并填入表中。(答案不惟一。参照答案:1,000,001,011,0101,01000,010010,010011) 练习_表1 待编码 的符号概率分派的代码代码长度 (比特数) m0 0.4 1 1 m1 0.2 000 3 m2 0.15 001 3 m3 0.10 011 3 m4 0.07 0101 4 m5 0.04 01000 5m6 0.03 010010 6m7 0.01 010011 64.2 字符流的输入如练习_表2所示,使用LZW算法计算输出的码字流。如果对本章简介的LZW算法不打算进行改善,并且使用练习_表3进行计算,请核对计算的输出码字流与否为: (1) (2) (4) (3) (5) (8) (1) (10) (11) . 并将码字流中的码字填入练习_表2相应的位置。 练习_表2 输入位置1 2 3 4 5 6 7 8 9 101112131415 16 17 输入字符流A ba b c b a b a b a a a a a a a 输出码字A b-ab c- ba baba - aa- - aaa 练习_表3 环节位置词典输出码字(1) a (2) b (3) c 1 1 (4) ab (1) 2 2 (5) ba (2) 3 4 (6) Abc (4) 4 5 (7) Cb (3) 5 7 (8) Bab (5) 6 10 (9) Baba (8) 7 11 (10) Aa (1) 8 13 (11) Aaa (10) 9 16 (12) Aaa (11) 4.3 LZ78算法和LZ77算法的差别在哪里? (1) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) (2) LZ78的编码思想是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Code word)表达这个“词条”。这样一来,对字符流的编码就变成了用码字(Code word)去替代字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4 LZ78算法) 4.4 LZSS算法和LZ77算法的核心思想是什么?它们之间有什么差别? (1) LZ77通过输出真实字符解决了在窗口中浮现没有匹配串的问题,但这个解决方案包具有冗余信息。(4.4.3 LZSS算法) (2) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) 4.5 LZW算法和LZ78算法的核心思想是什么?它们之间有什么差别? (1) LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Code word)表达这个“词条”。这样一来,对字符流的编码就变成了用码字(Code word)去替代字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4 LZ78算法) (2) 在LZW算法中使用的术语与LZ78使用的相似,仅增长了一种术语前缀根(Root),它是由单个字符串构成的缀-符串(String)。在编码原理上,LZW与LZ78相比有如下差别:LZW只输出代表词典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的,它必须涉及也许在字符流浮现中的所有单个字符,即前缀根(Root)。由于所有也许浮现的单个字符都事先涉及在词典中,每个编码环节开始时都使用一字符前缀(one-character prefix),因此在词典中搜索的第1个缀-符串有两个字符。(4.4.5 LZW算法) 第5章彩色数字图像基本 5.1 什么叫做真彩色和伪彩色? 在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB 555表达的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接拟定三个基色的强度,这样得到的彩色是真实的原图彩色。 目前,一般把每个像素的颜色值用24位表达的颜色叫做真彩色。24位表达的颜色总数:2 24 16 777 216 种颜色。 5.2 分别用3,3和2位表达的一幅图像,问该幅图像的颜色数目最多是多少? 256 种 5.3 如果有一幅256色的图像,问该图的颜色深度是多少? 8 位 5.4 按照JPEG原则的规定,一幅彩色图像通过JPEG压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,问此时的最大压缩比是多少? 24:1 5.5 JPEG压缩编码算法的重要计算环节是:DCT变换,量化,Z字形编码,使用DPCM对直流系数(DC)进行编码,使用RLE对交流系数(AC)进行编码,熵编码。假设计算机的精度足够高,问在上述计算措施中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的? (1) DCT变换: 无损 (2) 量化: 有损 (3) Z字形编码: 无损 (4) 使用DPCM对直流系数(DC)进行编码: 无损 (5) 使用RLE对交流系数(AC)进行编码: 无损 (6) 熵编码:无损 5.6 什么叫做校正?在计算机中找一幅彩色图像,使用Microsoft Office 97/中的Microsoft Photo Editor或者其她图像解决软件显示该图像,然后使用校正功能修改值,观测图像有什么变化。 (1) 在屏幕上显示用离散量表达的色彩时采用的一种色彩调节技术。计算机显示屏和电视采用的阴极射线管产生的光亮度与输入的电压不成正比,而是等于以某个常数为底,以输入电压为指数的数,这个常数称为,它的值随显示屏的不同而变化,一般在2.5左右。 (2) (略) 5.7 什么叫做通道?它的作用是什么? 在每个像素用32位表达的图像表达法中的高8位,用于表达像素在一种对象中的透明度。例如,用两幅图A和B混合成一幅新图New,新图的像素为:New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)。在计算机环境下,通道可存储在帧缓冲存储器中的附加位平面上。对于32位帧缓冲存储器,除高8位是通道外,其他24位是颜色位,红、绿和蓝各占8位。 5.8 在计算机中找一幅像素深度为24的彩色图像,使用Office 97/中的Microsoft Photo Editor或者其她图像解决软件显示该图像,然后用GIF格式存储,再显示GIF图像。观测图像有什么变化,并分析其因素。 (略) 5.9 PNG图像文献格式的重要特点是什么? PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的通道数据。详见“5.7.4 PNG格式”。 5.10 通过调查、实验和分析,把BMP,GIF,JFIF和PNG格式的某些特性填入下表。 图像格式名称是不是有损压缩支持的最大颜色数BMP 无16 777 216 GIF 无256 JFIF 有16 777 216 PNG 无16 777 216 第6章颜色的度量体系 6.1 在开拓颜色科学方面, Newton, Thomas Young, Maxwell,Munsell,Ostwald和CIE分别做出了哪些重要奉献? (1) Newton:发明了颜色圆,用于度量颜色 (2) Thomas :觉得人的眼睛有三种不同类型的颜色感知接受器,大体上相称于红、绿和蓝三种基色的接受器。 (3) Maxwell:摸索了三种基色的关系,并且结识到三种基色相加产生的色调不能覆盖整个感知色调的色域,而使用相减混色产生的色调却可以。她结识到彩色表面的色调和饱和度对眼睛的敏感度比明度低。Maxwell的工作可被觉得是现代色度学的基本。 (4) Munsell:开发了第一种广泛被接受的颜色顺序制,称为Munsell color-order system或者叫Munsell color system,对颜色作了精确的描述并用在她的教学中。Munsell颜色顺序制也是其她颜体系的基本。 (5) Ostwald:开发了Ostwald颜色体系,根据对颜色起决定作用的波长、纯度和亮度来映射色调、饱和度和明度的值。 (6) CIE定义了许多度量颜色的原则 6.2 什么是颜色空间?对人、显示设备和打印设备,一般采用什么颜色参数来定义颜色? (1) 颜色空间:表达颜色的一种数学措施,人们用它来指定和产生颜色,使颜色形象化。 (2) 对于人来说,可以通过色调、饱和度和明度来定义颜色;对于显示设备来说,人们使用红、绿和蓝磷光体的发光量来描述颜色;对于打印或者印刷设备来说,人们使用青色、品红色、黄色和黑色的反射和吸取来产生指定的颜色。 6.3 什么叫做颜色系统(即颜色体系)?简要阐明组织和表达颜色的两种措施。 (1) 组织和表达颜色的措施。 (2) 两种措施:颜色模型(color model),编目系统(cataloging system)。 注: (1) 颜色模型:在台式机排版和图形艺术中,表达颜色的任何一种措施或商定。在图形艺术和印刷领域,颜色常用Pantone(公司)颜色匹配系统;在计算机图形学方面,如下任何一种不同的色彩系统都可以描述色彩:HSB(色调,饱和度和亮度),CMY(青,品红,黄)和RGB(红,绿,蓝)。 (2) 颜色空间是颜色模型最一般的例子,RGB, HSB, CMY, CIE XYZ, CIELAB,CMYK和颜色的光谱描述措施都是颜色模型。 6.4 使用你可以找到的工具和资料,探讨本章简介的CIE度量体系与否有错误,哪些地方需要修改和补充。CIE度量体系涉及: CIE 1931 RGB CIE 1931 XYZ CIE 1931 xyY CIE 1960 YUV和CIE YUV CIE 1976 LUV CIE 1976 LAB CIELUV LCh和CIELAB LCh (略) 第7章颜色空间变换 7.1 PAL制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计算机图像显示使用什么颜色模型? (1) PAL制彩色电视:YUV (2) NTSC制彩色电视:YIQ (3) 计算机图像显示设备:RGB 7.2 用YUV或YIQ模型来表达彩色图像的长处是什么?为什么黑白电视机可看彩色电视图像? (1) YUV表达法的一种长处:它的亮度信号(Y)和色度信号(U,V)是互相独立的,因此可以对这些单色图分别进行编码;另一种长处:可以运用人眼的特性来减少数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个长处。 (2) 黑白电视能接受彩色电视信号的道理是运用了YUV/YIQ分量之间的独立性。 7.3 在RGB颜色空间中,当R=G=B,且为任意数值,问计算机显示屏显示的颜色是什么颜色? 灰色 7.4 在HSL颜色空间中,当H为任意值,S=L=0时,R,G和B的值是多少?当H0, S=1, L0.5,R,G和B的值是多少? 当H为任意值,S=L=0时, R = G = B = 0 当H0, S=1, L0.5,R1,G B 0 7.5 打开Windows 95/98/中的“画图”“颜色编辑”程序,在RGB和HSL转换栏中,如果R=G=B255,问H, S和L的值分别为多少?分别变化R,G和B的值,观测H,S和L的值的变化。 如果R=G=B255,H160,S=0, L=240。 (2) (略) 7.6 用MATLAB编写RGB到HSL和HSL到RGB颜色空间的转换程序:rgb2hsl.m和hsl2rgb.m。(略) 7.7 用MATLAB编写YCbCr和RGB0,219颜色空间的转换程序:RGB2YCbCr和YCbCr2RGB.m。(略) 第10章彩色数字电视基本 10.1 世界上重要的彩色电视制式是哪几种? 目前世界上使用的彩色电视制式重要有PAL,NTSC,SECAM三种,都是模拟彩色电视制式。 10.2 隔行扫描是什么意思?非隔行扫描是什么意思? (1) 在隔行扫描中,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完毕了一帧(frame)的扫描。隔行扫描规定第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描正好嵌在第一场各扫描线的中间。正是这个因素,才规定总的行数必须是奇数。 (2) 在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。 10.3 电视机和计算机的显示屏各使用什么扫描方式? 电视机一般使用隔行扫描;计算机的显示屏一般使用非隔行扫描。 10.4 ITU-R BT.601原则规定PAL和NTSC彩色电视的每一条扫描线的有效显示像素是多少? 720 10.5 什么叫做S-Video?它的连接器构造是什么样? 质量较高的一种电视技术,用这种技术录制和解决电视时亮度信号(Y)和色差信号(C)是分开进行的。S-Video是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用S-Video有两个长处:(1) 减少亮度信号和色差信号之间的交叉干扰。(2) 不须要使用梳状滤波器来分离亮度信号和色差信号,这样可提高亮度信号的带宽。 S-VHS和Hi-8摄像机以及盒式录像机(video cassette recorder,VCR)使用这种技术,它比原则的VHS和8毫米格式的设备提供质量比较高的彩色图像。在使用S-video技术的设备上,电视信号的输出除具有分离的亮度(Y)和色差信号(C)输出外,尚有复合彩色全电视信号。S-video设备与其她设备连接的连接器使用S-video连接器,而不是一般的RCA连接器。有些电视图像卡和高档家用录像机(VCR)可以支持这种信号。 10.6 对彩色图像进行子采样的理论根据是什么? 人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感限度比对亮度信号的敏感限度低,运用这个特性可以把图像中体现颜色的信号去掉某些而使人不察觉;二是人眼对图像细节的辨别能力有一定的限度,运用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。 10.7 图像子采样是在哪个彩色空间进行的? YCbCr 10.8 一幅YUV彩色图像的辨别率为720576。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采样时的样本数。 (1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个持续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相称于每个像素用3个样本表达。 7205763 1 244 160 (2) 4:2:2 这种子采样格式是指在每条扫描线上每4个持续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表达。 7205762 829 440 (3) 4:1:1 这种子采样格式是指在每条扫描线上每4个持续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表达。 7205761.5 622 080 (4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个持续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表达。 7205761.5 622080 第11章MPEG简介 10.1 回忆制定MPEG原则的4个阶段和各阶段的提交的文献类型。 (1) 工作文献(Working Draft,WD):工作组(Working Group,WG)准备的工作文献 (2) 委员会草案(Committee Draft,CD):从工作组WG准备好的工作文献WD提高上来的文献。这是ISO文档的最初形式,它由ISO内部正式调查研究和投票表决。 (3) 国际原则草案(Draft International Standard,DIS):投票成员国对CD的内容和阐明满意之后由委员会草案CD提高上来的文献。 (4) 国际原则(International Standard,IS):由投票成员国、ISO的其她部门和其她委员会投票通过之后出版发布的文献。 10.2 MPEG-1, -2, -4和-7的目的是什么? MPEG-1解决的是原则图像互换格式的电视,即NTSC制为352像素240行/帧30帧/秒,PAL制为352像素288行/帧25帧/秒,压缩的输出速率定义在1.5 Mb/s如下。这个原则重要是针对当时具有这种数据传播率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传播数字影视。 MPEG-2原则是一种直接与数字电视广播有关的高质量图像和声音编码原则,是MPEG-1的扩大。MPEG-2提供位速率的可变性能功能,其最基本目的是:位速率为49 Mb/s,最高达15 Mb/s。 MPEG-4是为视听数据的编码和交互播放开发算法和工具,是一种数据速率很低的多媒体通信原则。MPEG-4的目的是要在异构网络环境下可以高度可靠地工作,并且具有很强的交互功能。 MPEG-7的名称叫做多媒体内容描述接口,目的是制定一套描述符原则,用来描述多种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可涉及静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些状况下,数据类型还可涉及面部特性和个人特性的体现。 第12章MPEG声音 12.1 列出你所懂得的听觉系统的特性。 响度感知, 音高感知, 掩蔽效应 12.2 什么叫做听阈?什么叫做痛阈? (1) 当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈” (2) 当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“听阈”。实验表白,如果频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。 12.3 什么叫做频域掩蔽?什么叫做时域掩蔽? 强纯音掩蔽在其附近同步发声的弱纯音,这种特性称为频域掩蔽。 (2) 在时间方向上相邻声音之间的掩蔽,这种特性称为时域掩蔽。 12.4 MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性? 层1:频域掩蔽特性 层2:频域掩蔽特性,时间掩蔽特性 层3:频域掩蔽特性,时间掩蔽特性 12.5 MPEG-1的层1、2和3编码器的声音输出速率范畴分别是多少? 层1:384 kb/s 层2:256192 kb/s 层3:128112 kb/s 12.6 MPEG-1的声音质量是: AM FM 电话 near-CD CD-DA AM FM 电话 near-CD CD-DA 12.7 什么叫做5.1声道立体环绕声?什么叫做7.1声道立体环绕声? (1) “5.1环绕声”也称为“3/2-立体声加LFE”,其中的“.1”是指LFE声道。它的含义是播音现场的前面可有3个喇叭声道(左、中、右),背面可有2个环绕声喇叭声道,LFE是低频音效的加强声道。 7.1声道环绕立体声与5.1类似。 参见图12-19。 12.8 简述MPEG-2 AAC的特性。 MPEG-2 AAC是MPEG-2原则中的一种非常灵活的声音感知编码原则。它使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。 AAC支持的采用频率可从8 kHz到96 kHz,AAC编码器的音源可以是单声道的、立体声的和多声道的声音。AAC原则可支持48个主声道、16个低频音效加强通道LFE、16个配音声道或者叫做多语言声道和16个数据流。 MPEG-2 AAC在压缩比为11:1,即在每个声道的数据率为(44.116 )/11=64 kb/s,而5个声道的总数据率为320 kb/s的状况下,很难辨别还原后的声音与原始声音之间的差别。与MPEG-Audio层2相比,MPEG-2 AAC的压缩率可提高1倍,并且质量更高,与MPEG的层3相比,在质量相似的条件下数据率是它的70%。 12.9 什么叫做自然声音?什么叫做合成声音? 自然声音一般是指人、动物等发出的声音、弹奏乐器或其她音源自然发出的声音。 合成声音一般指合成器生成的声音,如MIDI。 12.10 什么叫做TTS?至少列举TTS的3个潜在应用例子。 通过话音合成设备自动地把基于文字的数据转换为声音输出的一种技术。文语转换的最后目的是要使计算机像人同样输出清晰而又自然的声音,也就是说,根据文本的内容可以不同的情调来朗读任意的文本。TTS是一种十分复杂的系统,波及到语言学、语音学、信号解决、人工智能等诸多的学科。尽管既有的TTS系统构造各异,转换措施不同,但是基本上可以提成两个相对独立的部分:文本分析,通过对输入文本进行词法分析、语法分析,甚至语义分析,从文本中抽取音素和韵律等发音信息。语音合成,使用从文本分析得到的发音信息去控制合成单元的谱特性(音色)和韵律特性(基频、时长和幅度),送入声音合成器(软件或硬件)产生相应的语音输出。 通过电话访问信息,朗读文本,盲人计算机等。 第13章MPEG电视 13.1 电视图像数据压缩的根据是什么? 根据人的视觉特性和电视图像数据自身的冗余特性。 注:人的视觉系统具有的两种特性可以用来压缩电视图像数据。一是人眼对色度信号的敏感限度比对亮度信号的敏感限度低,运用这个特性可以把图像中体现颜色的信号去掉某些而使人不察觉;二是人眼对图像细节的辨别能力有一定的限度,运用这个特性可以把图像中的高频信号去掉而使人不易察觉。 13.2 MPEG-1编码器输出的电视图像的数据率大概是多少? 1.15 Mb/s 13.3 MPEG专家组在制定MPEG-1/-2 Video原则时定义了哪几种图像?哪种图像的压缩率最高?哪种图像的压缩率最低? (1) MPEG专家组定义了三种图像:帧内图像I(intra),预测图像P(predicted )和双向预测图像B (bi-directionally interpolated )。 (2) 双向预测图的压缩率最高,帧内图像的压缩率最低。 13.4 有人觉得“图像压缩比越高越好”。你对这种说法有何见解? 在图像压缩算法中,为了获得比较高的压缩率,一般要采用有损压缩。这就意味压缩率越高,图像的质量损失越大,重构图像的质量将会越低。 13.5 有人说“MPEG-1编码器的压缩比大概是200:1”。这种说法对不对?为什么? 不对。理由:(1)电视图像的子采样(4:1:1)不是MPEG编码器的功能,(2)电视图像画面尺寸(如PAL制720576)的降采样(变成360288)也不属于MPEG编码器的功能。 13.6 阐明电视规格MPML和HPHL各自的含义。 MPML (Main Profile, Main Level)指的是具有这种特性的电视:辨别率为72057630,子采样格式为4:2:0,位速率可高达15 Mb/s。 HPHL (High Profile, High Level)指的是具有这种特性的电视:辨别率为1920115260,子采样格式为4:2:0或者4:2:2,位速率可高达80 Mb/s。 13.7 电视图像的空间辨别率和时间辨别率是什么意思? 空间辨别率:图像的尺寸。例如,PAL制图像尺寸:720576,360288。 时间辨别率:图像的帧数/每秒钟。例如,PAL制电视图像的时间辨别率为30帧/秒,NTSC电视图像的时间辨别率为25帧/秒,电影图像的时间辨别率为24帧/秒。 第14章只读光盘存储器 14.1 只读光盘是如何记录“0”和“1”的? 只读光盘一般是指CD/DVD系列只读光盘。在盘上压制凹坑的机械措施来记录“0”和“1”。凹坑的边沿代表“1”,凹坑和非凹坑的平坦部分代表“0”,凹坑的长度和非凹坑的长度都代表有多少个“0”。 14.2 CD-DA的音乐信号的采样频率为什么选择44.1 kHz? 人耳朵(因人而异)能听到的声音信号频率范畴是2020 000 Hz,为了避免高于20 000 Hz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20 000 Hz的地方大概有10%的衰减,因此可以用22 000 Hz的2倍频率作为声音信号的采样频率。但是,为了可以与电视信号同步,PAL电视的场扫描为50 Hz,NTSC电视的场扫描为60 Hz,因此取50和60的整数倍,选用了44 100 Hz作为激光唱盘声音的采样原则。 14.3 激光唱盘音乐信号的样本位数是16,它的信噪比是多少?如果样本位数提高到20,它的信噪比是多少? (1) 96dB (2) 120 dB 14.4 为什么物理线路上传播的数字信号都需要采用通道编码? 重要因素有两个,一是为了改善读出信号的质量,二是为了在记录信号中提取同步信号。 (例如,有持续多种字节的全“0”信号或者全“1”信号要记录到盘上,如果不作通道编码就把它们记录到盘上,读出时的输出信号就是一条直线,电子线路就很难辨别有多少个“0”或者多少个“1”信号。而对于没有规律的数字信号,读出时的信号幅度和频率的变化范畴都很大,电子线路很难把“0”和“1”辨别开,读出的信息就很不可靠。因此通俗说来,通道编码事实上就是要在持续的“0”插入若干个“1”,而在持续的“1”之间插入若干个“0”,并对“0”和“1”的持续长度数目即“行游程长度”加以限制。) 14.5 CD盘中的EFM是什么意思? EFM (eight-to-fourteen modulation)是指由8比特的代码调制成14比特的代码。 (解释:它是一种物理通道编码技术,使用这种技术可增长CD盘上信息凹坑和非凹坑的长度,减少读出信号的频率带宽。CD使用脉冲调宽技术,把8比特的顾客数据变换成14比特的通道码。在红皮书和IEC 908原则中,在14比特的码之间增长3个比特的合并位,构成8比特到17比特调制编码。在物理存储器上存储数据或者在物理线路上传播数字信号都需要对顾客数据进行通道编码。物理盘上记录的数据和真正的顾客数据之间需要做变换解决,这种解决统称为通道编码。采用通道编码的目的重要是两个,第一是为了改善信号质量,使得读出信号的频带变窄;第二是为了在接受端可以从信号自身提取自同步信号。) 14.6 激光唱盘播放机的声音数据传播率是多少? 44100162 1.4112 Mb/s 14.7 从CD渡到DVD,科学家和工程技术人员采用了那些重要技术? 详见“表14-06 HDCD技术摘要”。 14.8 目前定义了几种DVD? 详见表“14-03 DVD和CD系列”。 第15章光盘存储器的格式 15.1 试论CD原则的重要性。 (略) 15.2 什么叫做CD盘的物理格式? 存储媒体的存储构造,它规定数据如何放在光盘上。这些数据涉及物理扇区的地址、数据的类型、数据块的大小、错误检测和校正码等。 15.3 CD-ROM的扇区地址“00:10:65”表达什么含义? CD-ROM的扇区地址用“分、秒,分秒(1/75秒)”来表达。00:10:65表达地址为00分10秒65分秒。 15.4 CD-ROM Mode 1和CD-ROM Mode 2有什么差别? CD-ROM Mode 2与CD-ROM Mode 1相比,存储的顾客数据多14%,但是由于没有错误检测和错误校正码,因此在这种方式中,顾客数据的误码率比Mode 1中的误码率要高。在Mode 2的扇区地址中,方式(Mode)字节域中的值设立成02, 在Mode 1的扇区地址中,方式(Mode)字节域中的值设立成01。 15.5 CD-ROM/XA Mode 2 Form 1和CD-ROM/XA Mode 2 Form 2有什么差别? CD-ROM/XA Mode 2 Form 2与CD-ROM/XA Mode 2 Form 1相比,去掉了276字节的ECC码,因此存储的顾客数据增长了276字节。 15.6 CD-Bridge Mode 2 Form 1和CD-Bridge Mode 2 Form 2有什么差别? D-Bridge Mode 2 Form 2和CD-Bridge Mode 2 Form 1相比,去掉了276字节的ECC码,因此存储的顾客数据增长了276字节。 15.7 计算单速CD-ROM的顾客数据传播率是多少KB/s(1 KB = 1024 bytes)。 (204875)/1024 153600/1024 150 KB/s 15.8 CD-ROM文献系统的重要构成部分是什么? 一种完整的CD-ROM文献系统有三个重要部分构成: (1) 逻辑格式(logical format): 它是文献格式的同义词。逻辑格式是拟定盘上的数据应当如何组织,以及寄存在什么地方。说得具体一点就是基本的辨认信息放在何处,文献目录应当如何构造,到何处去找盘上的目录,一种应用软件寄存在几张光盘上等等。由此也可以看到,逻辑格式与物理格式是不同的。 (2) 源软件(origination software): 它是把数据写到逻辑格式的软件,按逻辑格式把要存到盘上的文献进行装配,因此源软件又称“写”软件。 (3) 目的软件(destination software): 它是把数据从逻辑格式读出来,并且把数据转换成文献,因此目的软件又称为“读”软件。它在终端顾客的机器上可以理解逻辑格式,并且使用逻辑格式来访问盘上的文献。 15.9 CD-ROM的逻辑格式是什么意思? 文献格式的同义词。它指定数据文献在盘上的组织和位置,定义文献大小、所有文献在盘上的目录构造以及所需盘片数目等事项。 15.10 CD-ROM的物理扇区、逻辑扇区和逻辑块之间有什么关系? 详见图15-05。 15.11 MS-DOS和MS-Windows环境下都要有MSCDEX.EXE文献,请问它的功能是什么? 把ISO 9660文献构造转变成MS-DOS能辨认的文献构造。 15.12 试论CD-ROM的文献目录构造与磁盘的文献构造有何差别? CD-ROM是只读存储器,而磁盘是可读/写存储器,这就不需要添加、删除目录等功能。 CD-ROM的写入和读出是不对称的。 寻找数据的时间相对于20 ms左右的磁盘大得多。 15.13 用计算机查看VCD盘上根目录和子目录下有什么文献?这些文献的含义是什么? (略) 第16章错误检测和校正 16.1 CRC用于检测错误还是校正错误? 用于检测错误。 16.2 用自己的语言阐明错误检测的思想。 (略) 16.3 什么叫做突发错误? 持续多位或持续多种符号都出错的一种错误模式。如盘片的划伤、沾污或盘自身的缺陷都也许浮现这种错误,一错就错一大片。 16.4 码块长度为n,码块中的信息长度为k,问(n,k)RS码自身能纠正多少个错误? (n-k)/2 16.5 要纠正1个符号的错误,至少需要附加多少个校验符? 2个,用于表达错误的位置和错误的值 16.6 目前CD存储器中使用的CIRC编码技术可以纠正突发错误的最大长度是多少(按中文字符数估算)? 大概持续224个中文的长度。 第17章多媒体网络应用及互换技术 17.1 网络上的多媒体通信应用和数据通信应用有什么重要差别? 多媒体通信应用规定在客户端播放声音和图像时要流畅,声音和图像要同步,因此对网络的时延和带宽规定很高。而数据通信应用则把可靠性放在第一位,对网络的时延和带宽的规定不那么苛刻。 17.2 举例阐明多媒体网络应用的特点。 例如IP电话,规定期延短。 17.3 因特网电话和实时电视会议是多媒体网络应用中频繁交互的应用例子,根据人的听觉系统,对延迟不不小于150 ms的声音感觉不到有时延,在150 400 ms之间的时延可以接受,时延超过400 ms的会话就令人甚感别扭。 17.4 T1数字网络的总数据传播率,美国定义为1.544 Mb/s,欧洲的T1称为E1,定义为2048 Mb/s。 17.5 借助工具书或者技术参照书的协助理解信息包(packet)的含义。 (1) 信息传播的单位,在网络中作为一种整体从一种设备传向另一种设备。 (2) 在信息包互换网络中,固定的最大长度的传播单位,由二进制数位表达的数据及信息包头构成。信息包头中具有辨认号、源地址、目的地址及某些错误控制信息。有时作为通用词用来描述合同堆栈各层的信息传播单位。 (3) 将信息提成小块,并加上路由及控制信息之后的数据。这些信息包能独立地传送,在目的地重组。几乎所有的高速数字网都采用了信息包技术。它同步也是因特网TCP/IP合同的基本。 (4) 在DVD系统中,每个数据小包由2048字节构成。 17.6 总结线路互换、信息包互换和消息互换各有什么特点。 线路互换(circuit switching)的特点是,在开始通信之前通信双方由线路互换中心建立物理连接,维持连接的时间长短取决于消息互换的需要 信息包互换不需要在收发双方建立物理连接,每个信息包都包具有目的地址,因此一种消息分装成的许多信息包不必都沿着同一条线路达到目的地,也不必同步达到目的地,达到目的地的顺序也不必按照发送的顺序,那条信道有空就往那里传送。 消息互换把整个原始消息经有网络传送到接受方。它的时延比信息包互换长,错误解决时间也比较长。 17.7 面向连接服务和无连接服务的差别是什么? 面向连接服务:在开始发送信息包之前发送端和接受端要进行沟通,建立直接连接,并提示对方准备接受信息包,然后才开始进入信息包的传送过程。 无连接服务:使用顾客数据包合同(UDP)来调用无连接服务。发送端简朴地把信息包送到网络上,在传送信息包之前发送端和接受端没有沟通的过程,也没有对方来的确认,因而也不懂得目的地与否接受到。无连接服务既没有拥挤控制功能,也没有流程控制功能。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!