多媒体技术答案.pdf

资源描述

多媒体技术教程（第三版）习题解答第 1 章绪论1多媒体信息系统和多媒体计算机有什么不同？在概念上应如何看待两者之间的关系？多媒体信息系统是新一代高度集成的、功能强大的、智能化的计算机信息系统，它是提供多媒体信息、辅助人们对环境进行控制和决策的系统，是基于计算机、通信网络等现代化的工具和手段，服务于管理领域的信息处理系统。而多媒体计算机指的是硬件设施，多媒体计算机是多媒体信息系统得以应用的平台。2试归纳叙述多媒体关键特性以及这些特性之间的关系。多媒体的关键特性主要包括信息载体的多样性、交互性和集成性这三个方面，这既是多媒体的主要特征，也是在多媒体研究中必须解决的主要问题。信息载体的多样性是相对于计算机而言的，指的就是信息媒体的多样化，有人称之为信息多维化；多媒体的第二个关键特性是交互性，多媒体系统将向用户提供交互式使用、加工和控制信息的手段，为应用开辟更加广阔的领域，也为用户提供更加自然的信息存取手段；多媒体的集成性主要表现在两个方面，一是多媒体信息媒体的集成，二是处理这些媒体的设备与设施的集成。信息载体的多样性是集成性的基础，没有多种信息媒体，也就无法进行多媒体信息的集成化处理；而处理多媒体的设备与设施的集成性是实现交互性的前提，没有系统、网络、软硬件设施的集成，就无法为用户交互式使用、加工和控制信息提供平台。3为什么说多媒体缩短了人类信息交流的路径？人类与计算机进行信息交流的目的是什么？与以往的方法相比，计算机在数据处理方面有了很大的改善。计算机所提供的功能强大的数据组织和构造技术，如传统数据结构中的数组、向量、队列、堆栈、树和堆等，为动态地加工和处理数据提供了基础。高效的算法和高速的网络通信，大大地加强了用文字和数据表示概念的能力并加速了它的传递过程。但人类并不是仅仅依赖文本这一类单一的数据形式来传递所有的信息和接受概念的，图像、声音等多媒体信息都是人类获取和传递信息极为重要的渠道。图像的信息量最大，一幅画胜过千言万语，最直观、最能一目了然。而动态的影像视频和动画则更生动、更逼真、更接近客观世界的原型、更能反映事物的本质和内涵。声音和文字也是信息的重要媒体，综合应用不仅有利于接受，也有利于存储（记忆）和保留。这就意味着必须同时启动大脑的形象思维和逻辑思维，才能更好地获得更多更有用的信息。因此，通过多种感觉器官用多种信息媒体形式向人提供信息才算是更好的表达方法，它不仅加速和改善了理解，并且提高了信息接受的兴趣和注意力。多媒体正是利用各种信息媒体形式，集成地用声、图、文等来承载信息，也就是缩短信息传递的路径。人类与计算机进行信息交流的目的是为了高效的获取、传递以及使用信息。计算机的发展使得人类的信息处理手段得到加强，高速的计算能力扩展了对数据进行重复计算的能力，大规模的存储扩展了记忆信息的范围，高速通信网使得我们可以同远在异地他乡的同事、朋友、亲人甚至陌生人进行快速的信息交换。这些机器成为我们与他人进行交流的中介。4有人说，在未来信息系统中计算机和电视将合为一体，这意味着产生了新一代的信息系统，是革命性的转变，而不仅仅是某种设备功能的增强。你的看法呢？计算机和电视合为一体，是多媒体信息系统应用的一个实例，将提高家庭自动化程度，而并不是意味着新一代信息系统的产生。通过这种方式，将改变人们长久依赖被动接收信息的情况。将交互式手段融入到人们的日常生活中。交互可以增加对信息的注意力和理解力，延长信息在头脑中保留的时间。而在单向的信息空间中，这种接收的效果和作用就很差。借助于交互活动，人们可以获得所关心的内容，获取更多的信息；用户也可以找出想看的电视节目，可以快速跳过不感兴趣的部分，可以对某些所关心的内容进行编排等，从而改变现在观看电视节目的方法。5有人说，多媒体是界面技术，即人机接口技术，你同意吗？为什么？多媒体技术包括人机接口技术，但不仅仅是人机接口技术。而人机接口技术也不仅仅在多媒体领域得到应用。人机接口技术的目的是让一般用户利用计算机完成他们在某一工作领域中的任务。随着多媒体技术及其相关技术的不断发展，人机交互的接口已经开始向更加自然，更加人性化的方向发展。例如多模态接口，它将手势识别、语音识别、自然语言理解甚至面部表情识别等综合应用于人机交互。当然，人机交互接口不仅仅是一个人机界面的问题，对于媒体的理解和人机通信过程可以看成是一种智能的行为，它与人类的智能活动有着密切的关系。而多媒体技术的涵盖面更加宽泛，包括多媒体数据模型、多媒体数据压缩技术、多媒体内容处理与检索技术、多媒体表现与同步技术、多媒体人机交互接口技术、多媒体通信与分布处理技术等等。略为全面的，多媒体技术可以定义为：以数字化为基础，能够对多种媒体信息进行采集、编码、存储、传输、处理和表现，综合处理多种媒体信息并使之建立起有机的逻辑联系，集成为一个系统并能具有良好交互性的技术。第 2 章媒体及媒体技术1为什么说媒体具有不同的抽象层次？对媒体的抽象层次和性质进行小结。在获得媒体语义的过程中，抽象起着十分重要的作用，这种抽象是复杂的，而且与任务有关。通常包括若干抽象层，每一个抽象层都包含着与具体的任务和问题域有关的模型。从接近具体感官的信息表示层到接近符号的信息表示层，信息的抽象程度递增，而数据量则递减。语义就是在从感官数据到符号数据的抽象过程中逐步形成的。对不同媒体来说，媒体的语义是处于不同层次上的。抽象的程度不同，语义的重点也就不同。2媒体的空间含义是指什么？媒体的时间含义是指什么？媒体的时空综合是指什么？什么是媒体的时空“上下文”？多媒体信息的空间意义有两种解释。第一种是指表现空间，尤其是指显示空间的安排，目前在大多数研究中指的都是这一类。第二种空间意义是把环境中各种表达信息的媒体按相互的空间关系进行组织，全面整体地反映信息的空间结构，而不仅仅是零散的信息片断。媒体的时间也有两种含义。一是表现所需的时间，这是所有媒体都需要的。第二种时间意义即同媒体的空间一样，媒体的时间也可以包含媒体在时间坐标轴上的相互关系。媒体的时间关系存在于同步、实时等许多方面。空间和时间组成了一个三维的时空坐标系统。时间与空间的联系构成了媒体的时空“上下文”。3媒体的结合为什么会产生“感觉相乘”的效果？试举几个例子对此加以说明。多媒体的作用在很大程度上是媒体之间结合产生的影响。这种结合可以是低层次的，如在显示窗口中提供多种媒体信息片断，并将视觉、听觉相互结合，造成一种比较适合的媒体表现环境；也可以是高层次的，由各种媒体组成完全沉浸的虚拟空间，但应该如何结合现在还缺乏理论上的指导。媒体之间可以相互支持，也可以相互干扰。如果媒体之间是相互支持的关系，则这种媒体结合所产生的效果就是“感觉相乘”效应。“感觉相乘”的例子很多，比如以视听并举的方式传递信息，比仅仅依靠观察或者解说能产生更好的效果；为了追求更强的沉浸感，虚拟现实环境的构建往往需要综合考虑视觉、听觉、触觉甚至嗅觉等多种感觉。4什么是媒体的语义？什么是隐喻？各种媒体的信息在最低层次上都是二进制位流。如果仅仅作为信息的简单通道，系统不必了解媒体的语义，但如果要多媒体系统具有对媒体进行选择、合成等方面的能力，就必须赋予它媒体的语义知识，从而使得系统能在媒体之上对媒体进行比较、选择和合成。媒体被赋予的媒体的语义知识即为媒体的语义。在与多媒体系统交互的过程中，人所依据的是关于这种交互的概念模型，也称心智模型（Mental Model）。这种概念模型的建立往往需要培训和经验，不易于被用户所接受。一种较好的方法是模拟人对其他事物的知识和技能，把它们挪到多媒体系统中使用，媒体的多样性为这种模拟提供了一个很好的基础，这种模拟，就是隐喻技术。5研究声音心理学对声音的处理会带来哪些好处？试举例加以说明。说明掩蔽、临界频带、相位对声音的影响。各种声音可以互相掩蔽，也就是说一种声音的出现可能使得另一种声音难于听清。纸张的沙沙声、鼓掌声、咳嗽声等往往会掩盖说话声和音乐声。一般说来，在掩蔽音条件下，要听清被测量的测验音，就必须提高测验音的强度。由于声音的掩蔽效果，可以欺骗人的听觉。在频率的某一临界区里，各种声音强度是相互作用的，合成声音的响度由这些频率共同决定，但在临界区内不会改变。如果超出临界区，声音的响度不再相互作用，随频率而变。这个临界区就是临界频带，其宽度视其中心频率而定。从声音的波形来看，声音的起点和方向也要反映声音的特性，这就是声音的相位。当两个声音相同而相位完全相反时，它们将相互抵消；当两个声音相同而且相位也相同时，声音就会得到加强。相位的确定对于多声道声音系统的设计非常重要，它可以应用在回声的消除、会议系统的声音设计上等。6声音的数字化过程是怎样的？什么是声音的符号化？声音在真实世界是模拟的，时间和幅度上是连续的，声音的数字化主要包括采样、量化、编码等步骤。波形声音可以把音乐、语音都进行数字化并表示出来，但这并没有将它看成音乐和语音。对声音的抽象化（即符号化）表示包括两种类型，一种是音乐、一种是语音。声音的符号化即将声音转变为符号序列的过程。7声音的三维化处理所基于的原理是什么？双工理论的作用在何时体现得较为明显、何时又会失效？耳廓模型的建立是为了达到什么样的目标？声音的三维化处理基于的原理是双工理论。人耳对声音定位的特性，通过大脑的综合作用后，对有差别的声音信号进行了相对于空间位置的定位。很显然，如果按此方法使用计算机向人耳提供不同的声音，人的大脑也会综合出声音的位置信息。双工理论过于简单，这一理论实际上是处于一个较理想的状态下，即无反射、无折射和单频率等，但实际上人耳所处的环境比双工理论描述的环境要复杂得多。按照双工理论，人耳应没有在垂直平面的定位能力，不能够区分前后，因为在这些情况下两耳间声音的到达时间差 ITD 和两耳间声音的强度差 IID 都几乎为零；而实际上，人耳确实具有这方面的能力，这就是耳廓的作用。耳廓模型的建立，主要为了模拟出人耳的听觉特性，具体来讲，就是模拟如何解析声源的本身信号特征、声源的空间三维位置、声源所处的环境这 3 个因素。建立正确的耳廓模型有利于创造三维的虚拟听觉空间。8视觉心理学对视觉信息的处理辅助体现在哪些地方？如何利用这些心理学特性？虽然光的物理特性与心理知觉有关，但并不是线性的。把物理波的强度加倍，感受到的亮度却并不加倍。对光的色调和亮度的感觉不仅和它的频率与强度有关，而且还和它出现的背景有关，和同时出现的周围光有关。即使是最简单的物理因素也要受到神经系统的复杂分析，从而产生出复杂的心理知觉反应。将物理性质和心理知觉区分开来，就是十分重要的。在多媒体信息系统的设计过程中，充分考虑视觉心理学特性，能提供更好的人机交互方式。9试完整地推导出单视点坐标系中、两眼坐标系中三维空间的一点 P（x,y,z）投影到z=0 平面上的二维坐标。以视点为投影中心，将三维物体的点投影于显示器的投影平面上，便在该平面上产生三维物体的像。下图所示是投影的示意，其中投影中心在坐标系的 A 点，其坐标为 A（0，0，.d），d 为视点到投影平面的距离，也就是人眼到显示器的距离。P（x,y,z）是三维空间中一点，P 在 z=0 平面上的投影坐标为 Q（X,Y,0），设点 P、Q 在 y=0 上的投影分别为 M、N，M、N 在 x=0 上的投影分别为 R、O。根据相似三角形原理有：ARAOANAMPNQM.即，zddARAOyY.从而有 Y = y/（1+z / d），同理有 X = x/（1+z / d）。投影变换原理10如何测定手腕的转动？人体的转动和头部的转动如何测定？为了测量手部的转动，需要两个发射器，测量出两个发射器 t1、t2 的空间坐标，就可以根据三角函数确定转动的角度：tg（.）=（Yt1.Yt2）/（Xt1.Xt2）tg（.）=（Zt1.Zt2）/（Yt1.Yt2）tg（r）=（Xt1.Xt2）/（Zt1.Zt2）人体的转动和头部的转动可用类似的方法测定。区别在于发射器 t1、t2 安装的位置不同。11通过系统制造出力的反馈效果和触觉效果可用于何处？试举例说明。通过力感反馈装置，可以直接提供力的反馈，提供使人感受到的物理力。例：虚拟手术中，手术刀的力反馈装置，能使虚拟手术的实施者受训训练人员更加准确的实施手术；驾驶、射击、格斗等游戏中，力反馈装置的引入，能大大提高玩家的沉浸感。触觉反馈能够让人体区别出不同物体的质感和纹理结构。触觉反馈可以在商品虚拟展示、数字娱乐等多个领域得到应用。12上网搜索有关数据手套、数据头盔、数据服装等设备及技术的有关内容，写出该设备的介绍性报告。略。第 3 章多媒体数据压缩1如何衡量一种数据压缩方法的好坏？多媒体数据存在哪些类型的冗余？评价一种数据压缩技术的性能好坏主要有 3 个关键的指标：压缩比、图像质量、压缩和解压的速度。希望压缩比要大，即压缩前后所需的信息存储量之比要大；恢复效果要好，尽可能地恢复原始数据；实现压缩的算法要简单，压缩、解压速度快，尽可能地做到实时压缩解压。除此之外还要考虑压缩算法所需要的软件和硬件。一般而言，多媒体数据中存在的数据冗余类型主要有以下几种。

展开阅读全文