《数字媒体及应用》PPT课件.ppt

上传人:w****2 文档编号:16566308 上传时间:2020-10-13 格式:PPT 页数:87 大小:3.31MB
返回 下载 相关 举报
《数字媒体及应用》PPT课件.ppt_第1页
第1页 / 共87页
《数字媒体及应用》PPT课件.ppt_第2页
第2页 / 共87页
《数字媒体及应用》PPT课件.ppt_第3页
第3页 / 共87页
点击查看更多>>
资源描述
第 5章 数字媒体及应用 5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用 2 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本的展现 3 文字处理是计算机应用的基础 计算机应用使用计算机进行信息处理 其中, 文字信息处理是涉及面最广的一种计算机 应用,几乎与任何领域任何人都有关。 文字 数值 语言 音乐 图像 信息的形态有多种 4 计算机文字处理过程 文字信息在计算机中称为“文本”( text),文本是计算机中最 常用的一种数字媒体 文本由一系列 “字符”( character)组成,每个字符均使用二 进制编码表示 文本在计算机中的处理过程是: ( 文本编辑器 ) 文本编辑 与排版 格式化的 电子文本 ( 2) 文本 展现 ( 文本阅读器 ) ( 5) 文本处理 ( 文本处理软件 ) ( 3) 文本准备 电子 文本 ( 1) ( 文字与图表 的输入 ) 文本存储 与传输 ( 4) (存档 /通信软件 ) 5 5.1.1. 字符在计算机中的表示 6 字符、字符集及其码表 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符都使用二进位 (code) 表示,称为该字符的 编码 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表 7 西文字符的编码 ASCII码 西文是表音文字 (拼音文字 ),它由拉丁字母、数字、标点符号 以及一些特殊符号所组成 美国标准信息交换码 (American Standard Code for Information Interchange, 简称 ASCII码 ): ASCII字符集包含 96个可打印字符和 32个控制字符 采用 7个二进位进行编码 计算机中使用 1个字节存储 1个 ASCII 字符 存在问题: 7位代码空间太小(只能对 128个字符编码) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 8 标准 ASCII字符集及其码表 b6 b5 b4 b3 b2 b1 b0 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 A B C D E F b 6b5b4 b3b2b1b0 0 1 1 0 1 0 0 1 1 0 1 9 常用的汉字编码字符集 国家标准 GB2312 汉字扩充规范 GBK 国家标准 GB18030 台湾地区的标准汉字字符集 CNS 11643 (BIG 5, 俗称“大五码” ) 日本工业标准汉字字符集 JIS X 0208-90 韩国国家标准汉字字符集 KSC 5601-87 10 一级汉字 ( 3755个) 二级汉字 ( 3008个) (扩充使用) 字母、数字和各种符号 1 94 2 3 位号 1 9 16 55 56 87 94 区 号 (按汉语拼音排列 ) (按偏旁部首排列 ) GB2312汉字编码字符集 1980年颁布 信息交换用汉字编码字符集 基本 集 GB2312-1980 GB2312字符集由三个部分构成: 拉丁字母、俄 文、日文平假 名与片假名、 希腊字母、汉 语拼音等共 682 个 共 6763个汉字和 682个符号, 每个 汉字或符号都有一 个确定位置,该位 置的区号和位号就 是这个汉字的“区 位码” (注:区位码仅用于在键盘上输入汉字) 11 背景材料: UCS/Unicode 解决多文种信息处理方法的发展: 传统方法( ISO):扩展 ASCII码 微软的方法:代码页切换 UCS/Unicode:所有文字字母和符号集中在同一字符集进行统一编码 (目 前收集了 17x216 1,114,112 个 ) UCS/Unicode的编码方案: 尽量与已有编码标准兼容 先实现部分字符的编码( 101,000个) 允许有若干不同的编码方案 , 例如: 单字节: ASCII字符 双字节:拉丁、希腊、阿拉伯, 三字节: CJK汉字 四字节:其他 Unicode:UTF-8 单字节可变长编码 应用: Linux, Web网页,电子邮件 双字节: ASCII字符、拉丁、希腊、阿 拉伯,常用 CJK汉字, 四字节: CJK汉字 Unicode:UTF-16双字节可变长编码 应用: Windows, Mac, Java, 12 例 : IE浏览网页时文字编码的选择 13 5.1.2. 文本准备 文稿如何输入计算机 14 文字符号输入计算机的方法 键盘输入 自动识别输入 字符信息的输入 人工输入 (1)数字编码 , 如电报码 、 区位码等 , (2)字音编码 , 如智能 ABC等 (3)字形编码 , 如五笔字形和表形码等 , (4)形音编码 发展趋势:基于统计和学习功能的以词语 (短语 )或句子作为输入单 位的输入方法 15 文字符号输入计算机的方法 键盘输入 联机手写输入 自动识别输入 字符信息的输入 人工输入 优点: 自然,流畅 小型化,适合移动计算 不足: 识别速度和正确性还需提高 书写要求还要降低 16 文字符号输入计算机的方法 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的 适应能力要大 大增强 识别速度和正确性还需大大提高 17 文字符号输入计算机的方法 印刷体识别 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 扫描仪 OCR 数字文本 纸介质 文本 文本的 映象 (image) 识别率已达到 98% 功能 : 简、繁体字 混合识别 中文、西文混合识别 文字、表格混合识别 智能校对功能 18 文字符号输入计算机的方法 印刷体识别 手写体识别 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 技术上非常困难 , 还无法实用 目前准备先突破工整的楷书手写体的识别 ! 19 汉字的键盘输入 汉字与键盘上的键无法一一对应,因此必须使用 几个键来表示一个汉字,这就称为汉字的“键盘输 入编码” 优秀的汉字键盘输入编码应具有的特点: 易学习、易记忆 效率高 (平均击键次数较少 ) 重码少 容量大 (可输入的汉字字数多 ) 20 5.1.3 文本的展现 (输出 ) 21 文本的展现 (输出 ) 目的:阅读、浏览或打印文本 使用的软件:文本阅读器 /文本浏览器 嵌入在文本编辑 (处理 )软件中,如微软的 Word, 独立的软件:如 Adobe公司的 Acrobat Reader, 微软公司的 IE等 文本展现的过程: 1.对文本的格式描述进行解释 2.生成文字和图表的映像( bitmap) 3.传送到显示器或打印机输出 22 附:输出过程中字形的生成 过程: 先根据字符的字体确定相应的字库( font), 再按照该字符的代码从字库中取出该字符的形状描述信息 然后按形状描述信息生成字形,并按照字号大小及有关属性 (粗体、斜体、下横线)将字形作必要的变换 最后将变换得到的字形放置在页面的指定位置处 2种不同的字库: 点阵 描述 轮廓 描述 轮廓点 直线 二次曲线 5.2 图像与图形 5.2.1 数字图像的获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形 24 5.2.1 数字图像的获取 25 图像的获取过程 扫 描 模 拟 图 像 取 样 取 样 取 样 数 字 图 像 分 色 量 化 量 化 量 化 从现实世界中获得数字图像的过程称为图像的“获取” 常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 图像获取过程: 将画面划分为 M N个网格,每 个网格称为 一 个取样点 将彩色图像取样 点的颜色分解成 R, G, B三个 基色 测量每个取样点 的每个分量(基 色)的亮度值 对取样点每个分 量的亮度值进行 A/D转换,使用 数字整型量表示 26 5.2.2 图像的表示与压缩编码 27 数字 (取样 )图像的组成 数字取样图像由 M(列 ) N(行 )个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由 3个彩色分量组成 灰度图像和黑白图像的像素只包含 1个亮度分量 Red分量 Green分量 Blue分量 像素 28 例 1:黑白图象的表示 黑白图像 黑白图像的每个像素只有一个分量,且只用 1个二进位表 示,其取值仅“ 0”(黑 )和“ 1”(白 )两种 29 例 2:灰度图象的表示 灰度图像 灰度图像的每个像素也只有一个分量,一般用 8 12个二 进位表示,其取值范围是: 0 2n-1,可表示 2n个不同的 亮度 30 例 3:彩色图象的表示 蓝 色 分 量 绿 色 分 量 红 色 分 量 彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设 3 个分量分别用 n,m,k个二进位表示,则可表示 2n+m+k种不同的颜色 31 数字 (取样 )图像的主要参数 图像大小(图像分辨率): 用来表示组成该图像的行列数目,亦即图像所包含的像素数目 使用 水平分辨率 x垂直分辨率 表示 对在屏幕上显示出来的大小有影响 颜色空间的类型,指彩色图像所使用的颜色描述方法,如: RGB(红、绿、蓝 )模型,显示器使用 CMYK(青、品红、黄、黑 )模型,彩色打印机使用 HSB(色彩、饱和度、亮度 )模型,用户界面中使用 YUV(亮度、色度 )模型,彩色电视信号传输时使用 像素深度,即像素的所有颜色分量的二进位数目之和 图像类型 像素的组成 像素深度 (位数 ) 颜色空间 单色图像 黑白图像 仅 1个分量 1位 不使用 灰度图像 仅 1个分量 2 12位 不使用 彩色图像 彩色图像 3个分量以上 8 36位 RGB, CMY, YUV等 32 数字图像的数据量 数字图像数据量的计算公式(以字节为单位): 数据量 =水平分辨率 垂直分辨率 像素深度 8 几种常用格式的图像的数据量: 图像大小 8位 (256色 ) 16位 (65536色 ) 24位 (真彩色 ) 640 480 300 KB 600 KB 900 KB 1024 768 768 KB 1.5 MB 2.25 MB 1280 1024 1.25 MB 2.5 MB 3.75 MB 例:数字图像传输时间的计算 假设数据传输速率为 56 kb/s(电话上网),则传输一幅分辨 率为 640 480的 6.5万种颜色的未压缩图像的时间为: (640 x480 x16)/56000 = 87.8秒 33 数字图像的数据压缩 图像数据压缩的必要性: 节省存储数字图像所需要的存储器容量 提高图像的传输速度,减少通信费用 图像数据压缩的可能性: 数字图像中有大量的数据冗余 人眼视觉有局限性,允许图像有一些失真 图像数据压缩的两种类型: 无损压缩:用压缩后的数据还原出来的图像没有任何误差 有损压缩:用压缩后的数据还原出来的图像有一定的误差 压缩编码方法的评价 压缩倍数的高低(压缩比) 重建图像的质量(有损压缩时) 压缩算法的复杂程度 34 图像文件 格式例 1: BMP格式 BMP图像格式是 Windows操作系统下使用的一种 标准图像格式 支持单色 、 16色 、 256色 、 真彩色图像 一个文件一幅图像 , 可以进行无损压缩 , 也可不压 缩 非压缩的 BMP文件是一种通用的图像文件格式 , 几乎所有 Windows 应用软件都能支持 35 图像文件 格式例 2: GIF 图像 颜色数目不超过 256色 ,适合用作插图、剪贴画等色彩数 要求不高的场合, 文件特别小 ,适合网络传输 GIF图像格式具有 累进显示 功能,适合网络浏览器观看 GIF图像格式能支持 透明背景 ( JPEG不支持) GIF图像格式能支持 动画 透 明 背 景 36 图像文件 格式例 3: JPEG图像 JPEG是静止图像数据压缩编码的国际标准,采用 JPEG标准的图像文件扩展名是 .jpg JPEG特别适合各种连续色调的彩色或灰度图像, 在计算机和数码相机中已得到广泛应用 JPEG的最新标准是 JPEG2000(图像文件扩展名 是 .jp2 ),它采用更先进的技术,可取得更好的 效果 37 5.2.3 数字图像处理与应用 38 数字图象处理:目的与内容 目的 : (1) 提高图像的视觉质量 (2) 恢复 与重建有失真和畸变的图像 (3) 图像分析 , 包括:图像的分类 、 识别和理解等 (4) 图像数据的变换 、 编码和数据压缩 (5) 图像的存储 、 管理与检索 (6) 图像内容与知识产权的保护 内容 : 去噪 、 增强 、 复原 、 分割 、 提取特征 、 压缩 、 存储 、 检索等 39 数字图像处理的应用 (1) 图像通信 , 包括图像传输 、 电 视电话 、 电视会议等 。 (2) 遥感 (3) 医疗诊断 (4) 工业生产中的应用 , 如产品质 量检测 , 生产过程自动控制等 (5) 机器人视觉 (6) 军事 、 公安 、 档案管理等其他 方面的应用 X光图像 CT图像 核磁共振 图像 指纹图像 40 5.2.4 计算机图形 41 什么是计算机图形 (graphics) 通过计算机和软件对景物的结构、形状与外貌进行描述 (称 为“建模” ),然后根据该描述和选定的观察位置及光线状 况,生成该景物的图形 (称为“绘制”或“图像合成” ) 计算机图形也称为计算机合成图像 计算机制作图形的步骤如下: 建模 /造型 (Modeling) 景物的 模型 (model) 景物 的视图 绘 制 (Rendering) (Image Synthesis) 42 景物的 2种描述 (建模 )方法 几何造 型技术 规则形体 (如工业产品 ) 用基本的几何元素 (如点、 线、面、体等 )及材料的表 面性质等进行描述 过程模 型技术 不规则形体 (如自然现象 ) 找出其生成规律,并使用 相应的算法来描述 43 计算机图形的绘制过程 从景物模型绘制出图形的过程,实际上也是把景物的描述 (模型 )转换成为点阵 (像素阵列 )的过程,它包括下列步骤: 将各个物体的 所有表面用小 的多边形(三 角形或四边形) 进行近似表示 用户选择一个观测位置,并设 定一个取景范围,将景物向成 像平面作透视投影;然后将景 物中不在取景范围内的部分裁 剪掉,同时还把景物中所有被 遮挡而看不见的部分隐去 根据景物表面材料 的性质和环境光源 的设定,计算出物 体可见面上每一点 (像素 )的颜色及其 亮度 计算出物 体所产生 的本影和 半影;根 据景物表 面和背景 使用的材 料,选择 合适的纹 理映射到 物体的表 面 44 美国康乃尔大学 Suzanne Smits 和 Priamos Georgiades建模 并绘制的俄罗斯 茶壶 例 1:俄罗斯茶壶 45 例 2:计算机绘制的钢笔画和铅笔画 木 桶 玻璃瓶 引用自: Georges Winkenbach,D.Salesin (Univ.of Washington) pp.469-476, SIGGRAPH96 46 计算机图形与显卡 (图形卡 ) 图形绘制过程中,每一个像素的颜色及其亮度都要经过大 量的计算才能得到,因此绘制过程的计算量很大,特别是 三维图形和动画 目前 PC机所配置的图形卡(显卡)上安装了功能很强的专 用绘图处理器,它能承担绘制过程中的大部分计算任务 S-Video接口 DVI接口 VGA接口 绘图处理器 显示卡 47 计算机图形的应用 (1) 计算机辅助设计和辅助制造 (CAD CAM)。 (2) 利用计算机生成各种地形图 、 交通图 、 天气图 、 海洋图 、 石油开采图等 。 (3) 作战指挥和军事训练 。 (4) 计算机动画和计算机艺术 。 (5) 其它:电子出版 、 数据处理 、 工业监控 、 辅助教学 、 软件 工程等 。 48 矢量绘图软件 专业绘图软件: AutoCAD、 PROTEL和 CAXA电子图板(机械、建筑等) MAPInfo、 ARCInfo、 SuperMap GIS (地图、地理信息系统) 办公与事务处理、平面设计、电子出版等使用的绘图软件: Corel公司的 CorelDraw, Adobe 公司的 Illustrator, Macromedia公司的 FreeHand, 微软公司的 Microsoft Visio等 内嵌的绘图软件: Word 和 PowerPoint中的绘图功能(简单的二维图形 ) 49 小结:图像与图形的对比 图像 图形 生成途径 通过图像获取设备获得景物的图像 使用矢量绘图软件以交互方式制作而成 表示方法 将景物的映像 (投影 )离散化,然后使用像素表示 使用计算机描述景物的结构、形状与外貌 表现能力 能准确地表示出实际存在 的任何景物与形体的外貌, 但丢失了部分三维信息 规则的形体 (实际的或假想的 ) 能准确表示,自然景物只能近 似表示 相应的编辑 处理软件 典型的图像处理软件 ,如 PhotoShop 典型的矢量绘图软件,如 AutoCAD 文件的扩展 名 .bmp .gif .tif .jpg .jp2 等 .dwg .dxf .wmf 等 数据量 大 小 5.3 数字声音及应用 5.3.1 波形声音的获取与播放 5.3.2 波形声音的表示与压缩编码 5.3.3 计算机合成声音 51 5.3.1 波形声音的获取与播放 52 声音的特性 和类型 声音由振动产生,通过空气进行传播 声音是一种波,它由许多不同频率的 谐波组成 谐波的频率范围称为声音的“带宽” 计算机处理的声音类型: 话音或语音 (speech),专指人的说话声音,带宽仅为 300 3400Hz 全频带声音 (如音乐声、风雨声、汽车声等 ),其带宽可达到 20Hz 20kHz 人耳可听到的声音统称“可听声” (audio) , 20Hz 20kHz 53 数字波形声音的获取 步骤: 2. 量化( quantization,模数转换 ) 3. 编码( encoding) 1. 取样( sampling) 取 样 模 拟 声 音 信 号 取样的目的是把时间上连 续的信号转换成时间上离 散的信号 量 化 量化是把每个样本从模拟 量转换成为数字量 (8位或 16位整数表示 ) 数字 声音 01100011001 编 码 将所有样本的二进制 代码组织在一起,并 进行数据压缩 54 数字波形声音的获取设备 声音的联机获取设备 (声卡 ) 声波转换 为电信号 声音的脱机获取设备:数码录音笔 麦克风 ( microphone) 声音卡 ( sound card) 模 拟 声 音 数 字 声 音 取样、量 化和编码 55 声卡的功能与逻辑组成 波形声音的获取与编码 波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成 DSP DMA接口 PC总线 取样,量化 D/A 重建,滤波 声音输出 声音输入 音乐合成器 mixer MIDI接口 声卡的主要功能 56 5.3.2 波形声音的表示 与压缩编码 57 数字波形声音的表示及其参数 数字波形声音是使用二进位表示的一种串行比特流,其数 据按时间顺序进行组织,文件扩展名为“ .wav” 数字波形声音的主要参数有: 取样频率: 语音的取样频率低,一般为 8kHz 全频带声音(如音乐)的取样频率高,一般为 44.1kHz 量化位数:通常为 8位、 12位或 16位 声道数目:单声道为 1,双声道为 2 码率 (比特率 ),每秒钟的数据量 58 数字波形声音码率的计算 未压缩时数字波形声音的码率计算公式 码率 = 取样频率 量化位数 声道数 例: 声音类型 声音信号带宽 (Hz) 取样频率 (kHz) 量化位数 (bits) 声道 数 未压缩时的 码率 数字语音 300 3 400 8 8 1 64 kb/s CD立体声 20 20 000 44.1 16 2 1411.2(kb/s) 压缩编码之后数字波形声音的码率为: 压缩后的码率 = 未压缩时的码率 /压缩倍数 例:上面 CD唱片的立体声音乐压缩为 MP3后,若压缩倍数 是 12倍,则该 MP3音乐的码率是: 118 kb/s左右 59 数字波形声音的数据压缩 数字波形声音的数据量很大,例如: 数字语音 1小时的数据量大约是 30MB CD立体声高保真的数字音乐 1小时的数据量大约是 635MB 数据压缩的必要性: 为了降低存储成本和提高在网络上的传输效率 数据压缩的可能性: 声音中包含了大量冗余信息;人耳的灵敏度有限,允许有一 定失真 数字波形声音压缩编码的方法: 全频带声音:国际标准 MPEG;工业标准 Dolby AC-3 数字语音:固定电话使用 ADPCM编码 移动电话使用高效率的混合编码技术 60 全频带数字音频编码的标准 所谓“ MP3音乐”就是一种采用 MPEG-1层 3编码的高质量数字声音 , 它 能以 10倍左右的压缩比降低高保真数 字声音的存储量,使一张普通 CD光盘 上可以存储大约 100首 MP3歌曲 标准名称 压缩后的码率 (每个声道 ) 声道数目 主要应用 MPEG-1 audio层 1 192 kbps (压缩 4倍) 2 数字盒式录音带 MPEG-1 audio层 2 128 kbps(压缩 6倍) 2 DAB,VCD, MPEG-1 audio层 3 64kbps(压缩 11 12倍) 2 Internet, MP3音乐 MPEG-2 audio 与 MPEG-1层 1,层 2,层 3相同 5.1, 7.1 同 MPEG-1 Dolby AC-3 64 kbp 5.1, 7.1 DVD, DTV,家庭影院 61 什么是流媒体? 在因特网上收听 (看 )音 (视 )频节目的 2种方式: 下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点: 需要等待很长时间,并需要较大的存储容量) 流式传输方式:边下载、边播放(优点:只需要下载一部分数据之 后 , 就可以开始一边播放一边下载,等待时间短、存储需求小) 流媒体技术就是允许在网络上让用户一边下载一边收看 (听 ) 音视频媒体的一种技术 目前主要有 3个公司的流媒体产品: 1. Real Networks公司的 Real Media 2. 微软公司的 Windows Media 3. 苹果公司的 Quick Time 62 5.3.3 计算机合成声音 63 什么是计算机合成声音? 计算机合成声音就是计算机模仿人说话或演奏音乐 计算机合成声音有两类: 计算机合成语音: 计算机模仿人把一段文字朗读出来,即把文字转换为语音 (简称为 TTS) 应用:有声查询、文稿校对、语言学习、语音秘书、自动报 警、残疾人服务等 计算机合成音乐: 计算机模拟各种乐器发声并按照乐谱演奏音乐 应用:计算机作曲、配器等 64 计算机合成音乐( MIDI) 音乐 合成器 音乐 MIDI 文件 媒体 播放器 MIDI 消息 计算机合成音乐需要三个要素:乐器、乐谱和“演奏员” 声卡上的音乐合成 器能像电子琴一样 模仿几十种不同的 乐器发出声音,它 按照 MIDI消息合成 出不同音色和音调 的音符,通过扬声 器播放出音乐来 乐谱在计算机中使用 一种叫做 MIDI的音 乐描述语言来表示。 使用 MIDI描述的音 乐称为 MIDI音乐。 一首乐曲对应一个 MIDI文件,其文件 扩展名为 .MID 或 .MIDI 媒体播放器软件相当 于“演奏员”。播放 MIDI音乐时,它先 从磁盘上读入 .MID 文件,解释其内容, 然后以 MIDI消息的 形式向声卡上的音乐 合成器发出各种指令 65 背景材料:音乐合成器 PC机声卡一般都带有 MIDI音源(音乐合成器) MIDI音源有两种: 调频合成器 (一种受控的电子振荡器)。音色单调,效果较 差,已很少使用 波表合成器 。音色丰富,效果很好,可扩展,现广泛使用 波表合成器的原理 预先将真实乐器演奏的各个音符的波形数字化,把它们组织 成一个个波表文件存放在存储器中 播放时合成器软件根据乐器类型和音符参数等将相应的波形 数据修饰成所要求的音强和时长,然后合成、加工后播放 低通滤波 采样、量化 加工处理 乐器演奏 波表 文件 录音 5.4 数字视频及应用 5.4.1 数字视频基础 5.4.2 数字视频的压缩编码 5.4.3 合成视频 计算机动画 5.4.4 数字视频的应用 67 5.4.1 数字视频基础 68 数字视频信号的获取 视频信号的数字化过程 : 与图像、声音的数字化过程相仿,但更复杂一些 (8-10 bits) 滤波 取样 量化 编码 数字 视频 信息 模拟 视频 信号 V U Y U V Y 数字视频的获取设备: 视频采集卡 ( 简称视频卡 ) 数字摄像头,通过光学镜头和 CCD或 CMOS采集动态图像, 转换成数字信号并输入 PC机 脱机获取设备:数码摄像机 69 数字摄像头 分辨率为 352 288 640 480 速度一般在 30fps(每秒 30帧) 左右 镜头的视角可达到 45-60度 支持 USB接口 或 IEEE1394(火 线)接口 成像器件采用 CMOS或 CCD 70 数码摄像机 提供 480线以上的分辨率,清 晰度高 自动对焦,自动曝光 使用 MPEG-2进行压缩编码, 然后记录在硬盘上 具有录音功能 数据量很大,采用 USB接口 或 IEEE1394接口 71 5.4.2 数字视频的压缩编码 72 数字视频的压缩编码 视频数据压缩的可能性: 数字视频的数据量大得惊人, 1分钟的数字电视图像未压缩 时其数据量可超过 1GB,对存储、传输和处理都有很大的困 难 视频数据压缩的可能性: 视频信息的每个画面内部有很多信息冗余 相邻画面的内容有高度的连贯性 人眼的视觉灵敏度有限,允许画面有一定失真 结论: 数字视频的数据量可压缩几十倍甚至几百倍 73 数字视频的三类编码标准 ITU-T国际标准: H.261(Px64)标准、 H.263标准等 ISO/IEC 国际标准: MPEG-1标准, MPEG-2标准(等同于 ITU-T H.262), 用于低分辨率、低码率视频应用的 MPEG-4 ASP, 代表当前技术水准的 MPEG-4 AVC视频编码标准(等同于 ITU-T H.264) ,在 HDTV、蓝光盘、 XBOX、 iPod、 iPhone等众多领域得 到推广应用。 公司标准: Intel公司的 IndeoVideo,苹果公司在 QuickTime中使用 过的 Cinepak, Real Network公司的 RealVideo,微软公司的 WMV, Adobe公司 Flash播放器中使用的 VP6等 74 目前流行的数字视频编码标准 名 称 图像格式 压缩后的码率 主要应用 MPEG-1 360 288 大约 1.2 Mb/s 1.5Mb/s 适用于 VCD、 数码相机 、 数字摄像机 等 H.261 360 288 或 180 144 Px64 kb/s (P=1、 2时 , 只 支持 180 144格式 , P6时 , 可支持 360 288格式 ) 应用于视频通信 , 如可视电话 、 会议 电视等 MPEG-2 (MPML) 720 576 5 Mb/s 15Mb/s 用途最广 , 如 DVD、 卫星电视直播 、 数字有线电视等 MPEG-2 高清格式 1440 1152 1920 1152 80 Mb/s 100Mb/s 高清晰度电视( HDTV)领域 MPEG-4 ASP 分辨率较低 的视频格式 与 MPEG-1, MPEG-2相当 , 但最低可达到 64kb/s 在低分辨率低码率领域应用 , 如监控 、 IPTV、 手机 、 MP4播放器等 MPEG-4 AVC 多种不同的 视频格式 采用多种新技术 , 编码效 率比 MPEG-4ASP显著减少 已在多种领域应用 , 如 HDTV、 蓝光 盘 、 IPTV、 XBOX、 iPod、 iPhone等 75 影视文件与播放器 播放器 (Plaper)实际上就是一种解码器,但通常既可以解码多种类型的信息 (音频、视频、图片、 ),还能解码多种不同类型的文件格式。 PC上使用的是软件播放器,一台计算机可以安装多个不同的播放器: 微软公司的“ Microsoft Media Player”, 苹果公司的 QuickTime Player和 iTunes, Real公司的 RealPlayer (简称 RealOne 播放器 ) “全能”播放器: Storm Player(暴风影音)、 The KMPlayer、绚彩魅影、 变色龙万能播放器( PPStream)、豪杰超级解霸,等等 硬件播放器(便携式): MP3播放器:以播放 MP3格式的音频信息为主,也能收听广播、观看文本和图 片,功能更强一些的还能播放视频信息 MP4播放器:以播放视频为主,国外叫做 PVP(个人视频播放器)或 PMP (便携式媒体播放器), LCD屏幕较大,价格较高 76 附:什么是 MP4? MP4播放器是一种能够播放视频的便 携式设备,也叫做 PVP(个人视频播 放器)或 PMP(便携式媒体播放器) 功能: 看录像(电影) 播放音乐 浏览文本和图片 甚至还可以上网 技术特点: 自带 2 5英寸的 LCD屏 存储容量达几十 GB 77 5.4.3 合成视频 计算机动画 78 什么是计算机动画? 计算机动画 使用计算机生成一系列内容连续的画面供 实时演播的一种技术,它是一种计算机合成的数字视频, 而不是用摄像机拍摄的“自然视频” 上世纪九十年代开始,计算机动画技术应用于电影特技, 如电影“侏罗纪公园”、 玩具总动员 、 泰坦尼克 等,取得轰动效应 应用领域: 影视和广告领域:电影特技、动画片、电视广告制作等 教育和培训领域:辅助教学、驾驶员训练等 科技领域:科学计算可视化,复杂系统的动态模拟 军事领域:军事训练、作战模拟等 游戏 79 计算机动画的制作过程 计算机动画制作包括:在计算机中建立景物的模型 、 描述 它们的运动 、 生成一系列逼真的图像 三维计算机动画制作过程分以下几个阶段: ( 1) 描述景物的形状与结构 ( 建模 ) ( 2) 确定景物的颜色和材质 ( 纹理 ) ( 3) 设置灯光和确定虚拟摄像机的位置 ( 4) 描述场景中物体的运动和摄像机的移动 ( 5) 绘制一系列的图像 ( 6) 输出动画结果 80 5.4.4 数字视频的应用 1 VCD与 DVD 2 可视电话与视频会议 3 数字电视 4 点播电视 81 什么是 VCD, 什么是 DVD ? VideoCD(简称 VCD):按 MPEG-1标准将 60分钟的 音频 /视频节目记录在一张 CD光盘上,图像质量为 VHS (352 240),即家用录放像机的水平,可播放立 体声 DVD-Video(简称为 DVD影碟):按 MPEG-2标准将 音频 /视频节目记录在 DVD光盘上,图像质量为广播 级 (720 576),可播放 5.1声道的环绕立体声,单面 单层 DVD(容量为 4.7GB)光盘可记录 120分钟以上 的影视节目 82 VCD与 DVD的比较 VCD DVD 视频压缩编 码标准 MPEG-1 video,图像分 辨率为 352 240(家用 电视质量) MPEG-2 video,图像分辨率为 720 480(广播级电视图像质量) 音频压缩编 码标准 MPEG-1 audio,层 2, 支持双声道立体声 MPEG-2audio或杜比 AC-3,支持 5.1声 道的三维环绕立体声 光盘存储容 量 650MB左右 有多种不同规格。单面单层 DVD容 量为 4.7GB,单面双层为 8.5GB 播放时间 1小时左右 单面单层 DVD光盘可播放 2小时左右 其他功能 较少 支持多种辅助功能,如多种文字字幕, 多种语言声音,多种视角,多种宽高 比等 83 可视电话和视频会议 可视电话:通话双方能互相看见的一种电话系统 电话机具有摄像、显示、声音等功能,内置高质量 CCD镜头 及 MODEM 视频会议:多人同时参与的一种音 /视频通信系统 类似于可视电话,但多人参加通话,提供的功能也更加丰富 两种实施方式: 在电信局的数字通信网上进行 在互联网上进行,例如使用下列即时通信软件: 微软的 MSN Messenger, 腾迅的 QQ, 网易的 POPO 84 什么是数字电视 ? 数字电视指的是 :电视 节目的制作 ( 摄录 、 编辑 ) 、 处理 、 传输 、 接收播放全过程 的数字化 , 特别是将电视信号进行 数字化之后以 数字形式进行传输和接收 ; 数字电视的范围: 高端 全高清晰度电视 (HDTV), 分辨率 1920 x1024 中端 常规模拟电视的数字化 ( DTV) , 720 x480 低端 包括互联网上的 IPTV等 节目制作 信号处理 广播传输 接收播放 1 2 3 4 85 数字电视的优点 (1) 频道利用率高 可传输的数字电视节目比传输模拟电视节目增加好几倍 (2) 抗干扰能力强 同等传输条件下的抗干扰能力优于模拟电视 (3) 图像清晰度高 用户接收到的图像质量能达到演播室水平 (4) 音响效果好 具有 CD级音质效果,可支持 5.1环绕立体声家庭影院 (5) 可开展基于 TV的交互式数据业务 包括电视购物、电视银行、电视商务、电视游戏、点播电 视等业务 86 数字电视的传播途径 数 字 视 频 节 目 制 作 视频 服务器 光盘 制作 地面无线 (DVB-T) 卫星 (DVB-S) 数字 CATV(DVB-C) Internet(IPTV) VCD DVD 解码器 电视机 PC机 BD 87 什么是点播电视 (VOD) ? VOD(点播电视)指用户可以自己选择观看需要的电视节 目,改变了电视台播什么用户只能看什么的电视收看模式 用 户 接入网 宽 带 广域网 交换器 LAN 家庭用户 单位用户 视频 服务器 28.8-128 kb/s 10-100Mb/s 分配服务器 和 /或 智能部件 网 管 工作站 节目制作中心 VOD系统组成的示意图
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!