计算机专转本辅导_第5章_数字与媒体

上传人:biao****biao 文档编号:243152674 上传时间:2024-09-17 格式:PPT 页数:135 大小:5.55MB
返回 下载 相关 举报
计算机专转本辅导_第5章_数字与媒体_第1页
第1页 / 共135页
计算机专转本辅导_第5章_数字与媒体_第2页
第2页 / 共135页
计算机专转本辅导_第5章_数字与媒体_第3页
第3页 / 共135页
点击查看更多>>
资源描述
,Click to edit Master title style,Click to edit Master text stylesgood1,Second levelgood2,Third levelgood3,Fourth levelgood4,Fifth levelgood5,*,第,5,章 数字媒体及应用,5.,1,文本与文本处理,5.,2,图像与图形,5.,3,数字声音及应用,5.4,数字视频及应用,本章考题题型分布,年 份,单选,多选,填空,判断,小计,2005,年,1,1,2,1,5,2006,年,3,1,3,2,9,2007,年,4,1,1,3,9,2008,年,5,1,1,2,9,2009,年,5,1,1,2,9,2010,年,5,1,1,2,9,5.1,文本与文本处理,5.1.1,字符的编码,5.1.2,文本准备,5.1.3,文本的分类,5.1.4,文本编辑、排版与处理,5.1.5,文本的展现,文字处理是计算机应用的基础,计算机应用使用计算机进行信息处理,其中,,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。,文字,数值,语言,音乐,图像,信息的形态有多种,写作,编辑,排版,印刷,发行,写作,传统的文字处理过程,计算机文字处理过程,文字信息在计算机中称为“,文本,”(,text,),文本是计算机中最常用的一种数字媒体,文本由一系列 “,字符,”(,character,)组成,每个字符均使用二进制编码表示,文本在计算机中的处理过程是:,(,文本编辑器,),文本编辑与排版,格式化的电子文本,(,2,),文本展现,(,文本阅读器,),(,5,),文本处理,(,文本处理软件,),(,3,),文本准备,电子文本,(,1,),(,文字与图表,的输入,),文本存储,与传输,(,4,),(,存档,/,通信软件,),5.1.1.,字符在计算机中的表示,字符、字符集及其编码表,文字的基本元素是字母和符号,统称为“字符”,(character),,它包括:字母、数字、标点、符号等,字符集:一组特定字符的集合,不同的字符集包含的字符数目与内容不同,如:,中文字符集、西文字符集、日文字符集等,字符的编码:,字符集中每个字符的二进位表示,称为该字符的编码或代码,(code),不同的字符其编码各不相同,字符集中所有字符的编码的一览表,称为该字符集的码表,一、,西文字符的编码,ASCII,码,西文是表音文字,(,拼音文字,),,它由拉丁字母、数字、标点符号以及一些特殊符号所组成,美国标准信息交换码,(ASCII,码,),:,ASCII,字符集包含,96,个可打印字符和,32,个控制字符,采用,7,个二进位进行编码,计算机中使用,1,个字节存储,1,个,ASCII,字符,存在问题:,字符集太小(只有,128,个字符),不同国家和地区使用不同的字符集及其编码,互不兼容,东亚地区使用的大字符集无法编码,0,X X X X X X X,一级汉字,(,3755,个),二级汉字,(,3008,个),(扩充使用),字母、数字和各种符号,1,94,2,3,位号, ,1,9,16,55,56,87,94,区 号,(,按汉语拼音排列,),(,按偏旁部首排列,),GB2312,汉字编码字符集,1980,年颁布,信息交换用汉字编码字符集,基本集,(我国第一个国家标准),GB2312-1980,GB2312,字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共,682,个,共,6763,个汉字和,682,个符号,,每个汉字和符号都有一个确定位置,区位码,:,GB2312,国标字符集构成一个二维平面,它分成,94,行、,94,列,,行号称为,区号,,列号称为,位号,。,问题:,文本中的汉字与西文字符易与单字节的标准,ASCII,码混淆不清。,例如:“大”字的,区号,20,,,位号,83,,区位码是,20,83,,用,2,个字节表示为:,00010100,01010011,(,14,53,H,)。,解决方法:,把一个汉字看作两个扩展,ASCII,码,即每个汉字的区号和位号必须分别加上,32,(即,0010 0000,),且使表示,GB2312,汉字的两个字节的最高位,(b7),都等于“,1”,。,1,1,第,1,字节,第,2,字节,X X X X X X X,X X X X X X X,这种高位为,l,的双字节(,16,位)汉字编码就称为,GB2312,汉字的“,机内码,”,又称,内码,。,例如:“大”字的内码是:,10110100 11110011,(,B4F3,)。,汉字的区位码、国标码、机内码的关系:,国标码,=,区位码,+2020H,机内码,=,国标码,+8080H,机内码,=,区位码,+A0A0H,汉字机内码双字节,最高位是,1,;西文字符机内码单字节,最高位是,0,。,GB,K,汉字,内码扩充规范,GB2312,的不足:,汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与,ASCII,码不兼容,GB,K,汉字,内码扩充规范(,1995,):,在,GB2312,基础上,增加了,1,万多汉字,(,包括繁体字,),和符号,共有,21003,个汉字和,883,个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字,与,GB8312,保持向下兼容,也使用双字节表示,第,1,字节最高位必须为“,1”,:,1,X,第,1,字节,第,2,字节,X X X X X X X,X X X X X X X,UCS/Unicode,多文种大字符集,背景:为了实现全球数以千计的不同语言文字的统一编码,方案:,ISO,将全球所有文字字母和符号集中在一个字符集中进行统一编码,(,目前共收集了,17x2,16,1,114,112,个,),,称为,UCS/Unicode,UCS/Unicode,的编码方案:,先实现部分字符的编码(共,107,361,个字符),尽量与已有编码标准兼容,其中包含有中、日、韩统一整理出来的近,3,万汉字(,CJK,汉字),允许有若干不同的编码方案,例如:,单字节:,ASCII,字符,双字节:拉丁、希腊、阿拉伯,,三字节:,CJK,汉字,四字节:其他,Unicode:UTF-8,单字节可变长编码,应用:,Linux,,,Web,网页,电子邮件,双字节:,ASCII,字符、拉丁、希腊、 阿,拉伯,常用,CJK,汉字,,四字节:非常用,CJK,汉字,Unicode:UTF-16,双字节可变长编码,应用:,Windows,,,Mac,,,Java,,,GB18030,汉字编码标准,背景:无论是,Unicode,的,UTF-8,还是,UTF-16,,其,CJK,汉字字符集虽然覆盖了我国已使用多年的,GB2312,和,GBK,标准中的汉字,但它们的,编码并不相同,为了既能与,UCS/Unicode,编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在,2000,年和,2005,年两次发布,GB18030,汉字编码国家标准,。,GB18030,实质上是,UCS/Unicode,字符集的另一种编码方案:,单字节编码(,128,个)表示,ASCII,字符,双字节编码(,23940,个)表示汉字,与,GBK,(以及,GB2312,)保持向下兼容,,GBK,不再使用,四字节编码(约,158,万个)用于表示,UCS/Unicode,中的其他字符,GB18030,目前已在我国信息处理产品中强制贯彻执行。,标准名称,GB2312,GBK,GB,18030,UCS-2,(Unicode),字符集,6763,个汉字,(,简体字,),21003,个汉字(包括,GB2312,汉字在内),近,3,万汉字,(,包括,GBK,汉字和,CJK,及其扩充中的汉字,),包含,10,万多字符,其中的汉字与,GB18030,相同,编码方法,双字节存储和表示,每个字节的最高位均为“,1”,双字节存储和表示,第,1,个字节的最高位必为“,1”,部分双字节、部分,4,字节表示,双字节表示方案与,GBK,相同,UTF-8,采用单字节可变长编码,UTF-16,采用双字节可变长编码,兼容性,编码,不兼容!,小结:几种汉字编码的对比,编码保持向下兼容,例,: IE,浏览网页时文字编码的选择,5.1.2.,文本准备,文稿如何输入计算机,文字符号输入计算机的方法,键盘输入,自动识别输入,字符信息的输入,人工输入,(1),数字编码,如电报码、区位码等,(2),字音编码,如智能,ABC,等,(3),字形编码,如五笔字形和表形码等,(4),形音编码,发展趋势:基于统计和学习功能的以词语,(,短语,),或句子作为输入单位的输入方法,文字符号输入计算机的方法,键盘输入,联机手写输入,自动识别输入,字符信息的输入,人工输入,优点:,自然,流畅,小型化,适合移动计算,不足:,识别速度和正确性还需提高,书写要求还要降低,文字符号输入计算机的方法,键盘输入,联机手写输入,语音输入,自动识别输入,字符信息的输入,人工输入,优点:,自然,方便,适合移动计算,不足:,对说话人、说话方式、说话内容的,适应能力要大大增强,识别速度和正确性还需大大提高,文字符号输入计算机的方法,印刷体识别,键盘输入,联机手写输入,语音输入,自动识别输入,字符信息的输入,人工输入,扫描仪,OCR,数字文本,纸介质文本,文本的映象,(image),识别率已达到,98%,功能,:,简、繁体字,混合识别,中文、西文混合识别,文字、表格混合识别,智能校对功能,文字符号输入计算机的方法,印刷体识别,手写体识别,键盘输入,联机手写输入,语音输入,自动识别输入,字符信息的输入,人工输入,技术上非常困难,还无法实用,目前准备先突破工整的楷书手写体的识别,!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”,优秀的汉字键盘输入编码应具有的特点:,易学习、易记忆,效率高,(,平均击键次数较少,),重码少,容量大,(,可输入的汉字字数多,),汉字键盘输入方法的比较,类型,原理,举例,优点,缺点,数字,编码,使用一串数字来表示汉字,电报码,区位码,仅使用,10,个数字键,难记忆,字音,编码,把汉语的拼音作为汉字的输入编码,智能,ABC,紫光,微软拼音输入,简单易学,适合于非专业人员,重码多,需增加选择操作,不会汉语拼音或不知道读音时无法使用,字形,编码,把汉字的部件或笔画作为码元,按照汉字结构及其切分规则作为编码依据,确定每个汉字的输入代码,五笔字形,表形码,郑码,重码少、输入速度较快,适合于专业录入员、打字员使用,缺乏统一的规范,编码规则不易掌握,音形,编码,(,或形音编码,),采用字音及字形两种属性作为码元的汉字编码输入方法,粤音输入法,同上,同时要掌握音、形两种取码方法或规则,对普通用户比较困难,5.1.3,文本的分类,简单文本,(,纯文本,),本 书 由 南 京 大 学 出,B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7,B3 F6,版 社,( P u b l i s h i n g,B0 E6 C9 E7 28 50 75 62 6C 69 73 68 69 6E 67,H o u s e o f N a n j i n,20 48 6F 75 73 65 20 6F 66 20 4E 61 6E 6A 69 6E,g U n i v e r s i t y ),出 版,67 20 55 6E 69 76 65 72 73 69 74 79 29 B3 F6 B0 E6,文本的内容,文本在计算机中的表示,没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是,.txt,由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息,举例:,丰富格式文本,本书由南京大学出版社,(Publishing House of Nanjing University),出版,有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”,丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。,举例:下面标题的格式为:中文用黑体,西文用,Arial Black,体,居中,使用,HTML,语言描述为:,本书由南京大学出版社,(Publishing House of Nanjing University),出版,用一对,指出的是标记,如,和,等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,超文本,若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本”,A,B,C,D,E,F,G,H,a1,a2,b2,c2,f1,d1,c1,b1,e1,g1,h1,a3,“,超链,”,实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频,小结:文本的分类,文本,类型,特点,在计算机内的表示,文件,扩展名,用途,简单,文本,没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格,由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息,.txt,网上聊天,短信,文字录入,OCR,输入,丰富,格式,文本,(,线性文本,),有字体、字号、颜色等变化,文本在页面上可以自由定位和布局,还可插入图片和表格,除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等,.doc,.rtf,.,htm,.html,.,pdf,公文,论文,书稿,网页,丰富,格式,文本,(,超文本,),除上述特征外,文本中还含有超链,使文本呈现为一种网状结构,同上,但还应包含用于指出“链源”和“链宿”的标记,.doc,.rtf,.,htm,.html,.,pdf,.,hlp,同上,以及软件的联机文档,(,帮助文件,),5.1.4,文本的编辑与排版,复习:使用,Word,的操作流程,创建新文档或打开老文档,文稿输入,编辑,排版,文档存盘、打印或发送,输入中西文字、符号和图表,进行增、删、改操作,保证文本的正确性,满足清晰、美观、便于使用等要求,目的:确保文本内容正确无误,操作:对字、词、句和段落进行添加、删除、修改等操作,MS Word,的功能:,在文本的任何位置都可以插入新的文字,从文本的任何位置都可以删除不需要的文字,将一段文字从一处移动到另一处,将一段文字从一处复制到另一处,在文本中自动查找指定的词语,用一个词语自动替换文本中指定的词语,文本编辑,(text editing),目的:使文本清晰、美观、便于阅读,操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成,3,个层次:,对字符格式进行设置,对段落格式进行设置,对文档页面进行格式设置,文本排版,(,格式化,),设置字符的格式,字号,(,八号 初号,5,磅,72,磅以上,),1,磅相当于,1/72,英寸,字体,(,宋体、,楷体,、,黑体,、,仿宋,、,隶书,),字符的修饰,字符的形状,(,字形,),:,正常,、加粗、,倾斜,、,加粗倾斜,字形的修饰:,下划线,、着重号、上下标、删除线,字符的颜色,字符的宽度,字符的间距,字符的效果,字符的排列方向,Demo1,什么是段落?用“回车”相互隔开的一组文字,段落格式的设置:,段落的对齐方式,(,两端对齐、分散对齐、居中对齐、左对齐、右对齐,),段落的缩进方式,(,首行缩进、悬挂缩进、左缩进、右缩进,),段间距和段内行距,使用编号和项目符号,段落,添加边框和底,纹,首字下,沉,或悬挂,段落与分页的关系,设置段落的格式,Demo2,控制段落的缩进,段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示,左缩进标记,首行缩进标记,右缩进标记,右缩进,左缩进,首行缩进,正文区,右边界,正文区,左边界,悬挂缩进,标记,页面格式的设置:,设置纸张大小和页边距,设置每页的行、列数目,设置分栏数目与格式,设置页码,设置页眉和页脚,设置页面的格式,设置页面的分栏,“所见即所得”(,操作效果屏幕立即可见,打印结果与屏幕所见完全相同),撤销,(undo),和恢复,(redo),操作,格式刷,多种视图,(,大纲视图与大纲编辑,),自动更正、自动套用格式、自动编号、自动图文集,自动保存功能和自动备份功能,样式、模板和向导,(wizard),功能,宏操作(,Macro,),提高,Word,操作效率的若干措施,文本处理初步,使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理,文本处理内容:,字数统计,词频统计,简,/,繁体相互转换,汉字,/,拼音相互转换,词语排序,词语错误检测,文句语法检查,自动分词,词性标注,词义辨识,大陆,/,台湾术语转换,关键词提取,文摘自动生成,文本分类,文本检索(关键词检索、全文检索),文本过滤,文语转换(语音合成),文种转换(机器翻译),篇章理解,自动问答,自动写作等,文本压缩,文本加密,文本著作权保护,什么是文本处理,?,例:,Word 2003,的文本处理功能,英文拼写检查和,英语同义词检查,字数统计,自动编写摘要,中文简繁体转换和术语转换,中英词语翻译,语法和格式检查,语音识别(口授命令和听写),文档保护,(,防止打开或修改文档,),5.1.5,文本的展现,(,输出,),文本的展现,(,输出,),目的:阅读、浏览或打印文本,使用的软件:文本阅读器,/,文本浏览器,嵌入在文本编辑,(,处理,),软件中,如微软的,Word,,,独立的软件:如,Adobe,公司的,Acrobat Reader,,,微软公司的,IE,等,文本展现的过程:,对文本的格式描述进行解释,生成文字和图表的映像(,bitmap,),传送到显示器或打印机输出,附:输出过程中字形的生成,过程:,先根据字符的字体确定相应的字库(,font,),,再按照该字符的代码从字库中取出该字符的形状描述信息,然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换,最后将变换得到的字形放置在页面的指定位置处,2,种不同的字库:,点阵描述,轮廓描述,轮廓点,直线,二次曲线,5.2,图像与图形,5.2.,1,数字图像的获取,5.,2,.2,图像的表示与压缩编码,5.2.,3,数字图像处理与应用,5.2.4,计算机图形,5.2.,1,数字图像的获取,图像的获取过程,扫 描,模拟图像,取 样,取 样,取 样,数,字,图,像,分 色,量 化,量 化,量 化,从现实世界中获得数字图像的过程称为图像的“获取”,常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等,图像获取过程:,将画面划分为,M N,个网格,每个网格称为 一个取样点,将彩色图像取样点的颜色分解成,R,,,G,,,B,三个基色,测量每个取样点的每个分量(基色)的亮度值,对取样点每个分量的亮度值进行,A/D,转换,使用数字整型量表示,5.2.2,图像的表示与压缩编码,数字,(,取样,),图像的组成,数字取样图像由,M(,列,) N(,行,),个取样点组成,取样点是组成数字取样图像的基本单位,称为“像素”,彩色图像的像素通常由,3,个彩色分量组成,灰度图像和黑白图像的像素只包含,1,个亮度分量,Red,分量,Green,分量,Blue,分量,像素,黑白图象的表示,黑白图像,黑白图像的每个像素只有一个分量,且只用,1,个二进位表示,其取值仅“,0”(,黑,),和“,1”(,白,),两种,例,1,:灰度图象的表示,灰度图像,灰度图像的每个像素也只有一个分量,一般用,8,12,个二进位表示,其取值范围是:,0,2,n,-1,,可表示,2,n,个不同的亮度,例,2,:彩色图象的表示,蓝色分量,绿色分量,红色分量,彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设,3,个分量分别用,n,m,k,个二进位表示,则可表示,2,n+m+k,种不同的颜色,数字,(,取样,),图像的主要参数,图像大小(图像分辨率):,用来表示组成该图像的行列数目,亦即图像所包含的像素数目,使用,水平分辨率,x,垂直分辨率,表示,对图像清晰度和在屏幕上显示出来的大小有影响,颜色空间的类型,指彩色图像所使用的颜色描述方法,如:,RGB(,红、绿、蓝,),模型,显示器使用,CMYK(,青、品红、黄、黑,),模型,彩色打印机使用,HSB(,色彩、饱和度、亮度,),模型,用户界面中使用,YUV(,亮度、色度,),模型,彩色电视信号传输时使用,像素深度,即像素的所有颜色分量的二进位数目之和,图像类型,像素的组成,像素深度,(,位数,),颜色空间,单色图像,黑白图像,仅,1,个分量,1,位,不使用,灰度图像,仅,1,个分量,2,12,位,不使用,彩色图像,彩色图像,3,个分量以上,8,36,位,RGB,,,CMY,,,YUV,等,举例:分辨率与图像尺寸的关系,520x376,260x188,130x94,在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比,数字图像的数据量,数字图像数据量的计算公式(以字节为单位):,数据量,=,水平分辨率,垂直分辨率,像素深度,8,几种常用格式的图像的数据量:,图像大小,8,位,(256,色,),16,位,(6536,色,),24,位,(,真彩色,),640480,300 KB,600 KB,900 KB,1024768,768 KB,1.5 MB,2.25 MB,12801024,1.25 MB,2.5 MB,3.75 MB,例:数字图像传输时间的计算,假设数据传输速率为,56 kb/s,(电话上网),则传输一幅分辨率为,640480,的,6.5,万种颜色的未压缩图像的最小时间为:,(640x480x16)/56000 = 87.8,秒,数字图像的数据压缩,图像数据压缩的必要性:,节省存储数字图像所需要的存储器容量,提高图像的传输速度,减少通信费用,图像数据压缩的可能性:,数字图像中有大量的数据冗余,人眼视觉有局限性,允许图像有一些失真,数字图像的数据压缩,图像数据压缩的两种类型:,无损压缩:用压缩后的数据还原出来的图像没有任何误差,有损压缩:用压缩后的数据还原出来的图像有一定的误差,压缩编码方法的评价,压缩倍数的高低(压缩比大小),重建图像的质量(有损压缩时),压缩算法的复杂程度,数字,图像的常用文件,格式,不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用,常用的图像文件格式有:,名称,压缩编码方法,性质,典型应用,开发公司,(,组织,),BMP,RLE(,行程长度编码,),无损,Windows,应用程序,Microsoft,TIF,RLE,LZW(,字典编码,),无损,桌面出版,Aldus,,,Microsoft,GIF,LZW,无损,因特网,CompuServe,JPEG,DCT(,离散余弦变换,),,,Huffman,编码,大多数为有损,因特网,数码相机等,ISO/IEC,JP2,小波变换,算术编码,无损,/,有损,因特网,数码相机等,ISO/IEC,图像文件,格式例,1,:,BMP,格式,BMP,图像格式是,Windows,操作系统下使用的一种标准图像格式,支持单色、,16,色、,256,色、真彩色图像,一个文件一幅图像,可以进行无损压缩,也可不压缩,非压缩的,BMP,文件是一种通用的图像文件格式,几乎所有,Windows,应用软件都能支持,图像文件,格式例,2,:,GIF 图像,颜色数目不超过,256,色 ,适合用作插图、剪贴画等色彩数要求不高的场合,,文件特别小,,适合网络传输,GIF,图像格式具有,累进显示,功能,适合网络浏览器观看,GIF,图像格式能,支持,透明背景,(,JPEG,不支持),GIF,图像格式能,支持,动画,透明背景,图像文件,格式例,3,:,JPEG,图像,JPEG,是静止图像数据压缩编码的国际标准,采用,JPEG,标准的图像文件扩展名是,.jpg,JPEG,特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用,JPEG,的最新标准是,JPEG2000,(图像文件扩展名是,.jp2,),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用,5.2.3,数字图像处理与应用,数字图象处理:目的与内容,目的,:,(1),提高图像的视觉质量,(2),恢复,与重建有失真和畸变的图像,(3),图像分析,包括:图像的分类、识别和理解等,(4),图像数据的变换、编码和数据压缩,(5),图像的存储、管理与检索,(6),图像内容与知识产权的保护,内容,:,去噪、增强、复原、分割、提取特征、压缩、存储、检索等,数字图像处理的应用,(1),图像通信,包括图像传输、电视电话、电视会议等。,(2),遥感,(3),医疗诊断,(4),工业生产中的应用,如产品质量检测,生产过程自动控制等,(5),机器人视觉,(6),军事、公安、档案管理等其他方面的应用,X,光图像,CT,图像,核磁共振图像,指纹图像,常用的图像编辑软件,Word,和,PowerPoint,具基本的图像编辑功能,Windows,附件中的“画图”软件,微软,Office,工具中的,Picture Manager,ACD System,公司的,ACDSee32,Adobe,PhotoShop,5.2.4,计算机图形,什么是计算机图形,(graphics),通过计算机和软件对景物的结构、形状与外貌进行描述,(,称为“建模”,),,然后根据该描述和选定的观察位置及光线状况,生成该景物的图形,(,称为“绘制”或“图像合成”,),计算机图形也称为计算机合成图像,计算机制作图形的步骤如下:,建模,/,造型,(Modeling),景物的,模型,(model),景物,的视图,绘 制,(Rendering),(Image Synthesis),景物的,2,种描述,(,建模,),方法,几何造型技术,规则形体,(,如工业产品,),用基本的几何元素,(,如点、线、面、体等,),及材料的表面性质等进行描述,过程模型技术,不规则形体,(,如自然现象,),找出其生成规律,并使用相应的算法来描述,计算机图形的绘制过程,从景物模型绘制出图形的过程,实际上也是把景物的描述,(,模型,),转换成为点阵,(,像素阵列,),的过程,它包括下列步骤:,将各个物体的所有表面用小的多边形(三角形或四边形)进行近似表示,用户选择一个观测位置,并设定一个取景范围,将景物向成像平面作透视投影;然后将景物中不在取景范围内的部分裁剪掉,同时还把景物中所有被遮挡而看不见的部分隐去,根据景物表面材料的性质和环境光源的设定,计算出物体可见面上每一点,(,像素,),的颜色及其亮度,计算出物体所产生的本影和半影;根据景物表面和背景使用的材料,选择合适的纹理映射到物体的表面,美国康乃尔大学,Suzanne Smits,和,Priamos,Georgiades,建模并绘制的俄罗斯茶壶,例,1:,俄罗斯茶壶,例,2,:计算机绘制的钢笔画和铅笔画,木 桶,玻璃瓶,引用自:,Georges,Winkenbach,D.Salesin,(Univ.of Washington),pp.469-476,SIGGRAPH96,显卡在绘制过程中起重要作用!,图形绘制过程中,每个像素的颜色及其亮度都要经过大量计算才能得到,因此绘制过程的计算量很大,特别是三维图形和动画,目前,PC,机所配置的显卡(图形卡)上安装了功能很强的专用绘图处理器,(GPU),,它承担了绘制过程中的大部分计算任务,S-Video,接口,DVI,接口,VGA,接口,绘图处理器,显示卡,计算机图形的应用,(1),计算机辅助设计和辅助制造,(CAD,CAM),。,(2),利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。,(3),作战指挥和军事训练。,(4),计算机动画和计算机艺术。,(5),其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。,矢量绘图软件,专业绘图软件:,AutoCAD,、,PROTEL,和,CAXA,电子图板(机械、建筑等),MAPInfo,、,ARCInfo,、,SuperMap,GIS,(地图、地理信息系统),办公与事务处理、平面设计、电子出版等使用的绘图软件:,Corel,公司的,CorelDraw,,,Adobe,公司的,Illustrator,,,Macromedia,公司的,FreeHand,,,微软公司的,Microsoft Visio,等,MS Office,中内嵌的绘图软件:,Word,和,PowerPoint,中的绘图功能(简单的二维图形 ),小结:图像与图形的比较,计算机中的“图”按其生成方法可以分为,两,大类:,通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(,image,),通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(,graphics,);,两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理,图 像,图 形,5.3,数字声音及应用,5.3.1,波形声音的获取与播放,5.3.2,波形声音的表示与应用,5.3.3,波形声音的编辑,5.3.4,计算机合成声音,5.3.1,波形声音的获取与播放,声音的特性,和类型,声音由振动产生,通过空气传播,声音是一种波,它由许多不同频率的谐波组成,谐波的频率范围称为声音的“带宽”,计算机处理的声音类型:,话音或语音,(speech),,专指人的说话声音,带宽仅为,300,3400Hz,全频带声音,(,如音乐声、风雨声、汽车声等,),,其带宽可达到,20Hz,20kHz,人耳可听到的声音统称“可听声”,,,20Hz,20kHz,数字波形声音的获取,步骤:,2.,量化,(,quantization,,模数转换,),3.,编码,(,encoding,),1.,取样(,sampling,),取 样,模拟声音信号,取样的目的是把时间上连续的信号转换成时间上离散的信号,量 化,量化是把每个样本从模拟量转换成为数字量,(8,位或,16,位整数表示,),数字声音,01100011001,编 码,将所有样本的二进制代码组织在一起,并进行数据压缩,数字波形声音的获取设备,声音的联机获取设备,(,声卡,),声波转换为电信号,声音的脱机获取设备:数码录音笔,麦克风,(,microphone,),声音卡,(,sound card,),模拟声音,数字声音,取样、量化和编码,声音的重建与播放,计算机输出声音分为两步:,1,声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成,2,声音播放:将模拟声音信号经处理和放大后送到音箱,(,扬声器,),关于音箱:,普通音箱,接收的是重建的模拟声音信号,数字音箱,直接接收数字声音信号,失真更小,数字声音,011010011101,插 值,数模转换,解 码,把压缩编码的数字声音恢复为压缩编码前的状态,把声音样本从数字量转换为模拟量,把时间上离散的一组样本转换成在时间上连续的模拟声音信号,重建的模拟 声音信号,声卡的功能与逻辑组成,波形声音的获取与编码,波形声音的重建与播放,MIDI,消息的输入,MIDI,音乐的合成,DSP,DMA,接口,PC,总线,取样,量化,D/A,重建,滤波,声音输出,声音输入,音乐合成器,mixer,MIDI,接口,声卡的主要功能,选讲:,声卡的物理实现,声卡主要由,2,块芯片组成:,主处理芯片:包括数字信号处理器、,MIDI,控制、,I/O,控制等,CODEC,芯片:负责多声道取样、,A/D,与,D/A,转换、混音处理等,音频,主芯片,音频混合芯片,运 算,放大器,功 率,放大器,MIDI/,joystick,MIC,输入,/,线路输入,P C I,总 线,线路输出,扬声器,Audio CODEC,芯片,当前,PC,机的声卡大多已不再做成独立的插卡形式,而是与主板集成在一起,称为集成声卡,2,种音频技术规范:,- AC97,音频技术规范,- HD Audio,5.3.2,波形声音的表示与,应用,数字波形声音的表示及其参数,数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“,.wav”,数字波形声音的主要参数有:,取样频率:,语音的取样频率低,一般为,8k 16k Hz,全频带声音,(,如音乐,),取样频率高,一般为,44.1k 48k Hz,量化位数:通常为,8,位、,12,位或,16,位,声道数目:单声道为,1,,双声道为,2,码率,(,比特率,),,每秒钟的数据量,数字波形声音码率的计算,未压缩时数字波形声音的码率计算公式,码率,=,取样频率,量化位数,声道数,例:,声音类型,声音信号带宽,(Hz),取样频率,(kHz),量化位数,(bits),声道数,未压缩时的,码率,数字语音,300,3 400,8,8,1,64 kb/s,CD,立体声,20,20 000,44.1,16,2,1411.2(kb/s),压缩编码之后数字波形声音的码率为:,压缩后的码率,=,未压缩时的码率,/,压缩倍数,例:上面,CD,唱片的立体声音乐压缩为,MP3,后,若压缩倍数是,12,倍,则该,MP3,音乐的码率是:,118 kb/s,左右,数字波形声音的数据压缩,数据压缩的必要性:,为了降低存储成本和提高在网络上的传输效率,数据压缩的可能性:,声音中包含有大量冗余信息;,人耳灵敏度有限,允许有一定失真而不易察觉,数字波形声音压缩编码的方法:,全频带声音:国际标准,MPEG,;工业标准,Dolby AC-3,数字语音:固定电话使用,ADPCM,编码,手机使用高效率的混合编码技术,所谓“,MP3,音乐”,它是一种采用,MPEG-1,层,3,编码的高质量数字声音,压缩比大约,10,12,倍,使一张普通,CD,光盘上可以存储大约,100,首,MP3,歌曲,可连续播放,10,小时。,MP3,播放器的结构与原理,程序,存储器,闪烁,存储器,液晶显示,D/A,转换,嵌入式处理器,及,DSP,声音输出,控制按键,USB,接口,嵌入式处理器用于运行控制程序,控制各个部件协调工作:它接收控制按键的操作命令,从闪烁存储器读取,MP3,音乐数据送到,DSP,去解码;显示播放器的工作状态;负责与主机连接并交换数据等等,数字信号处理器,DSP,完成,MP3,数据流的解码操作,并输出波形格式的数字音频信号,经数模转换和功率放大之后,用户即可听到声音,存放,MP3,音乐数据,容量越大,可存放的歌曲数目就越多,固定存放,MP3,播放器的控制程序,显示,MP3,播放器的工作状态和歌曲的歌词,波形声音的文件类型及其应用,文件类型,开发者,编码类型,效果,主要应用,WAV,微软公司,未压缩,声音达到,CD,品质,支持多种采样频率和量化位数,获得广泛支持,FLAC,Xiph.Org,基金会,无损压缩,压缩比为,2:1,左右,高品质数字音乐,APE,Matthew T. Ashland,无损压缩,压缩比为,2:1,左右,高品质数字音乐,M4A,苹果公司,无损压缩,压缩比为,2:1,左右,QuickTime, iTunes, iPod,,,Real Player,MP3,ISO,有损压缩,MPEG-1 audio,层,3,压缩比为,8:1,12:1,因特网,,MP3,音乐,WMA,微软公司,有损压缩,压缩比高于,MP3,使用数字版权保护,因特网,音乐,AC3,、,AAC,美国,Dolby,公司,有损压缩,压缩比可调,支持,5.1,、,7.1,声道,DVD,数字电视,家庭影院等,什么是流媒体?,在因特网上收听,(,看,),音,(,视,),频节目的,2,种方式:,下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待很长时间,并需要较大的存储容量),流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后,就可以开始一边播放一边下载,等待时间短、存储需求小),流媒体,就是一种允许在网络上让用户一边下载一边收看,(,听,),音视频媒体的,媒体分发,(delivery),技术,目前流行的主要有,3,个公司的流媒体技术:,Real Networks,公司的,Real Media,(,RealAudio,和,RealVideo,),微软公司的,Windows Media Services,(WMA,、,WMV,和,ASF),苹果公司的,Quick Time,5.3.3,波形声音的,编辑,波形声音编辑软件的功能,主要功能:,1,编辑声音:如声音剪辑、复制、调节音量,2,声音的效果处理:如混响、回声、淡入、淡出等,3,录音,4,声音的格式转换,5,播放声音,数字声音,的参数,左声道,信号波形,右声道,信号波形,淡入,淡出,时间刻度,播放标尺,声音编辑软件的,典型用户界面,5.3.4,计算机合成声音,什么是计算机合成声音?,计算机合成声音就是计算机模仿人说话或演奏音乐,计算机合成声音有两类:,计算机合成话音(语音):,计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为,TTS,),应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等,计算机合成音乐:,计算机模拟各种乐器发声并按照乐谱演奏音乐,应用:计算机作曲、配器等,例:计算机合成的语音,Hello,,,everybody,(,1,),你好,我是贝尔实验室的中文语音合成系统,(,BellTTS1,),南京大学计算机系,2002,年招收了,202,名本科生,,22,名博士生,,130,多名硕士生。,(中科大讯飞公司),(,Bell,),安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件,(讯飞),我们都是同行,我们一路同行,去参加人参培植研讨会,(讯飞),(,Bell,),计算机合成音乐(,MIDI,),音乐,合成器,音乐,MIDI,文件,媒体,播放器,MIDI,消息,计算机合成音乐需要三个要素:乐器、乐谱和“演奏员”,声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照,MIDI,消息合成出不同音色和音调的音符,通过扬声器播放出音乐来,乐谱在计算机中使用一种叫做,MIDI,的音乐描述语言来表示。使用,MIDI,描述的音乐称为,MIDI,音乐。一首乐曲对应一个,MIDI,文件,其文件扩展名为,.MID,或,.MIDI,媒体播放器软件相当于“演奏员”。播放,MIDI,音乐时,它先从磁盘上读入,.MID,文件,解释其内容,然后以,MIDI,消息的形式向声卡上的音乐合成器发出各种指令,选讲:,音乐合成器,PC,机声卡一般都带有,MIDI,音源(音乐合成器),MIDI,音源有两种:,调频合成器,(一种受控的电子振荡器)。音色单调,效果较差,已很少使用,波表合成器,。音色丰富,效果很好,可扩展,现广泛使用,波表合成器的原理,预先将真实乐器演奏的各个音符的波形数字化,把它们组织成一个个波表文件存放在存储器中,播放时合成器软件根据乐器类型和音符参数等将相应的波形数据修饰成所要求的音强和时长,然后合成、加工后播放,低通滤波,采样、量化,加工处理,乐器演奏,波表,文件,录音,例:计算机合成的,MIDI,音乐,例,1,音乐之声,(,6KB,),例,2,军港之夜,(,7KB,),MIDI,的优点:,数据量极小(比,CD,立体声少,3,个数量级,比,MP3,少,3,个数量级),易于制作和编辑修改,可以与波形声音同时播放,MIDI,的不足:,只能合成音乐,不能合成歌曲和语言,音质与硬件设备相关,小结:计算机中的数字声音,数字声音的特点:,是一种连续媒体,传输与播放有实时性要求,数据量大,对存储和传输的要求比较高,必须进行压缩,数字声音的类型:,取样(波形)声音,数字语音:应用于电话、手机、多媒体配音等,全频带声音:,CD,和,DVD,音乐,数字电视伴音等,计算机合成声音,合成语音,合成音乐(,MIDI,),5.4,数字视频及应用,5.4.1,数字视频基础,5.4.2,数字视频的压缩编码,5.4.3,数字视频的编辑,5.4.4,合成视频,计算机动画,5.4.5,数字视频的应用,5.4.1,数字视频基础,彩色电视信号的发送与接收,彩色电视信号的发送与接收:,PAL,制彩色电视信号的颜色不使用,RGB,表示,而是使用亮度信号,Y,和两个色度信号,U,、,V,来表示,为进行远距离传输必须进行调制,R,G,B,RGB,YUV,复合,调制,摄像机 话筒,发射天线,RGB,YUV,分路,解调,接收天线,R,G,B,将,Y,、,U,、,V,信号转换成为,R,、,G,、,B,信号,然后再进行显示,使用,Y,、,U,,,V,彩色空间的原因:,与黑白电视保持兼容,利用人的视觉特性来节省电视信号的带宽和发射功率,数字视频信号的获取,视频信号的数字化过程,:,与图像、声音的数字化过程相仿,但更复杂一些,(8-10 bits),滤波,取样,量化,编码,数字视频信息,模拟视频信号,V,U,YUV,Y,数字视频的获取设备:,视频采集卡,(,简称视频卡,),数字摄像头,通过光学镜头和,CCD,或,CMOS,采集动态图像,转换成数字信号并输入,PC,机,脱机获取设备:数码摄像机,视频,捕获,(,采集,),卡,的功能,从多种视频源中选择一种作为视频输入,;,支持不同的电视制式,;,能同时处理图像信号的伴音,;,显示器上可监看输入的视频信号,位置及大小可调,;,能将计算机生成的图像,/,图形,/,文本与视频图像迭加处理,;,可随时冻结,(,定格,),一幅画面,并按指定格式保存,;,可 实时压缩与存储视频及其伴音信息,;,可 实时解压缩并播放视频及其伴音信息,输出设备可选,(VGA,监视器、电视机、录相机等,),视频卡、显卡与主机,的关系,视频,捕获器,视频,缓冲器,叠加,/,转换器,TV,编码器,图形,控制器,显示,存储器,内存,CPU,DSP,处理器,PCI,总线,视频信号,显示器,TV,机,硬盘,硬 盘,(主机),视频信号数字化并存入硬盘,在屏幕上监看视频信号,计算机图形文字输出,在电脑上播放视频,在电视机上播放视频,视频卡,显示卡,数字摄像头,分辨率为,352288,640480,速度一般在,30fps,(,每秒,30,帧)左右,镜头的视角可达到,45-60,度,支持,USB,接口 或,IEEE1394,(火线)接口,成像器件采用,CMOS,或,CCD,数码摄像机,提供,480,线以上的分辨率,清晰度高,自动对焦,自动曝光,使用,MPEG-2,进行压缩编码,然后记录在硬盘上,具有录音功能,数据量很大,采用,USB,接口或,IEEE1394,接口,5.4.2,数字视频,的压缩编码,数字视频的压缩编码,视频数据压缩的必要性:,数字视频的数据量大得惊人,,1,分钟的数字电视图像未压缩时其数据量可超过,1GB,,对存储、传输和处理都有很大的困难,视频数据压缩的可能性:,视频信息的每个画面内部有很多信息冗余,相邻画面的内容有高度的连贯性,人眼的视觉灵敏度有限,允许画面有一定失真,结论:,数字视频的数据量可压缩几十倍甚至几百倍,数字视频的三类编码标准,ITU-T,国际标准:,H.261(Px64),标准、,H.263,标准等,ISO/IEC,国际标准:,MPEG-1,标准,,MPEG-2,标准(等同于,ITU-T H.262,),,用于低分辨率、低码率视频应用的,MPEG-4 ASP,,,代表当前技术水准的,MPEG-4 AVC,视频编码标准(等同于,ITU-T H.264,),在,HDTV,、蓝光盘、,XBOX,、,iPod,、,iPhone,等众多领域得到推广应用。,公司标准:,Intel,公司的,IndeoVideo,,苹果公司在,QuickTime,中使用过的,Cinepak,,,Real Network,公司的,RealVideo,,微软公司的,WMV,,,Adobe,公司,Flash,播放器中使用的,VP6,等,目前流行的数字视频编码标准,名 称,图像格式,压缩后的码率,主要应用,MPEG-1,360,288,大约,1.2 Mb/s 1.5Mb/s,适用于,VCD,、数码相机、数字摄像机等,H.261,360,288,或,180,144,Px64 kb/s (P=1,、,2,时,只支持,180,144,格式,,P6,时,可支持,360,288,格式,),应用于视频通信,如可视电话、会议电视等,MPEG-2 (MPML),720,576,5 Mb/s 15Mb/s,用途最广,如,DVD,、卫星电视直播、数字有线电视等,MPEG-2,高清格式,1440,1152,1920,1152,8
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!