资源描述
,*,单击此处添加标题,*,单击此处添加标题,第二章 信息的表示与输入输出,主讲教师:王 斌,计算机与通信工程学院 计算机应用技术系,非数值数据:,英文字符,、,汉字,、,图形图像,、,声音,和,视频,等。,计算机只能直接识别,二进制信息,,必须将上述,信息表示成,计算机可识别的信息,。,2.2,非数值数据的表示与输入输出,计算机如何表示各种非数值数据,编码,:,以某种,要素,,按照某种,规则,进行,排列,,不同的排列代表不同的信息。,例如:,0-,男,,1-,女,再如,:000-,星期一,001-,星期二,010-,星期三,011-,星期四,100-,星期五,101-,星期六,110-,星期日,例如:,日常生活中编码的例子,学号、车牌号、电话号码等等,编 码,理解,0,和,1,计算机中的信息如何表示?,-,来自,易经,的启示!,八卦中的,“,一,”,叫做阳爻,(,yo,),,相当于二进制中的,“,1,”,,,八卦中的,“,-,”,叫做阴爻,相当于二进制中的,“,0,”,。,易经,记录“易有太极,始生两仪,两仪生四象,四象生八卦”,乾,天,坤,地,坎,水,震,雷,艮,(gn),山,巽,(xn),风,离,火,兑,沼泽,111 000 001 110 010 101 100 011,三位二进制码表八卦,六位二进制码表六十四卦,乾,坤,屯,蒙,需,讼,师,比,111111 000000 010001 100010 010111 111010 000010 010000,易经与二进制,解决方案,:,采用二进制编码,。以,少量的二进制位,,通过一定,的组合规则,表示出大量复杂多样,的非数值数据信息。,非数值数据的表示,英文字符编码,BCD,码,汉字编码,多媒体信息的表示与输入输出,(,图形图像、声音、视频),目前广泛使用的是由美国国家标准委员会制定的,ASCII,码,(,American National Standards Code for Information Interchange,)。,编码方法:用,7,位二进制表示一个字符,:,b,6,b,5,b,4,b,3,b,2,b,l,b,0,,共,128,个字符。,10,个数字,0,9,52,个英文大、小写字母,A,Z,,,a,z,34,个常用符号,、,#,等,32,个控制字符,NUL,、,LF,、,CR,等,一、英文字符编码,ASCII,码,南理工紫金学院,ASCII,字符编码表,000,001,010,011,100,101,110,111,0000,NUL,DEL,SP,0,P,p,0001,SOH,DC,1,!,1,A,Q,a,q,0010,STX,DC,2,2,B,R,b,r,0011,ETX,DC,3,#,3,C,S,c,s,0100,EOT,DC,4,$,4,D,T,d,t,0101,ENQ,NAK,%,5,E,U,e,u,0110,ACK,SYN,&,6,F,V,f,v,0111,BEL,ETB,7,G,W,g,w,1000,BS,CAN,(,8,H,X,h,x,1001,HT,EM,),9,I,Y,i,y,1010,LF,SUB,*,:,J,Z,j,z,1011,VT,ESC,+,;,K,k,1100,FF,FS,N,n,1111,SI,US,/,?,O,_,o,DEL,b,6,b,5,b,4,b,3,b,2,b,1,b,0,由于,字节是计算机中的基本处理单位,,因此通常,用一个字节表示一个字符:,b,7,b,6,b,5,b,4,b,3,b,2,b,l,b,0,。,每个字节中多余的一位(最左边一位)保持为,“,0,”,。,ASCII,码是,一种,单字节,字符,编码方案;,在计算机,中,每,一个,字符的二进制编码是,唯一,的,;,字符编码没有正负和大小之分,,仅仅是代号而已。,一、英文字符编码,ASCII,码,由于人们日常使用的是,十进制,,而机器内使用的是,二进制,,所以,需要将十进制表示成二进制码。其中,,BCD,码(,Binary Coded Decimal,)比较常用。,BCD,码有多种编码方式,常用的是,8421,有权码。它将十进制数码,0,9,中的每个数分别用,4,位二进制编码表示。,二、十进制数的二进制编码,BCD,码,十进制,0 1 2 3 4,BCD,码,0000 0001 0010 0011 0100,十进制,5 6 7 8 9,BCD,码,0101 0110 0111 1000 1001,为什么用,4,位二进制数表示?,同一信息不同编码方式的,对比,245,的十进制记为,245,的二进制记为,245,的八进制记为,245,的十六进制记为,245,的,BCD,码记为,245,的,ASCII,码记为,245,11110101,365O,F5H,0010,0100,0101,00110010,00110100,00110101,要在计算机中处理汉字,必须解决以下几个问题:,1,、,首先是汉字的输入,即如何把结构复杂的方块汉字输入到计算机中去,这是汉字处理的关键;,2,、汉字在计算机内如何表示和存储?如何与西文兼容?,3,、如何将汉字的处理结果从计算机内输出?,三、汉字编码,1,、汉字输入码,类型,原理,举例,优点,缺点,数字,编码,使用一串数字来表示汉字,电报码,区位码,仅使用,10,个数字键,难记忆,字音,编码,把汉语的拼音作为汉字的输入编码,智能,ABC,紫光,微软拼音输入,简单易学,适合于非专业人员,重码多,需增加选择操作,不会汉语拼音或不知道读音时无法使用,字形,编码,把汉字的部件或笔画作为码元,按照汉字结构及其切分规则作为编码依据,确定每个汉字的输入代码,五笔字形,表形码,郑码,重码少、输入速度较快,适合专业录入员、打字员使用,缺乏统一的规范,编码规则不易掌握,音形,编码,(,或形音编码,),采用字音及字形两种属性作为码元的汉字编码输入方法,粤音输入法,同上,同时要掌握音、形两种取码方法或规则,对普通用户比较困难,2,、汉字国标码,汉字交换码:用于,不同汉字系统间交换汉字信息,,具有统一的标准。,1980,年国家标准总局公布了,信息交换用汉字编码字符集,,即,GB2312,80,,简称,国标码,。该标准共收集,7445,个汉字和图形符号。国标码规定每个汉字、图形符号都用,两个字节,表示,每个字节只使用最低七位。两个字节的,最高位均为,0,。,1995,年公布了,GBK1.0,,扩展到,2.1,万多个汉字。,2000,年公布了,正式标准,GB18030,,扩展到,2.7,万多个汉字。,3,、汉字机内码,用于汉字信息的,存储、处理,等操作的机内代码,一般采用,两个字节,表示。,机内码在编码时必须考虑到既能,与,ASCII,码严格区分,,又与,国标,GB2312,80,汉字字符集,有简单的对应关系,。,b,7,b,6,b,5,b,4,b,3,b,2,b,1,b,0,b,7,b,6,b,5,b,4,b,3,b,2,b,1,b,0,0,0 1 1 0 1 0 0,0,1 1 1 0 1 1 1,国标码,1,0 1 1 0 1 0 0,1,1 1 1 0 1 1 1,(,机,),内码,4,、汉字字形码,是汉字笔画构成的图形编码,用于记录汉字的外形,主要,用于汉字的显示和打印,。,有两种记录方法:,点阵法,和,矢量法,,分别对应,点阵码,和,矢量码,。,4,、汉字字形码,(1),点阵码,用,点阵来表示汉字,。如,16,16,点阵(,多用于显示,)、,24,24,点阵、,32,32,点阵,,48,48,点阵、,64,64,点阵、,128,128,点阵等(,多用于打印,),。,例:,16,16,的汉字字形点阵,每个汉字要占用,32,个字节,。,汉字,的显示和打印是通过汉字系统的输出,处理程序根据,内码从汉字库找到对应的汉字点阵后进行输出。,4,、汉字字形码,(2),矢量码,将汉字的形状、笔划、字根等用数学函数进行描述的方法。矢量码记录的字体称为,矢量字体,或,轮廓字体,。现在在,Windows,里普遍使用轮廓字体(称为,True Type,字体),如宋体、,Times New Roman,、,Arial,等。这样的字形信息便于缩放和变换,并且字形美观。,记录:,端点和,各控制点坐标和它们的关系,5,、汉字处理过程,“大,”,计算机内部,由外到内,由内到外,da,1,0 1 1 0 1 0 0,1,1 1 1 0 1 1 1,oooooo,11,oooooooo,oooooo,11,oooooooo,oooooo,11,oooooooo,oooooo,11,ooooo,1,oo,1111111111111111,oooooo,11,oooooooo,oooooo,11,oooooooo,ooooo,o11,oooooooo,oooooo,11,oooooooo,oooooo,111,ooooooo,ooooo,11,oo,1,oooooo,oooo,11,oooo,1,ooooo,ooo,11,ooooo,11,oooo,ooo,1,ooooooo,11,ooo,oo,1,ooooooooo,111,o,11,ooooooooooo,1,oo,5,、汉字处理过程,计算机内部,由外到内,由内到外,自动转换,字节最高位置,“,1,”,转换(调用汉字字库,),媒体,(Media),:是人与人之间实现信息交流的中介,简单的说,就是信息的载体,也称为媒介。,多媒体,(Multimedia),:就是多重媒体,是直接作用于人感官的文字、图形、图像、动画、声音和视频等各种媒体的统称,即多种信息载体的表现形式和传递方式。,四、多媒体信息的表示与输入输出,1,、多媒体信息的处理过程,采集,压缩,存储,解压缩,显示,对多媒体信息进行编码,无损压缩与有损压缩,还原压缩后的多媒体信息,2,、数据压缩与解压缩,压缩,解压缩,有损压缩,声音、,图像、电影,文本、通信,无损压缩,001001,101001,010101,001001,压缩后的数据,00000011111110,11010101010101,01010110101010,11101000000111,11110010100101,10100101010101,01010101011000,11101001001001,10100101010010,原始数据,?,3,、图形图像信息处理,两种形式:,位图图像,和,矢量图形,位图图像,也,称为点阵,图像,在,计算机中的一幅位图图像可以理解为一个矩阵,该矩阵由若干个排列成行、列的点构成,这些点被称为,像素,。,图像的信息化,就是对每个像素用若干个二进制数码进行编码。,(1),位图图像,图像由基本显示单元“像素”构成,图像像点,8bit (2,8,=256,色,),16bit (2,16,=65536,色,),24bit (2,24,=16M,色,),8,位图像,16,位图像,24,位图像,像,素,由若干个二进制位进行描述,二进制位代表图像颜色的数量,(1),位图图像,图像分辨率,:是指图像的水平方向和垂直方向的像素个数。,一般来说,分辨率愈高,图像愈细腻,图像文件也越大。由于一幅位图的分辨率是确定的,所以对其进行放大时,会出现马赛克现象。,(2),矢量图形,指用计算机绘制的画面,由若干特定点的位置和相关数学公式计算动态画出的图形。,(3),位图图像和矢量图形的放大比较,位图图像和矢量图形的比较,图像,图形,占用存储空间,大,小,表现内容,细节较多,复杂的现实物体。,细节相对较少,抽象,/,现实物体。,放大,/,缩小,将丢失其中的细节,并会呈现锯齿状,放大不会失真,颜色数,丰富,过渡均匀,较少。,构成,像素构成、分辨率固定,指令描述,文件扩展名,.,bmp .gif .tif .jpg,等,.dwg .dxf .wmf,等,主要应用举例,照片,/GIF,动画,/,网页,/,各种流程图、示意图,/Flash,动画,(5),图形图像格式,常见的位图图像格式,图形图像格式,常
展开阅读全文