最新03计算机内信息的数字化表示

上传人:沈*** 文档编号:242635164 上传时间:2024-08-30 格式:PPT 页数:42 大小:874KB
返回 下载 相关 举报
最新03计算机内信息的数字化表示_第1页
第1页 / 共42页
最新03计算机内信息的数字化表示_第2页
第2页 / 共42页
最新03计算机内信息的数字化表示_第3页
第3页 / 共42页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,03计算机内信息的数字化表示,文字信息的数字表示,计算机也要处理大量文字信息,文字信息是由字符所组成,例如:英语中的,26,个字母,汉字等等。,这些字符数据要被计算机处理,就需要转换成数字信息,方法就是给每个字符编一个代码,并用二进制数字表示。,例如:,A,用,0100 0001,表示。,1,、,ASCII,编码,765,4321,000,001,010,011,100,101,110,111,0000,NUL,DLE,SP,0,P,p,0001,SOH,DC1,!,1,A,Q,a,q,0010,STX,DC2,”,2,B,R,b,r,0011,ETX,DC3,#,3,C,S,c,s,0100,EOT,DC4,$,4,D,T,d,t,0101,ENQ,NAK,%,5,E,U,e,u,0110,ACK,SYN,&,6,F,V,f,v,1,、,ASCII,编码,765,4321,000,001,010,011,100,101,110,111,0111,BEL,ETB,7,G,W,g,w,1000,BS,CAN,(,8,H,X,h,x,1001,HT,EM,),9,I,Y,i,y,1010,LF,SUB,*,:,J,Z,j,z,1011,VT,ESC,+,;,K,k,1100,FF,FS,,,N,n,1111,SI,VS,/,?,O,o,DEL,扩展,ASCII,编码,(,EASCII,),对,ASCII,编码进行扩充,把一些特殊符号编码到,128-255,,称为扩展,ASCII,编码。,字节最高位为,1,。,ISO/IEC 646,ISO/IEC 646,是国际标准化组织,(ISO),和国际电工委员会,(IEC)1972,年制订的标准。,它来自数个国家标准,最主要来自美国的,ASCII,也是采用,7,位二进制数表示一个字符的编码,ISO646,除了英语字母和数字部分各个国家都相同外,有些字母可按照实际需要,把,ISO646,进行修改,以定出该国的字符标准,所以有些,ASCII,中的字符没有包含在这些国家的,ISO646,标准中。,ISO8859,系列,ISO8859,,全称,ISO/IEC 8859,,是国际标准化组织(,ISO,)及国际电工委员会(,IEC,)联合制定的一系列,8,位字符集的标准,。,可看作为不同的文字中的,EASCII,,它使用,128-255,的区域为不同文字定义了这种文字常用字符的编码,。,包括:,ISO8859-1,定义了西欧语言的字符,,ISO8859-2,是中欧语言,,ISO8859-3,是南欧语言,,ISO8859-4,是北欧语言,,ISO8859-5,是斯拉夫语,,ISO8859-6,是阿拉伯语等,16,个标准。,0-127,的编码与,ASCII,相同。,ISO8859,系列,以上文字的编码方案主要是针对文字符号较少的语言,使用一个字节就可以为所有的文字符号进行编码,称为单字节编码方案,能够编码的字符的个数也基本限制在,128,个或,256,个之内,它们却没有办法将文字符号较多的语言进行编码,,为了提供更多的编码空间,各个国家和地区开始使用两个字节作为本地字符的编码,为自己国家和地区的语言文字设计编码,例如:中文简体字符的,GB2312,,中文繁体的,BIG5,,日文的,JIS,等方案。,2,、中文编码,计算机里处理汉字,也要对汉字进行编码。,汉字内码,汉字输入码,汉字字形码,2,、中文编码,汉字内码:,区位码:,1980,年,我国为,6763,个汉字和,682,个符号规定了编码,把它们分成,94,个区,每区可包含,94,个字符,每个字符的代码由,2,个字节组成,第一个字节指明它所在的区号,第二个字节指明它所在的区的位置号,称为区位码。,例如:啊 在,16,区第一位,则区位码为:,1001H,2,、中文编码,汉字内码:,国标码:是国家标准(,GB2312-80,)所规定的汉字的编码,实际是把区位码的区码和位码分别加上,20H,。,例如:啊 在,16,区第一位,则区位码为:,1001H,,国标码则是:,3021H,。,2,、中文编码,汉字内码:,机内码(,GB,内码):是把国标码的高字节和低字节的最高位分别设置为,1,,相当于每个字节加上,80H,,主要是为了和,ASCII,码区分开。,例如:啊 在,16,区第一位,则区位码为:,1001H,,国标码则是:,3021H,,机器内码就是:,B0A1H,。,2,、中文编码,Big5,,又称为大五码,是使用繁体中文社区中最常用的计算机汉字内码标准,共收录,13060,个汉字,,Big5,码普及于台湾、香港与澳门等繁体中文通行区。,Big5,码也是采用两个字节表示一个汉字或符号的编码。,2,、中文编码,采用的编码方案与,GB2312,不同,同一个字符编码在,GB2312,中和,Big5,中表示的汉字是不同的,。,比如:“王子”两个字的,GB,内码是,0CDF5H,和,0D7D3H,,但是这两个编码在,Big5,中表示的汉字分别是“卼赽”,所以使用,GB,内码保存的文件如果在使用,Big5,码的环境中打开,会看到乱的汉字,称为乱码。,使用,GB,内码和,Big5,码的字符就无法共存与一个文件中。,2,、中文编码,汉字内码,:,1993,的国际标准化组织公布了,ISO/IEC10646,,,通用多八位编码字符集,UCS(Universal Code Set),,它是包括汉字在内的各种正在使用的文字的统一编码方案,共包括,128,个组,每组包括,256,个平面,每平面包括,256,行,每行包括,256,个字位。,每个字符占用,4,个字节,最高位为,0,。每个字节分别表示组号、平面号、行号和字位号。,这种方案也称为,UCS-4,编码,2,、中文编码,汉字内码,:,UCS,的第,0,组第,0,号平面称为,BMP,(基本多文种平面),它用来存放全世界主要的文字和符号,用行号和字位号表示字符编码,也称为,Unicode,编码,被广泛使用。,每个字符占用,2,个字节,,也称为,Unicode,编码或,UCS-2,编码,。,2,、中文编码,UCS,和,Unicode,字符的机内码采用几种变换格式(,Transformation Format,)来表示,包括:,UTF-8,、,UTF-16,和,UTF-32,等三种。,UTF-32,采用的就是,UCS-4,的编码,一个字符固定使用,4,个字节来编码,是定长的编码。比如:大写字母,A,的编码就是十六进制数“,00000041,”。,UTF-16,使用,2,或,4,个字节进行编码。,比如:大写字母,A,的,UTF-16,编码就是十六进制数“,0041,”,而字符编码,U+64321,的,UTF-16,编码就是十六进制数“,D950DF21,”。,2,、中文编码,UTF-8,是一种针对,UCS,字符的可变长度字符编码。,它使用,1,到,6,个字节为字符编码,可以用来表示,UCS,中的任何字符,,而且其编码中的单字节字符仍与,ASCII,兼容,这使得原来处理,ASCII,字符的软件无需或只需做少部份修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。互联网工程工作小组(,IETF,)要求所有互联网协议都必须支持,UTF-8,编码。互联网邮件联盟(,IMC,)建议所有电子邮件软件都支持,UTF-8,编码。,2,、中文编码,全国信息技术化技术委员会于,1995,年,12,月,1,日发布汉字内码扩展规范。,GBK,向下与,GB2312,完全兼容,向上支持,ISO 10646,国际标准,。,GBK,亦采用双字节表示,总体编码范围为,8140-FEFE,之间,。,GBK,共收入,21886,个汉字和图形符号,包括:,GB2312,中的全部汉字、非汉字符号,,BIG5,中的全部汉字,与,ISO 10646,相应的国家标准,GB13000,中的其它,CJK,汉字,以上合计,20902,个汉字,其它汉字、部首、符号,共计,984,个。,2,、中文编码,GB 18030,,全称:国家标准,GB18030-2005,信息技术中文编码字符集,是中华人民共和国现时最新的内码字集,是,GB18030-2000,的修订版。,它与,GB 2312-1980,完全兼容,与,GBK,基本兼容,支持,GB 13000,及,Unicode,的全部统一汉字,共收录汉字,70244,个。,GB18030,采用多字节编码,每个字可以由,1,个、,2,个或,4,个字节组成,支持中国国内少数民族的文字,收录范围包含繁体汉字以及日韩汉字。,GB18030,是中国所有非手持,/,嵌入式计算机系统的强制实施标准。,2,、中文编码,汉字输入码,:,一组按键,用于输入汉字。,数字编码,(,区位码),字音编码(全拼,双拼),字形编码(五笔),形音编码,2,、中文编码,汉字字型码,:,点阵式字形,矢量式字形,汉字的输出(字库),汉字的输出(字库),汉字点阵类型,点阵,占用字节数,简易型,16,16,32,普及型,24,24,提高型,32,32,精密型,48,48,72,128,288,矢量式字形,将汉字看作由笔画组成的图形,抽取汉字每个笔画的特征坐标值,这些坐标组合起来就得到这个汉字的矢量信息。,对缩放字体大小很方便,并且字体不易变形。,每个汉字笔画不同,抽取的矢量信息大小也不相同。,曲线轮廓字形,曲线轮廓字形是以二次曲线或三次曲线逼近字形轮廓的字形描述方法,常用的轮廓字形描述技术包括,Postscript,和,TrueType,两大类。,PostScript,字体由,Adobe,公司为专业数字排版开发。它使用,PostScript,,字形以,3,次贝兹曲线描述,因此一组字型可以通过简单的数学变形放大或缩小。,TrueType,是由,Apple,公司和,Microsoft,公司联合提出的一种新型数学字形描述技术。,TrueType,采用几何学中二次贝塞尔曲线及直线来描述字体的外形轮廓,。,OpenType,字体,OpenType,字体是为了实现,Windows,和,Macintosh,系统兼容,由美国微软公司与,Adobe,公司联合开发,用来替代,TrueType,字型的新字型。,它在继承了,TrueType,格式的基础上增加了对,PostScript,字型数据的支持,所以,OpenType,的字形数据既可以采用,TrueType,的字形描述方式,也可以采用,PostScript,的字型描述方式。同一个,OpenType,字体文件可以用于,Mac OS,Windows,和,Linux,系统,这种跨平台的字库非常方便于用户的使用。,Microsoft,从,Windows 2000,系统开始兼容,OpenType,字库。,OpenType,字体,ClearType,,,是,微软在,Windows,中提供的屏幕亚像素微调字体平滑技术,让,Windows,字体更加漂亮。,ClearType,主要是针对,LCD,液晶显示器设计,可提高文字的清晰度。基本原理是,将显示器的,R, G, B,各个次像素也发光,让其色调进行微妙调整,可以达到实际分辨率以上(横方向分辨率的三倍)的纤细文字的显示效果。,在,Windows XP,平台上,这项技术默认是关闭,到了,IE7,才默认打开。依靠,ClearType,技术提高字体的可读性,相当程度上依赖于使用的字体,微软在,Windows Vista,里,新发布了两个支持,ClearType,的中文字库:微软雅黑和微软正黑体。,Windows7,也对,ClearType,提供默认支持。,2,、中文编码,字符代码化(输入),机内码,输入码向机内码转换,机内码向字形码转换机,显示输出,打印输出,3,、,BCD,编码,用二进制数表示,10,进制数的一种编码方法,用,4,位二进制数表示一位,10,进制数,常见的编码是,8421,码,用,0000,到,1001,表示十进制数的,0,到,9,。,例如:十进制数,128,表示为:,0001 0010 1000,4,、图像编码,位图法:(,BMP,,,JPG,,,GIF,,,TIFF,),矢量图形:(,WMF,,,DXF,,,MGX,等),4,、图像编码,一般图像的数字化会采用位图模式,在这种模式下一幅彩色图像,(image),可以看成是由许许多多个彩色的点,(,像素,),组成的,每个点有深浅不同的颜色。如果将每个点的颜色用二进制数字表示出来,就可以将图像数字化。,例如:如果将一幅图像水平方向上划分出,800,个点,垂直方向上划分出,600,个点,则此图像总共由,48,万个像素点组成,每个像素点有一种颜色。,4,、图像编码,对于每个像素点的颜色,采用几位二进制数字保存会直接决定每个像素点能够显示多少种颜色。,如果使用一位二进制数字表示一个点的颜色,则只能使用,0,或,1,表示两种颜色;如果使用,8,位二进制数字表示一个点的颜色,则每个点的颜色值可以由二进制数字,00000000,到,11111111,中一个数字表示,每个点可以有,2,8,个颜色值,即,256,色;如果使用,16,位二进制数字表示一个点的颜色,则每个点可以表示的颜色个数会是,2,16,,即,65536,(,64K,)种颜色;在使用,24,位二进制数字表示一个像素点的颜色时,颜色个数可以达到,2,24,,约,16.7M,种颜色,这时,人眼已经不能分辨出数字图像的失真,所以我们也把,24,位以上的颜色称之为真彩色。用多少位二进制数字表示一个点的颜色,也称为图像的色彩深度。,4,、声音编码,对声波进行采样,形成声音数据。,采样频率(,11KHz,,,44.1KHz,),声音数据位数(,8,位,,16,位,,64,位),5,、多媒体编码,视频信息(真实影像的记录),AVI,,,ASF,,,MPEG,等,动画(人工创造的影像),AVI,,,MPG,等,结束语,谢谢大家聆听!,42,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!