计算机中的文字表达方式.pptx

上传人:zhu****ei 文档编号:3589358 上传时间:2019-12-18 格式:PPTX 页数:11 大小:230.51KB
返回 下载 相关 举报
计算机中的文字表达方式.pptx_第1页
第1页 / 共11页
计算机中的文字表达方式.pptx_第2页
第2页 / 共11页
计算机中的文字表达方式.pptx_第3页
第3页 / 共11页
点击查看更多>>
资源描述
计算机中的文字表达方式,1.ASCII码2.GB2312编码3.Big5编码4.Unicode编码5.输入编码6.字型码,一.文字表达方式的种类1.ASCII码,ASCII(AmericanStandardCodeforInformationInterchange,美国信息互换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码2010年12月8日叫基础ASCII码,使用7位二进制数来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。ASC11码编码的编码规则是在下表中确定的,它是一种约定顺序编码,每个字符在ASC11码表中的顺序号成为字符的ASC值,它有两种形式,一种包含128个字符,另一种包含256个字符。包括128个字符的ASC码表,ASC值范围是0127,计算机中使用7个二进制位就可以表示,因此称为7位二进制码。包含256个字符的ASC码表,在7位码表的基础上,增加了对128个字符的支持。国际上7位ASC码有广泛的支持,对8位ASC11值支持程度较弱,尤其在中文环境下因为同汉字的存储编码相冲突,8位ASC11码值不被支持。在7位ASC11码值中,字符总体上分为两大类:控制字符和可显示字符。控制字符用于显示、打印、警告或传输过程和解释,在频幕上不显示,其ASC11值得范围是031及127。可显示字符则同英文中出现的各种字母和个符号相对应,涵盖了英文所需要的所有文字符号,其ASC11值范围是32126,可细分为以下几大类:英文字符,ASC11值范围是3247、5864、9196及123126;数字字符,ASC11值是4857;大写英文字母,ASC11值是6590;小写英文字母,ASC11值范围是97122.,2.GB2312编码,GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为信息交换用汉字编码字符集基本集,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB2312。GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。ASC11码值得出现有效的解决了西文文字的信息化问题,但对于汉字字符却完全不适用,为了满足国内在计算机中使用文字的需要,中国国家标准总局发布了一系列的汉字字符集国家标准编码,统称为GB码或国标码,其中最有影响的是与1980年发布的信息交换用汉字编码字符集基本集,标准号为GB2312-1980.因其使用非常普遍,也常被统称为国标码.GB2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字符组成,其中汉字根据使用的频率可分为两级。一级汉字3755个,二级汉字3008个。由于字符数量比较大,GB2312采用了二维矩阵编码法对所有字符进行编码。首先构造一个94列的方阵,对每一行成为一个“区”,每一列称为一个“位”,然后将所有字符依照下表的规律填写在方阵中。这样所有的字符在方阵中都有一个唯一的位置,这个位置可以用区号、位号合成表示,称为字符的区位码。因为区位码同字符的位置是完全对应的,因此区位码同字符之间也是一一对应的。,3.Big5编码,“大五码”(Big5)是在1984年由台湾13家厂商与台湾地区财团法人信息工业策进会为五大中文套装软件所设计的中文内码,所以就称为Big5中文内码,虽然五大套装软件并没有成功,但Big5码却深远地影响中文电脑内码,直至今日。“五大码”的英文名称“Big5”后来被人按英文字序译回中文,以致现在有“五大码”和“大五码”两个中文名称。大五码是一种繁体中文汉字字符集,其中繁体汉字13053个,808个标点符号,希腊字母及特殊符号。大五码的编码码表直接针对存储而设计、每个字符统一使用两个字节存储表示。第一字节范围81HFEH,避开了同ASCII码的冲突,第二字节范围是40H7EH和A1HFEH,在同一正文不能对两种字符集的字符同时支持。,Big5编码的字符编码分布表,4.Unicode编码,Unicode字符集可以简写为UCS(UnicodeCharacterSet)。早期的Unicode标准有UCS-2、UCS-4的说法。UCS-2用两个字节编码,UCS-4用4个字节编码。UCS-4根据最高位为0的最高字节分成27=128个group。每个group再根据次高字节分为256个平面(plane)。每Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0 x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。,UCS是一种字符集编码法,主要用于计算机程序和操作系统内部。在存储和传输中,往往不直接使用UCS编码而是通过一定的转换程序来实现。这些转换编码最通用的是utf8和utf16.由于大量使用的ASC11码字符兼容所提出的UCS的一种实现就是utf8.utf8就是采用变长字节表示一个字符,尽管有节约存储和传输资源的好处,但也同时导致软件实现有困难。平面根据第3个字节分为256行(row),每行有256个码位(cell)。group0的平面0被称作BMP(BasicMultilingualPlane)。将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。,五输入编码,世界上使用汉字的人口约占世界总人口的四分之一,因此研究和发展汉字输入编码是一项非常急迫的任务。中国是汉字的发源国,汉字应用已有数千年历史。一九八七年中国研究汉字输入编码的人员已近四百人,不论在深度和广度上,都走在世界前列。汉字从形编码利用人们已有的汉字书写知识,在键盘上象写字一样打入笔画和字根,从计算机内选出汉字,既直接又方便。从音编码是以一九五八年二月十一日全国人大批准公布的汉语拼音方案为基本编码元素。汉语拼音是以北京语音为标准音,以北方语为基础方言,以典范的白话文著作为语法规范的普通话。自推广普通话以来,已有相当数量的人掌握了汉语拼音,以此为基础作汉字输入编码,为这部分人所乐于接受。但中国各地方言复杂,不少人还难以做到准确认读汉字,因此容易出现差错。,6.字型码,汉字字型码又称字字模,用于汉字在显示屏或打印机输出。汉字字型码通常有两种表示方式:点阵和矢量表示方法。用点阵表示字型时,汉字字型码指的是这个汉字字型点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16*16点阵,提高型汉字为24*24点阵,32*32点阵,48*48点阵等等。点阵规模愈大,字型愈清晰美观,所占存储空间也愈大矢量表示方式存储的是描述汉字字型的轮廓特征,当要输出汉字时,通过计算机的计算,由汉字字型描述生成所需大小和形状的汉字点阵。矢量化字型描述与最终文字显示的大小,分辨率无关,因此可以产生高质量的汉字输出。Windows中使用的TrueType技术就是汉字的矢量表示方式。,二.文字输入到显示流程,将字符写入一个MN的空白方格中,对表格中每个方格用一个比特(Bit)来表示,字符通过的方格用“1”表示,未通过的方格用“0”来表示,这样将每个方格的值按照从左到右,从上到下的顺序写下来,就形成了字符的点阵字型码。显示汉字时,则执行相反的过程,对于点阵字形为“0”的比特,在频幕中像素显示为背景色,而为“1”的比特,则显示为前景色。根据点阵编码时使用的表格大小,常用的汉字点阵字库一般分为16点阵、24点阵、32点阵等格式。每个汉字码占(MN)/8个字节数。点阵字型码显示汉字的熟读很快,但在进行放大时由于使用字块填充,会出现明显的锯齿边缘。因此点阵字库一边不用于图形环境,常用在字符操作界面中。,1.点阵编码法,文字输入到显示流程,2.矢量编码法,文字字符的字形信息都是由多个笔画子图形组成的,适量编码发将组成的字符每一笔画用一组直线勾勒,然后按一定顺序对各笔画一体组适量来表示.显示汉字是,首先从矢量库中检索字型码。矢量编码法所占存储空间的字节数不是固定的,取决于字符本身的复杂度,一般来讲,所含笔画越多,笔画越复杂的字符,字型码所占空间越大。矢量字符在显示时,需要进行大量的矢量计算,耗费时间要长一些。但矢量字形方法是以几何方法精确勾画轮廓的,因此具有无级缩放的优点。目前,矢量字形广泛应用在各种图形用户界面的系统以及文本的打印输出环境。,计算机中的文字表达方式,完,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!