第5章5[1][1]1 文本与文本处理

上传人:hjk****65 文档编号:204173662 上传时间:2023-04-26 格式:PPT 页数:67 大小:1.86MB
返回 下载 相关 举报
第5章5[1][1]1 文本与文本处理_第1页
第1页 / 共67页
第5章5[1][1]1 文本与文本处理_第2页
第2页 / 共67页
第5章5[1][1]1 文本与文本处理_第3页
第3页 / 共67页
点击查看更多>>
资源描述
专转本计算机基础辅导专转本计算机基础辅导 第第5章章数字媒体及应用数字媒体及应用5.1文本与文本处理文本与文本处理5.2图像与图形图像与图形5.3数字声音及应用数字声音及应用5.4数字视频及应用数字视频及应用专转本计算机基础辅导专转本计算机基础辅导 本章考题题型分布本章考题题型分布年年份份单选单选多选多选填空填空判断判断小计小计2005年年112152006年年313292007年年411392008年年511292009年年511292010年年51129专转本计算机基础辅导专转本计算机基础辅导 5.1文本与文本处理文本与文本处理5.1.1字符的编码字符的编码5.1.2文本准备文本准备5.1.3文本的分类文本的分类5.1.4文本编辑、排版与处理文本编辑、排版与处理5.1.5文本的展现文本的展现专转本计算机基础辅导专转本计算机基础辅导 文字处理是计算机应用的基础文字处理是计算机应用的基础计算机应用使用计算机进行信息处理计算机应用使用计算机进行信息处理其中,其中,文字信息处理是涉及面最广的一种文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有计算机应用,几乎与任何领域任何人都有关。关。文字文字数值数值语言语言音乐音乐图像图像信息的形态有多种信息的形态有多种专转本计算机基础辅导专转本计算机基础辅导 写作写作编辑编辑排版排版印刷印刷发行发行写作写作传统的文字处理过程传统的文字处理过程专转本计算机基础辅导专转本计算机基础辅导 计算机文字处理过程计算机文字处理过程文字信息在计算机中称为文字信息在计算机中称为“文本文本”(text),文本是),文本是计算机中最常用的一种数字媒体计算机中最常用的一种数字媒体文本由一系列文本由一系列“字符字符”(character)组成,每个字)组成,每个字符均使用二进制编码表示符均使用二进制编码表示文本在计算机中的处理过程是:文本在计算机中的处理过程是:(文本编辑器文本编辑器)文本编辑文本编辑与排版与排版格式化的格式化的电子文本电子文本(2)文本文本展现展现(文本阅读器文本阅读器)(5)文本处理文本处理(文本处理软件文本处理软件)(3)文本准备文本准备电子文电子文本本(1)(文字与图表文字与图表 的输入的输入)文本存储文本存储与传输与传输(4)(存档存档/通信软件通信软件)专转本计算机基础辅导专转本计算机基础辅导 5.1.1.字符在计算机中的表示字符在计算机中的表示专转本计算机基础辅导专转本计算机基础辅导 字符、字符集及其编码表字符、字符集及其编码表文字的基本元素是字母和符号,统称为文字的基本元素是字母和符号,统称为“字符字符”(character),它包括:字母、数字、标点、,它包括:字母、数字、标点、符号等符号等字符集:一组特定字符的集合字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等中文字符集、西文字符集、日文字符集等字符的编码:字符的编码:字符集中每个字符的二进位表示,称为该字符的编码字符集中每个字符的二进位表示,称为该字符的编码或代码或代码(code)不同的字符其编码各不相同不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的字符集中所有字符的编码的一览表,称为该字符集的码表码表专转本计算机基础辅导专转本计算机基础辅导 一、西文字符的编码一、西文字符的编码ASCII码码西文是表音文字西文是表音文字(拼音文字拼音文字),它由拉丁字母、数字、,它由拉丁字母、数字、标点符号以及一些特殊符号所组成标点符号以及一些特殊符号所组成美国标准信息交换码美国标准信息交换码(ASCII码码):ASCII字符集包含字符集包含96个可打印字符和个可打印字符和32个控制字符个控制字符采用采用7个二进位进行编码个二进位进行编码计算机中使用计算机中使用1个字节存储个字节存储1个个ASCII字符字符存在问题:存在问题:字符集太小(只有字符集太小(只有128个字符)个字符)不同国家和地区使用不同的字符集及其编码,互不兼容不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码东亚地区使用的大字符集无法编码0X X X X X X X专转本计算机基础辅导专转本计算机基础辅导 一级汉字一级汉字(3755个)个)二级汉字二级汉字(3008个)个)(扩充使用)(扩充使用)字母、数字和各种符号字母、数字和各种符号19423位号位号191655568794区区号号(按汉语拼音排列按汉语拼音排列)(按偏旁部首排列按偏旁部首排列)GB2312汉字编码字符集汉字编码字符集1980年颁布年颁布信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集(我(我国第一个国家标准)国第一个国家标准)GB2312-1980GB2312字符集由三个部分构成:字符集由三个部分构成:拉丁字母、俄文、拉丁字母、俄文、日文平假名与片日文平假名与片假名、希腊字母、假名、希腊字母、汉语拼音等共汉语拼音等共682个个共共6763个汉字和个汉字和682个符号,个符号,每个每个汉字和符号都有一汉字和符号都有一个确定位置个确定位置专转本计算机基础辅导专转本计算机基础辅导 区位码:区位码:GB2312国标字符集构成一个二维平面,它国标字符集构成一个二维平面,它分成分成94行、行、94列列,行号称为,行号称为区号区号,列号称为,列号称为位号位号。问题:问题:文本中的汉字与西文字符易与单字节的标准文本中的汉字与西文字符易与单字节的标准ASCII码混淆不清。码混淆不清。例如:例如:“大大”字的字的区号区号20,位号位号83,区位码是,区位码是2083,用,用2个字节表示为:个字节表示为:0001010001010011(1453H)。)。解决方法:解决方法:把一个汉字看作两个扩展把一个汉字看作两个扩展ASCII码,即每个码,即每个汉字的区号和位号必须分别加上汉字的区号和位号必须分别加上32(即(即00100000),且),且使表示使表示GB2312汉字的两个字节的最高位汉字的两个字节的最高位(b7)都等于都等于“1”。11第第1字节字节第第2字节字节X X X X X X XX X X X X X X这种高位为这种高位为l的双字节(的双字节(16位)汉字编码就称为位)汉字编码就称为GB2312汉字的汉字的“机内码机内码”,又称,又称内码内码。例如:例如:“大大”字的内码是:字的内码是:1011010011110011(B4F3)。)。专转本计算机基础辅导专转本计算机基础辅导 汉字的区位码、国标码、机内码的关系:汉字的区位码、国标码、机内码的关系:国标码国标码=区位码区位码+2020H机内码机内码=国标码国标码+8080H机内码机内码=区位码区位码+A0A0H汉字机内码双字节,最高位是汉字机内码双字节,最高位是1;西文字符机内码单字节,最高位是西文字符机内码单字节,最高位是0。专转本计算机基础辅导专转本计算机基础辅导 GBK汉字汉字内码扩充规范内码扩充规范GB2312的不足:的不足:汉字字数太少,缺少繁体字汉字字数太少,缺少繁体字,无法满足无法满足人名、地名、古籍人名、地名、古籍整理、古典文献研究整理、古典文献研究等应用的需要;与等应用的需要;与ASCII码不兼容码不兼容GBK汉字汉字内码扩充规范(内码扩充规范(1995):):在在GB2312基础上,增加了基础上,增加了1万多汉字万多汉字(包括繁体字包括繁体字)和符号和符号共有共有21003个汉字和个汉字和883个图形符号,如个图形符号,如“計計算算機機”、冃冃、冄冄、円円、冇冇等繁体字和生僻字等繁体字和生僻字与与GB8312保持向下兼容,也使用双字节表示,第保持向下兼容,也使用双字节表示,第1字节最字节最高位必须为高位必须为“1”:1 X第第1字节字节第第2字节字节X X X X X X XX X X X X X X专转本计算机基础辅导专转本计算机基础辅导 UCS/Unicode多文种大字符集多文种大字符集背景:为了实现全球数以千计的不同语言文字的统一编码背景:为了实现全球数以千计的不同语言文字的统一编码方案:方案:ISO将全球所有文字字母和符号集中在一个字符集中将全球所有文字字母和符号集中在一个字符集中进行统一编码进行统一编码(目前共收集了目前共收集了17x2161,114,112个个),称为,称为UCS/UnicodeUCS/Unicode的编码方案:的编码方案:先实现部分字符的编码(共先实现部分字符的编码(共107,361个字符)个字符)尽量与已有编码标准兼容尽量与已有编码标准兼容其中包含有中、日、韩统一整理出来的近其中包含有中、日、韩统一整理出来的近3万汉字(万汉字(CJK汉字)汉字)允许有若干不同的编码方案允许有若干不同的编码方案,例如:例如:单字节:单字节:ASCII字符字符双字节:拉丁、希腊、阿拉伯,双字节:拉丁、希腊、阿拉伯,三字节:三字节:CJK汉字汉字四字节:其他四字节:其他Unicode:UTF-8单字节可变长编码单字节可变长编码应用:应用:Linux,Web网页,电子邮件网页,电子邮件双字节:双字节:ASCII字符、拉丁、希腊、字符、拉丁、希腊、阿阿拉伯,常用拉伯,常用CJK汉字,汉字,四字节:非常用四字节:非常用CJK汉字汉字Unicode:UTF-16双字节可变长编码双字节可变长编码应用:应用:Windows,Mac,Java,专转本计算机基础辅导专转本计算机基础辅导 GB18030汉字编码标准汉字编码标准背景:无论是背景:无论是Unicode的的UTF-8还是还是UTF-16,其,其CJK汉字汉字字符集虽然覆盖了我国已使用多年的字符集虽然覆盖了我国已使用多年的GB2312和和GBK标准标准中的汉字,但它们的中的汉字,但它们的编码并不相同编码并不相同为了既能与为了既能与UCS/Unicode编码标准接轨,又能保护我国已编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在有的大量汉字信息资源,我国在2000年和年和2005年两次发布年两次发布GB18030汉字编码国家标准汉字编码国家标准。GB18030实质上是实质上是UCS/Unicode字符集的另一种编码方案:字符集的另一种编码方案:单字节编码(单字节编码(128个)表示个)表示ASCII字符字符双字节编码(双字节编码(23940个)表示汉字,与个)表示汉字,与GBK(以及(以及GB2312)保持向下)保持向下兼容,兼容,GBK不再使用不再使用四字节编码(约四字节编码(约158万个)用于表示万个)用于表示UCS/Unicode中的其他字符中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。目前已在我国信息处理产品中强制贯彻执行。专转本计算机基础辅导专转本计算机基础辅导 标准名标准名称称GB2312GBKGB18030UCS-2(Unicode)字符集字符集6763个汉字个汉字(简体字简体字)21003个汉字个汉字(包括(包括GB2312汉字在内)汉字在内)近近3万汉字万汉字(包括包括GBK汉汉字和字和CJK及其及其扩充中的汉字扩充中的汉字)包含包含10万多字符,万多字符,其中的汉字与其中的汉字与GB18030相同相同编码方编码方法法双字节存储和双字节存储和表示,每个字表示,每个字节的最高位均节的最高位均为为“1”双字节存储和双字节存储和表示,第表示,第1个字个字节的最高位必节的最高位必为为“1”部分双字节、部分双字节、部分部分4字节表字节表示,双字节表示,双字节表示方案与示方案与GBK相同相同(1)UTF-8采采用单字节可变长编用单字节可变长编码码(2)UTF-16采用采用双字节可变长编码双字节可变长编码兼容性兼容性编码编码不兼容!不兼容!小结:几种汉字编码的对比小结:几种汉字编码的对比编码保持向下兼容编码保持向下兼容专转本计算机基础辅导专转本计算机基础辅导 例例:IE浏览网页时文字编码的选择浏览网页时文字编码的选择专转本计算机基础辅导专转本计算机基础辅导 5.1.2.文本准备文本准备文稿如何输入计算机文稿如何输入计算机专转本计算机基础辅导专转本计算机基础辅导 文字符号输入计算机的方法文字符号输入计算机的方法键盘输入键盘输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入(1)数字编码数字编码,如电报码、区位码等如电报码、区位码等,(2)字音编码字音编码,如智能如智能ABC等等(3)字形编码,如五笔字形和表形码等字形编码,如五笔字形和表形码等,(4)形音编码形音编码发发展展趋趋势势:基基于于统统计计和和学学习习功功能能的的以以词词语语(短短语语)或或句句子子作作为为输输入入单单位的输入方法位的输入方法专转本计算机基础辅导专转本计算机基础辅导 文字符号输入计算机的方法文字符号输入计算机的方法键盘输入键盘输入联机手写输入联机手写输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入优点:优点:自然,流畅自然,流畅小型化,适合移动计算小型化,适合移动计算不足:不足:识别速度和正确性还需提高识别速度和正确性还需提高书写要求还要降低书写要求还要降低专转本计算机基础辅导专转本计算机基础辅导 文字符号输入计算机的方法文字符号输入计算机的方法键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入优点:优点:自然,方便,适合移动计算自然,方便,适合移动计算不足:不足:对说话人、说话方式、说话内容的对说话人、说话方式、说话内容的适应能力要大适应能力要大大增强大增强识别速度和正确性还需大大提高识别速度和正确性还需大大提高专转本计算机基础辅导专转本计算机基础辅导 文字符号输入计算机的方法文字符号输入计算机的方法印刷体识别印刷体识别键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入扫描仪扫描仪OCR数字数字文本文本纸介质纸介质文本文本文本的文本的映象映象(image)识别率已达到率已达到98%功能功能:简、繁体字、繁体字混合识别混合识别中文、西文混合识别中文、西文混合识别文字、表格混合识别文字、表格混合识别智能校对功能智能校对功能专转本计算机基础辅导专转本计算机基础辅导 文字符号输入计算机的方法文字符号输入计算机的方法印刷体识别印刷体识别手写体识别手写体识别键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入技术上非常困难,还无法实用技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别目前准备先突破工整的楷书手写体的识别!专转本计算机基础辅导专转本计算机基础辅导 汉字的键盘输入汉字的键盘输入汉字与键盘上的键无法一一对应,因此必汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉须使用几个键来表示一个汉字,这就称为汉字的字的“键盘输入编码键盘输入编码”优秀的汉字键盘输入编码应具有的特点:优秀的汉字键盘输入编码应具有的特点:易学习、易记忆易学习、易记忆效率高效率高(平均击键次数较少平均击键次数较少)重码少重码少容量大容量大(可输入的汉字字数多可输入的汉字字数多)专转本计算机基础辅导专转本计算机基础辅导 汉字键盘输入方法的比较汉字键盘输入方法的比较类型类型原理原理举例举例优点优点缺点缺点数字数字编码编码使用一串数字来表示使用一串数字来表示汉字汉字电报码电报码区位码区位码仅使用仅使用10个数个数字键字键难记忆难记忆字音字音编码编码把汉语的拼音作为汉把汉语的拼音作为汉字的输入编码字的输入编码智能智能ABC紫光紫光微软拼音输入微软拼音输入简单易学,适简单易学,适合于非专业人合于非专业人员员重码多,需增加选择重码多,需增加选择操作,不会汉语拼音操作,不会汉语拼音或不知道读音时无法或不知道读音时无法使用使用字形字形编码编码把汉字的部件或笔画把汉字的部件或笔画作为码元,按照汉字作为码元,按照汉字结构及其切分规则作结构及其切分规则作为编码依据,确定每为编码依据,确定每个汉字的输入代码个汉字的输入代码五笔字形五笔字形表形码表形码郑码郑码重码少、输入重码少、输入速度较快,适速度较快,适合于专业录入合于专业录入员、打字员使员、打字员使用用缺乏统一的规范,编缺乏统一的规范,编码规则不易掌握码规则不易掌握音形音形编码编码(或形音或形音编码编码)采用字音及字形两种采用字音及字形两种属性作为码元的汉字属性作为码元的汉字编码输入方法编码输入方法粤音输入法粤音输入法同上同上同时要掌握音、形两同时要掌握音、形两种取码方法或规则,种取码方法或规则,对普通用户比较困难对普通用户比较困难专转本计算机基础辅导专转本计算机基础辅导 5.1.3文本的分类文本的分类专转本计算机基础辅导专转本计算机基础辅导 简单文本简单文本(纯文本纯文本)本本书书由由南南京京大大学学出出B1BECAE9D3C9C4CFBEA9B4F3D1A7B3F6版版社社(PublishingB0E6C9E7285075626C697368696E67HouseofNanjin20486F757365206F66204E616E6A696EgUniversity)出出版版 6720556E697665727369747929B3F6B0E6文文本本的的内内容容文文本本在在计计算算机机中中的的表表示示没有字体、字号的变化,不能插入图片、表格,也不能建立超没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是链接,其文件后缀名是.txt由一串用于表达正文内容的字符编码所组成,几乎不包含任何由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息其他的格式信息和结构信息举例:举例:专转本计算机基础辅导专转本计算机基础辅导 丰富格式文本丰富格式文本本书由南京大学出版社本书由南京大学出版社(Publishing House of Nanjing University)出版出版有字体字号等属性变化、设置了段落和页面排版格式的文本称为有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格丰富格式文本式文本”丰富格式文本中,除了正文内容之外,还使用了许多丰富格式文本中,除了正文内容之外,还使用了许多“标记标记”来描述字符来描述字符的属性和格式的设置。的属性和格式的设置。举例:下面标题的格式为:中文用黑体,西文用举例:下面标题的格式为:中文用黑体,西文用ArialBlack体,居中体,居中使用使用HTML语言描述为:语言描述为:本书由南京大学出版社本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版出版用一对用一对指出的是标记,如指出的是标记,如和和等,用于说明排版的格式和文字属等,用于说明排版的格式和文字属性,它们不属于正文内容性,它们不属于正文内容正文内容正文内容专转本计算机基础辅导专转本计算机基础辅导 超文本超文本若干文本或文本中的各个部分可按照其内容的若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成关系互相链接起来,从而形成“超文本超文本”ABCDEFGHa1a2b2c2f1d1c1b1e1g1h1a3“超链超链”实际上就是实际上就是一个指针,用于指向一个指针,用于指向其他文本块,也可以其他文本块,也可以指向同一文本块中的指向同一文本块中的其他部分其他部分 超链是有向的,起点位置超链是有向的,起点位置称为链源,它可以是文本称为链源,它可以是文本块中的一个标题、一句句块中的一个标题、一句句子、一个关键词、一幅画、子、一个关键词、一幅画、一个图标等一个图标等文本块可以是一个文本块可以是一个网页,一个文档,网页,一个文档,一段文字,也可以一段文字,也可以是一张图片,甚至是一张图片,甚至一段声音或视频一段声音或视频 专转本计算机基础辅导专转本计算机基础辅导 小结:文本的分类小结:文本的分类文本文本类型类型特点特点在计算机内的表示在计算机内的表示文件文件扩展名扩展名用途用途简单简单文本文本没有字体、字号和没有字体、字号和版面格式的变化,版面格式的变化,文本在页面上逐行文本在页面上逐行排列,也不含图片排列,也不含图片和表格和表格由一连串与正文内容对由一连串与正文内容对应的字符的编码所组成,应的字符的编码所组成,几乎不包含任何其他的几乎不包含任何其他的格式信息和结构信息格式信息和结构信息.txt网上聊天网上聊天短信短信文字录入文字录入OCR输输入入丰富丰富格式格式文本文本(线性线性文本文本)有字体、字号、颜有字体、字号、颜色等变化,文本在色等变化,文本在页面上可以自由定页面上可以自由定位和布局,还可插位和布局,还可插入图片和表格入图片和表格除了与正文对应的字符除了与正文对应的字符编码之外,还使用某种编码之外,还使用某种“标记语言标记语言”所规定的所规定的一些标记来说明该文本一些标记来说明该文本的文字属性和排版格式的文字属性和排版格式等等.doc.rtf.htm.html.pdf公文公文论文论文书稿书稿网页网页丰富丰富格式格式文本文本(超文超文本本)除上述特征外,文除上述特征外,文本中还含有超链,本中还含有超链,使文本呈现为一种使文本呈现为一种网状结构网状结构同上,但还应包含用于同上,但还应包含用于指出指出“链源链源”和和“链宿链宿”的标记的标记.doc.rtf.htm.html.pdf.hlp同上,以同上,以及软件的及软件的联机文档联机文档(帮助文件帮助文件)专转本计算机基础辅导专转本计算机基础辅导 5.1.4文本的编辑与排版文本的编辑与排版专转本计算机基础辅导专转本计算机基础辅导 使用使用Word的操作流程的操作流程创建新文档或打开老文档创建新文档或打开老文档文稿输入文稿输入编辑编辑排版排版文档存盘、打印或发送文档存盘、打印或发送输入中西文字、符号输入中西文字、符号和图表和图表进行增、删、改操作,保进行增、删、改操作,保证文本的正确性证文本的正确性满足清晰、美观、便满足清晰、美观、便于使用等要求于使用等要求专转本计算机基础辅导专转本计算机基础辅导 目的:确保文本内容正确无误目的:确保文本内容正确无误操作:对字、词、句和段落进行添加、删操作:对字、词、句和段落进行添加、删除、修改等操作除、修改等操作MSWord的功能:的功能:在文本的任何位置都可以在文本的任何位置都可以插入插入新的文字新的文字从文本的任何位置都可以从文本的任何位置都可以删除删除不需要的文字不需要的文字将一段文字从一处将一段文字从一处移动移动到另一处到另一处将一段文字从一处将一段文字从一处复制复制到另一处到另一处在文本中自动在文本中自动查找查找指定的词语指定的词语用一个词语自动用一个词语自动替换替换文本中指定的词语文本中指定的词语文本编辑文本编辑(textediting)专转本计算机基础辅导专转本计算机基础辅导 目的:使文本清晰、美目的:使文本清晰、美观、便于阅读观、便于阅读操作内容:对文本中的操作内容:对文本中的字符、段落乃至整篇文字符、段落乃至整篇文章的格式进行设计和调章的格式进行设计和调整,分成整,分成3个层次:个层次:对字符格式进行设置对字符格式进行设置对段落格式进行设置对段落格式进行设置对文档页面进行格式设置对文档页面进行格式设置文本排版文本排版(格式化格式化)专转本计算机基础辅导专转本计算机基础辅导 设置字符的格式设置字符的格式字号字号(八号八号初号初号,5磅磅72磅以上磅以上)1 1磅相当于磅相当于1/721/72英寸英寸 字体字体(宋体、宋体、楷体楷体、黑体黑体、仿宋仿宋、隶书隶书)字符的修饰字符的修饰字符的形状字符的形状(字形字形):正常、加粗、加粗、倾斜、加粗倾斜加粗倾斜字形的修饰:字形的修饰:下划线下划线、着重号、上下标、删除线、着重号、上下标、删除线字符的颜色字符的颜色字符的宽度字符的宽度字符的间距字符的间距字符的效果字符的效果字符的排列方向字符的排列方向Demo1专转本计算机基础辅导专转本计算机基础辅导 什么是段落?用什么是段落?用“回车回车”相互隔开的一组文字相互隔开的一组文字段落格式的设置:段落格式的设置:段落的对齐方式段落的对齐方式(两端对齐、分散对齐、居中对齐、两端对齐、分散对齐、居中对齐、左对齐、右对齐左对齐、右对齐)段落的缩进方式段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩首行缩进、悬挂缩进、左缩进、右缩进进)段间距和段内行距段间距和段内行距使用编号和项目符号使用编号和项目符号段落段落添加边框和底纹添加边框和底纹首字下沉或悬挂首字下沉或悬挂段落与分页的关系段落与分页的关系设置段落的格式设置段落的格式Demo2专转本计算机基础辅导专转本计算机基础辅导 控制段落的缩进控制段落的缩进段落缩进是指段落中的文本到正文区左、右边段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示缩进标记来指示左缩进标记左缩进标记首行缩进标记首行缩进标记右缩进标记右缩进标记右缩进右缩进左缩进左缩进首行缩进首行缩进正文区正文区右边界右边界正文区正文区左边界左边界悬挂缩进悬挂缩进标标记记专转本计算机基础辅导专转本计算机基础辅导 页面格式的设置:页面格式的设置:设置纸张大小和页边距设置纸张大小和页边距设置每页的行、列数目设置每页的行、列数目设置分栏数目与格式设置分栏数目与格式设置页码设置页码设置页眉和页脚设置页眉和页脚设置页面的格式设置页面的格式专转本计算机基础辅导专转本计算机基础辅导 设置页面的分栏设置页面的分栏专转本计算机基础辅导专转本计算机基础辅导“所所见见即即所所得得”(操操作作效效果果屏屏幕幕立立即即可可见见,打打印印结结果与屏幕所果与屏幕所见见完全相同)完全相同)撤销撤销(undo)和恢复和恢复(redo)操作操作格式刷格式刷多种视图多种视图(大纲视图与大纲编辑大纲视图与大纲编辑)自自动动更更正正、自自动动套套用用格格式式、自自动动编编号号、自自动动图图文集文集自动保存功能和自动备份功能自动保存功能和自动备份功能样式、模板和向导样式、模板和向导(wizard)功能功能宏操作(宏操作(Macro)提高提高Word操作效率的若干措施操作效率的若干措施专转本计算机基础辅导专转本计算机基础辅导 文本处理初步文本处理初步专转本计算机基础辅导专转本计算机基础辅导 使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理析、理解、压缩、加密和检索等有关的处理文本处理内容:文本处理内容:字数统计,词频统计,简字数统计,词频统计,简/繁体相互转换,汉字繁体相互转换,汉字/拼音相互转拼音相互转换换词语排序,词语错误检测,文句语法检查词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆自动分词,词性标注,词义辨识,大陆/台湾术语转换台湾术语转换关键词提取,文摘自动生成,文本分类关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成),文种转换(机器翻译)文语转换(语音合成),文种转换(机器翻译)篇章理解,自动问答,自动写作等篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护文本压缩,文本加密,文本著作权保护什么是文本处理什么是文本处理?专转本计算机基础辅导专转本计算机基础辅导 例:例:Word2003的文本处理功能的文本处理功能英文拼写检查和英文拼写检查和英语同义词检查英语同义词检查字数统计字数统计自动编写摘要自动编写摘要中文简繁体转换和术语转换中文简繁体转换和术语转换中英词语翻译中英词语翻译语法和格式检查语法和格式检查语音识别(口授命令和听写)语音识别(口授命令和听写)文档保护文档保护(防止打开或修改文档防止打开或修改文档)专转本计算机基础辅导专转本计算机基础辅导 5.1.5文本的展现文本的展现(输出输出)专转本计算机基础辅导专转本计算机基础辅导 文本的展现文本的展现(输出输出)目的:阅读、浏览或打印文本目的:阅读、浏览或打印文本使用的软件:文本阅读器使用的软件:文本阅读器/文本浏览器文本浏览器嵌入在文本编辑嵌入在文本编辑(处理处理)软件中,如微软的软件中,如微软的Word,独立的软件:如独立的软件:如Adobe公司的公司的AcrobatReader,微软公司的微软公司的IE等等文本展现的过程:文本展现的过程:1.1.对文本的格式描述进行解释对文本的格式描述进行解释2.2.生成文字和图表的映像(生成文字和图表的映像(bitmap)3.3.传送到显示器或打印机输出传送到显示器或打印机输出专转本计算机基础辅导专转本计算机基础辅导 附:输出过程中字形的生成附:输出过程中字形的生成过程:过程:先根据字符的字体确定相应的字库(先根据字符的字体确定相应的字库(font),),再按照该字符的代码从字库中取出该字符的形状描述再按照该字符的代码从字库中取出该字符的形状描述信息信息然后按形状描述信息生成字形,并按照字号大小及有然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处最后将变换得到的字形放置在页面的指定位置处2种不同的字库:种不同的字库:点阵点阵描述描述轮廓轮廓描述描述轮廓点轮廓点直线直线二次曲线二次曲线专转本计算机基础辅导专转本计算机基础辅导 真题讲解真题讲解一、选择题一、选择题1、在下列字符中,其在下列字符中,其ASCII码值最大码值最大的一个是的一个是。(2005年)年)A、XB、6C、5 D、Y答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 2、下列汉字编码标准中,不支持繁体汉下列汉字编码标准中,不支持繁体汉字的是字的是。(2007年)年)A.GB2312-80B.GBKC.BIG5D.GB18030答案:答案:A专转本计算机基础辅导专转本计算机基础辅导 3、在在ASCII编码中,字母编码中,字母A的的ASCII编码编码为为41H,那么字母,那么字母f的的ASCII编码为编码为_。(2008年)年)A46HB66HC67HD78H答案:答案:B专转本计算机基础辅导专转本计算机基础辅导 4、不同的文本处理软件使用的格式控制不同的文本处理软件使用的格式控制和结构说明信息并不统一,不同的丰富格式和结构说明信息并不统一,不同的丰富格式文本互不兼容,因此一些公司联合提出了一文本互不兼容,因此一些公司联合提出了一种中间格式,称为种中间格式,称为_格式。格式。、(2008年)年)ADOCBPDFCHTMLDRTF答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 5、根据根据ASCII码值的大小,下列表达式码值的大小,下列表达式中,正确的是中,正确的是。(2009年)年)A.“a”“A”“9”B.“A”“a”“9”C.“9”“a”“A”D.“9”“A”“a”答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 6、已知已知“江苏江苏”两字的区位码是两字的区位码是“2913”和和“4353”,则其机内码是,则其机内码是。(2009年)年)A.3D2D和和4B55B.4535和和535DC.6145和和7585D.BDAD和和CBD5答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 7、若内存中相邻若内存中相邻2个字节的内容为十六个字节的内容为十六进制进制7451,则它们不可能是,则它们不可能是_。(2010年)年)A1条指令的组成部分条指令的组成部分B1个汉字的机内码个汉字的机内码C1个个16位整数位整数D2个英文字母的个英文字母的ASCII码码答案:答案:B专转本计算机基础辅导专转本计算机基础辅导 二、多选题二、多选题1、设某汉字的区位码设某汉字的区位码(2710)D,则其,则其。(2005年)年)A.机内码为机内码为(BBAA)HB.国标码为国标码为(3B2A)HC.国标码为国标码为(4730)HD.机内码为机内码为(9B8A)H答案:答案:AB专转本计算机基础辅导专转本计算机基础辅导 2、文本编辑的目的是使文本正确、清晰、文本编辑的目的是使文本正确、清晰、美观,下列美观,下列_操作属于文本处理而操作属于文本处理而不属于文本编辑功能。不属于文本编辑功能。(2006年)年)A.添加页眉页脚添加页眉页脚B.统计文本字数统计文本字数C.文本压缩文本压缩D.识别并提取文本中的关键字识别并提取文本中的关键字答案:答案:ABD专转本计算机基础辅导专转本计算机基础辅导 三、填空题三、填空题1、1KB的内存空间能存储的内存空间能存储512个汉字内码,约存个汉字内码,约存个个2424点阵汉字的字形码。点阵汉字的字形码。(2005年)年)2、在中文在中文Windows环境下环境下,西文使用标准西文使用标准ASCII码码,汉字采用汉字采用GB2312编码编码,现有一段文本的内码为现有一段文本的内码为:ABF4D1E378C2B755,则在这段文本中则在这段文本中,含有的含有的汉字和西文字符的个数分别是汉字和西文字符的个数分别是_。(2006年)年)答案:答案:14答案:答案:3、2专转本计算机基础辅导专转本计算机基础辅导 四、判断题四、判断题1、每个汉字的机内码都用两个字节存储。每个汉字的机内码都用两个字节存储。(2005年)年)2、只要是在同一个字符集下,文本的输、只要是在同一个字符集下,文本的输出所使用的字库都是相同的。出所使用的字库都是相同的。(2009年)年)答案:答案:T答案:答案:F专转本计算机基础辅导专转本计算机基础辅导 3、汉字输入的编码方法由数字编码、字汉字输入的编码方法由数字编码、字音编码、字型编码和形音编码等音编码、字型编码和形音编码等4种,在同种,在同一种汉字编码字符集中,使用不同的编码方一种汉字编码字符集中,使用不同的编码方法向计算机输入的同一汉字,它们的内码是法向计算机输入的同一汉字,它们的内码是不同的。不同的。(2008年)年)答案:答案:F专转本计算机基础辅导专转本计算机基础辅导 4、在、在ASCII码表中,数字和英文字母按码表中,数字和英文字母按照照ASCII码值从小到大排列的顺序为:数字、码值从小到大排列的顺序为:数字、大写字母、小写字母。(大写字母、小写字母。()(2008年)年)答案:答案:T专转本计算机基础辅导专转本计算机基础辅导 例题讲解例题讲解一、选择题一、选择题1、下列有关我国汉字编码标准的叙述中,错误、下列有关我国汉字编码标准的叙述中,错误的是的是_。A.GB2312国标字符集所包含的汉字许多情况下国标字符集所包含的汉字许多情况下已不够使用已不够使用B.GBK字符集包括的汉字比字符集包括的汉字比GB18030多多C.GB18030编码标准中所包含的汉字数目超过编码标准中所包含的汉字数目超过2万个万个D.我国台湾地区使用的汉字编码标准是我国台湾地区使用的汉字编码标准是Big5。答案:答案:B专转本计算机基础辅导专转本计算机基础辅导 2、使用计算机进行文本编辑与文本处理、使用计算机进行文本编辑与文本处理是常见的两种操作,下面属于文本处理操作是常见的两种操作,下面属于文本处理操作的是的是_。A.设置页面版式设置页面版式B.设置文章标题首行居中设置文章标题首行居中C.设置文本字体格式设置文本字体格式D.文语转换文语转换答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 3、下列字符编码标准中,既包含了汉字字、下列字符编码标准中,既包含了汉字字符的编码,也包含了如英语、希腊字母等其符的编码,也包含了如英语、希腊字母等其他语言文字编码的国际标准是他语言文字编码的国际标准是_。A.GB18030B.UCS/UnicodeC.ASCIID.GBK答案:答案:A专转本计算机基础辅导专转本计算机基础辅导 4、汉字从键盘录入到存储,涉及汉字输、汉字从键盘录入到存储,涉及汉字输入码和汉字入码和汉字_。A.DOC码码B.ASCII码码C.区位码区位码D.机内码机内码答案:答案:D专转本计算机基础辅导专转本计算机基础辅导 5、在计算机中,西文字符最常用的编码、在计算机中,西文字符最常用的编码是是_。A.原码原码B.反码反码C.ASCII码码D.补码补码答案:答案:C专转本计算机基础辅导专转本计算机基础辅导 二、填空题二、填空题1、为了既能与国际标准、为了既能与国际标准UCS(Unicode)接接轨,又能保护现有中文信息资源,我国政府轨,又能保护现有中文信息资源,我国政府发布了发布了_汉字编码国家标准,它与以汉字编码国家标准,它与以前的汉字编码标准保持向下兼容,并扩充了前的汉字编码标准保持向下兼容,并扩充了UCS/Unicode中的其他字符。中的其他字符。答案:答案:GB18030专转本计算机基础辅导专转本计算机基础辅导 2、用计算机制作的数字文本若根据它们、用计算机制作的数字文本若根据它们是否具有排版格式来分,可分为简单文本和是否具有排版格式来分,可分为简单文本和丰富格式文本两大类。丰富格式文本两大类。Windows附件中的附件中的记记事本事本程序所编辑生成的程序所编辑生成的.TXT文件属于文件属于_文件。文件。答案:简单文本答案:简单文本专转本计算机基础辅导专转本计算机基础辅导 三、判断题三、判断题1、与文本编辑不同的是,文本处理是对文、与文本编辑不同的是,文本处理是对文本中包含的文字信息的音、形、义等进行分本中包含的文字信息的音、形、义等进行分析、加工和处理。析、加工和处理。答案:答案:T
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 酒店餐饮


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!