资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第一章 中文信息处理概述,1绪 言,1.1什么是,信,信息,控制论,创,创始人,维,维纳(NorbertWiener,),)认为,,信,信息既,不,不是物,质,质也不,是,是能量,,,,是人,类,类在适,应,应外部,世,世界时,以,以及在,感,感知外,部,部世界,而,而作出,协,协调时,与,与外部,环,环境交,换,换内容,的,的总称,。,。,信息论,奠,奠基者,香,香农ClauseShannon认为,,信,信息就,是,是能够,用,用来消,除,除不确,定,定性的,东,东西,,是,是一个,事,事件发,生,生概率,的,的对数,的,的负值,。,。该论,述,述第一,次,次阐明,了,了信息,的,的功能,和,和用途,。,。,什么是,信,信息(,续,续),Informationmaybedefinedasthecharacteristics of theoutputofaprocess,thesebeinginformativeabouttheprocessandthe input .,-,-,-Robert M,.,. Losee,信息是,过,过程输,出,出的特,征,征,这,些,些特征,就,就是输,入,入和处,理,理过程,中,中产生,的,的信息,。,。换句,话,话说,,信,信息可,以,以理解,为,为由过,程,程所生,产,产的特,征,征值或,变,变量。,该,该特征,值,值或变,量,量是代,表,表了输,入,入和过,程,程的信,息,息。,1.2,什,什么,是,是信息,处,处理,信息处,理,理就是,对,对信息,的,的接收,、,、存储,、,、转化,、,、传送,和,和发布,等,等。,信息的,接,接收包,括,括信息,的,的感知,、,、信息,的,的测量,、,、信息,的,的识别,、,、信息,的,的获取,以,以及信,息,息的输,入,入等;,信息的,存,存储就,是,是把接,收,收到的,信,信息或,转,转换、,传,传送或,发,发布中,间,间的信,息,息通过,存,存储设,备,备进行,缓,缓冲、,保,保存、,备,备份等,处,处理;,信息转,化,化就是,把,把信息,根,根据人,们,们的特,定,定需要,进,进行分,类,类、计,算,算、分,析,析、检,索,索、管,理,理和综,合,合等处,理,理;,信息的,传,传送把,信,信息通,过,过计算,机,机内部,的,的指令,或,或计算,机,机之间,构,构成的,网,网络从,一,一地传,送,送到另,外,外一地,;,;,信息的,发,发布就,是,是把信,息,息通过,各,各种表,示,示形式,展,展示出,来,来,1.3,什,什么,是,是中文,信,信息处,理,理,从广义,来,来说,,由,由我们,祖,祖先创,立,立中文,开,开始,,就,就一直,在,在进行,;,;,从狭义,来,来说,,从,从第一,部,部中文,字,字典产,生,生以来,,,,就一,直,直在进,行,行中文,信,信息的,分,分析和,综,综合处,理,理,三、,什,什么是,中,中文信,息,息处理,计算机,中,中文信,息,息处理,:,:研究,我,我国语言文,字,字的信息,处,处理问,题,题的应,用,用技术,,,,是为,了,了使汉,语,语言文,字,字适应,信,信息社,会,会的需,要,要,在,七,七十年,代,代才发,展,展起来,的,的多学科,交,交叉的综合,性,性学科,,,,它是,一,一种以计算机为主要,工,工具,,以,以语言,文,文字为,处,处理对,象,象的高,新,新技术,。,。,计算机,本,本地化,的,的主要,途,途径,1.4,中,中文信,息,息处理,的,的途径,计算机,的,的中文,化,化,通过改,造,造计算,机,机使它,适,适合中,文,文信息,的,的处理,中文的,计,计算机,化,化,通过改,造,造我国,的,的文字,,,,使它,适,适合计,算,算机的,处,处理,1.5中文信,息,息处理,和,和汉字,信,信息处,理,理,中文包,括,括我国,各,各民族,使,使用的,各,各种文,字,字。,汉字在,中,中文中,处,处于主,导,导地位,。,。,中文信,息,息处理,包,包括汉,字,字信息,处,处理。,1.6,中,中文,信,信息处,理,理的必,要,要性,人类社,会,会进入,了,了信息,社,社会,信息的,量,量日益,膨,膨胀,人工方,法,法处理,信,信息在,目,目前是,很,很困难,的,的,计算机,为,为进行,大,大量的,信,信息处,理,理提高,了,了可能,我国以,中,中文为,信,信息的,主,主要表,示,示形式,计算机,必,必须要,能,能处理,中,中文,计算机,的,的本地,化,化需要,中,中文信,息,息处理,技,技术,只有计,算,算机的,本,本地化,,,,信息,的,的计算,机,机处理,才,才能在,我,我国推,广,广应用,自然语,言,言处理,是,是计算,机,机技术,发,发展的,必,必然方,向,向,1.7,中,中文,信,信息处,理,理的发,展,展,50年,代,代,103、104,计,计算机,的,的俄汉,翻,翻译,60年,代,代,汉,字,字电报,译,译码机,70年,代,代,我,国,国才系,统,统地研,究,究中文,信,信息处,理,理,80年,代,代,中,文,文信息,处,处理的,基,基础研,究,究蓬勃,发,发展,90年,代,代,中,文,文信息,处,处理得,到,到广泛,应,应用,21世,纪,纪,中,文,文信息,处,处理存,在,在挑战,和,和机遇,1.8,中,中文,信,信息处,理,理系统,的,的组成,硬件,计算机,硬,硬件,字库,输入设,备,备,输出设,备,备,软件,系统软,件,件,应用软,件,件,1.9,中,中文,信,信息处,理,理的内,容,容,中文信,息,息处理,系,系统,中文应,用,用软件,自然语,言,言理解,机器翻,译,译,自动文,摘,摘,文本分,类,类,信息检,索,索、抽,取,取和过,滤,滤,基础研,究,究,自然输,入,入,字库,输入法,内码,Internet的本地,化,化,中文嵌,入,入系统,电子照,排,排,1.10 国,际,际化和,本,本地化,国家标,准,准和国,际,际标准,不同字,符,符集问,题,题,简繁问,题,题,操作系,统,统问题,如何过,渡,渡?,1.11 电,子,子消费,设,设备的,中,中文化,中文嵌,入,入式操,作,作系统,字形、,字,字库,字库压,缩,缩,汉字输,入,入,2,汉,汉字的,属,属性及,其,其特点,字汇,字形,字频,字音,字义,词汇,2.1,字,字汇,所谓字,汇,汇就是,指,指汉字,的,的集合,,,,字汇,量,量与计,算,算机对,文,文字处,理,理的方,式,式有很,大,大关系,甲骨文3000余个,东汉许,慎,慎说文解,字,字9353个,清代张,玉,玉书康熙字,典,典49030个,2.1,字,字汇,(,(续),1952年,教,育,育部公,布,布了常用字,表,表,其中,收,收录了,汉,汉字2000个(包,括,括500个补充,用,用字),;,;,1955年,中,国,国文字,改,改革委,员,员会公,布,布了通用字,表,表(初,稿,稿),收录,汉,汉字5709个;,1965年修订,后,后的印刷通,用,用汉字,字,字形表,收录,汉,汉字6196个;,1988年公布,的,的现代汉,语,语通用,字,字表收录汉,字,字7000个;,对300万字语,料,料的检,测,测结果,:,:2500个常用,字,字的覆,盖,盖率为97.97%,1000个常用,字,字的覆,盖,盖率为1.51%,3500字合计,覆,覆盖率,达,达到99.48%。,2.1,字,字汇,(,(续),随着汉,字,字文化,和,和历史,的,的演变,,,,有些,字,字出现,了,了很多,异,异体字,,,,很多,字,字成为,“,“死字,”,”而不,再,再使用,2.1,字,字汇,(,(续),70年代末,,,,我国,专,专门成,立,立专家,组,组,确,定,定了计,算,算机中,汉,汉字的,字,字符集,,,,其中,最,最常用,的,的是GB2312,一级汉,字,字3755个,二级汉,字,字3008个,辅助集,包,包含16000余个汉,字,字,事实证,明,明这个,字,字符集,收,收录的,汉,汉字有,很,很多不,合,合理的,地,地方,人名、,地,地面用,字,字少旻(min)喆(zhe)赟(yun),动物名,用,用字多,鹱,鹱,鹛,鹛 鸸,鼍,鼍,ISO10646-2001定义了5万多个,汉,汉字,2.1,字,字汇,(,(续),龖,龘,龘鼄,2.2,字,字形,汉字是,象,象形文,字,字,其,每,每个字,符,符都具,有,有特定,的,的形状,和,和构造,,,,这是,其,其与各,种,种拼音,文,文字的,最,最大区,别,别,目前对,汉,汉字字,形,形的分,解,解方法,和,和分解,标,标准尚,未,未统一,,,,现在,的,的字形,分,分解方,法,法大体,上,上可以,分,分为单,字,字、字,根,根、笔,画,画(笔,形,形)和,形,形素四,个,个层次,2.2,字,字形,(,(续),单字,单字分,成,成多种,结,结构类,型,型,大,体,体上可,以,以分为,独,独体型,、,、上下,结,结构型,、,、左右,结,结构型,和,和内外,结,结合型,四,四种,如果对,单,单字结,构,构进行,更,更精细,的,的划分,,,,可以,分,分为如,下,下十二,种,种:,2.2,字,字形,(,(续),左右,“,“朋,”,”,左,左中,右,右“,彻,彻”,上下,“,“吕,”,”,上,上中,下,下“,意,意”,全包围,“,“国,”,”,右,右开,口,口“,区,区”,上开口,“,“函,”,”,下,下开,口,口“,向,向”,左下开,口,口“,句,句”,右,右,上,上开口,“,“达,”,”,右下开,口,口“,库,库”,重,重,叠,叠,“,“巫”,2.2,字,字形,(,(续),字根,字根是,组,组成单,字,字的基,本,本结构,单,单元,,它,它本身,由,由笔画,组,组成。,它,它的基,本,本要求,是,是组字,能,能力强,,,,组成,的,的单字,字,字形匀,称,称,目前实,际,际常用,的,的字根,为,为100,-,-300个,一般常,用,用的偏,旁,旁部首,都,都被选,择,择为字,根,根,字根的,划,划分不,是,是绝对,的,的,目,前,前还没,有,有相关,的,的强制,性,性标准,,,,只有,指,指导性,标,标准,例如:,土,土旦,王,王,2.2,字,字形,(,(续),笔画(,笔,笔形),齉爨,龘,36画30画48画,每一次,从,从落笔,到,到提笔,,,,便构,成,成一个,笔,笔画,一个笔,画,画所形,成,成的轨,迹,迹就是,笔,笔形,2.2,字,字形,(,(续),汉字常,用,用的笔,形,形有五,种,种,横、竖,、,、撇、,捺,捺、折,各种笔,形,形在汉,字,字中使,用,用的频,度,度为:,横28%竖18%撇15%,捺13%折17%其他19%,札,2.2,字,字形,(,(续),汉字笔,画,画数,最少的,仅,仅1画,多的可,达,达30余画,少数可,达,达60画以上,平均每,字,字约11画,2.3,字,字频,汉字有,五,五、六,万,万个,,一,一般的,人,人仅掌,握,握三千,到,到五千,个,个常用,汉,汉字,,不,不会出,现,现文字,交,交流的,障,障碍吗,?,?,统计结,果,果表明,使,使用频,度,度最高,的,的,164个汉字,占,占汉字,使,使用频,度,度的50%,1000个汉字,占,占汉字,使,使用频,度,度的90.4%,2500个汉字,占,占汉字,使,使用频,度,度的97.97%,?,?,?个汉字,占,占汉字,使,使用频,度,度的99.00%,2.3,字,字频,(,(续),政治,文化,新闻,科技,综合,编号,字,频度,字,频度,字,频度,字,频度,字,频度,1,的,0.0536,的,0.0324,的,0.0375,的,0.0320,的,0.0384,2,是,0.0165,一,0.0218,一,0.0132,一,0.0097,一,0.0125,3,一,0.0136,了,0.0196,了,0.0120,在,0.0092,是,0.0098,4,在,0.0115,不,0.0165,和,0.0086,用,0.0079,在,0.0095,5,这,0.0109,是,0.0141,在,0.0086,有,0.0073,了,0.0082,6,主,0.0108,说,0.0130,人,0.0083,是,0.0070,不,0.0081,7,不,0.0101,他,0.0130,大,0.0083,不,0.0069,和,0.0075,8,和,0.0098,这,0.0119,主,0.0083,中,0.0066,有,0.0069,2.3,字,字频,(,(续),字频有,明,明显的,局,局部性,字频统,计,计的结,果,果与字,频,频统计,时,时使用,的,的文本,的,的性质,有,有关,字频也,有,有一定,的,的时间,性,性,在不同,的,的历史,时,时期同,一,一历史,时,时期的,不,不同阶,段,段,某,些,些特定,字,字的使,用,用频度,可,可能会,出,出现较,大,大的波,动,动,例如:,镕,镕,2.4,字,字音,汉字是,单,单音节,文,文字,早期汉,字,字读音,标,标记法,:,:直音,、,、反切,和,和注音,字,字符。,直音法,是,是用一,个,个汉字,给,给另一,个,个汉字,注,注音,,例,例如。,“,“厶,,音,音司”,。,。,反切法,是,是用两,个,个汉字,给,给另外,一,一个汉,字,字注音,,,,如“,鲁,鲁,郎,古,古切”,,,,“浪,”,”是反,切,切上上,字,字,与,被,被注音,字,字“鲁,”,”的声,母,母相同,,,,“古,”,”是反,切,切下字,,,,与被,注,注音字,“,“鲁”,的,的韵母,和,和声调,相,相同。,注音字,符,符包括,了,了注音,符,符号和,拼,拼音符,号,号。注,音,音符号,创,创建于,五,五四运,动,动前后,,,,它对,汉,汉字注,音,音和推,广,广国语,起,起到很,好,好的作,用,用。目,前,前台湾,地,地区还,在,在继续,使,使用。,汉,汉字注,音,音法也,有,有多种,,,,包括,:,:威妥,玛,玛式方,案,案、国,语,语罗马,字,字拼音,法,法、北,方,方话拉,丁,丁化新,文,文字和汉语拼,音,音方案等。,2.4,字,字音,(,(续),汉语,拼,拼音方,案,案是20世,纪,纪50,年,年代制,定,定出来,的,的一个,汉,汉字标,音,音系统,。,。它用26个,西,西文字,母,母作为,拼,拼音字,母,母,用21个,声,声母、35个,韵,韵母、4声调,以,以及1,个,个隔音,符,符来记,录,录汉语,和,和标注,汉,汉字。,2.4,字,字音,(,(续),绝大多,数,数的汉,字,字音节,由,由一个,辅,辅音音,素,素和一,个,个(或,多,多个),元,元音音,素,素构成,现代汉,语,语有417个基本,音,音节,加上阴,平,平、阳,平,平、上,声,声、去,声,声、轻,声,声五个,声,声调,,共,共有约1330个音节,2.4,字,字音,(,(续),六万多,个,个汉字,一,一共1330种读音,,,,所以,,,,汉语,中,中同音,字,字是很,多,多的,就GB2312收录的6763个汉字,而,而言,没有同,音,音字的,读,读音有25个,如:佛,给,给能您,耨,耨暖日,森,森僧贼,抓,抓,同音字,最,最多的,读,读音是yi4(55个),由于一,般,般的人,掌,掌握一,千,千多个,常,常用汉,字,字是没,有,有困难,的,的,所,以,以,出,现,现了用,常,常用字,注,注音的,方,方法,,非,非常实,用,用。例,如,如:,赟同晕,或,或,赟,赟同云,(,(阴平,),),2.4,字,字音,(,(续),在汉语,中,中除了,一,一音多,字,字现象,以,以外,,还,还有一,字,字多音,的,的现象,就GB2312收录的6763个汉字,而,而言,其中多,音,音字有866个,占12.8%,2.5,字,字义,字义是,汉,汉字属,性,性中最,复,复杂的,属,属性,,对,对字义,很,很难做,客,客观的,量,量化,汉字原,来,来是一,种,种望文,生,生义的,文,文字,,汉,汉字的,形,形与义,之,之间有,着,着千丝,万,万缕的,联,联系,2.5,字,字义,(,(续),现在一,个,个汉字,并,并不只,是,是一个,字,字义,,据,据统计,,,,一个,汉,汉字平,均,均约有,四,四个字,义,义。所,以,以,现,代,代汉语,中,中汉字,的,的表义,能,能力明,显,显下降,,,,尤其,是,是简化,汉,汉字,車-车,汉字的,字,字义往,往,往和上,下,下文环,境,境密切,相,相关,,由,由此上,升,升为语,义,义,跑(跑,步,步)(,逃,逃跑),汉字的,字,字义还,会,会影响,汉,汉字的,读,读音,翟(zhai2)(di2),2.6,词,词汇,词汇是,语,语言中,所,所有的,词,词和短,语,语的总,和,和。词,是,是由语,素,素构成,,,,是句,子,子中最,小,小的能,够,够独立,运,运用的,语,语言单,位,位。,单音节,语,语素在,书,书面上,用,用单个,的,的汉字,书,书写。,古汉语,中,中由一,个,个单音,节,节语素,构,构成的,词,词占绝,对,对优势,,,,所以,书,书面上,基,基本一,个,个汉字,也,也就是,一,一个词,(,(只有,极,极少数,连,连绵词,例,例外),。,。这就,形,形成了,汉,汉字连,篇,篇书写,的,的传统,。,。,20世纪20年代开,始,始,文,章,章开始,分,分段,,并,并使用,新,新式标,点,点符号,,,,不再,连,连篇书,写,写,基,本,本上为,按,按句连,写,写。,2.6,词,词汇,(,(续),汉语中,的,的词有,词,词根和,词,词缀,词根是,指,指意义,实,实在、,在,在合成,内,内的位,置,置不固,定,定的粘,着,着语素,和,和自由,语,语素;,自由语,素,素则是,指,指能够,独,独立成,词,词的语,素,素,例,如,如:“,水,水、木,、,、金、,心,心、火,”,”等。,自,自由语,素,素能够,单,单独成,词,词,也,可,可以与,其,其他语,素,素组合,成,成词,粘着语,素,素是指,不,不能单,独,独构成,词,词的语,素,素,例,如,如:“,民,民、伟,、,、丰、,型,型”等,。,。粘着,语,语素必,须,须跟别,的,的语素,组,组成词,。,。,词缀是,指,指意义,不,不实在,、,、在合,成,成词内,位,位置固,定,定在前,或,或后的,粘,粘着语,素,素。,例如,,“,“筷子,”,”中的,“,“筷”,是,是词根,语,语素,,“,“子”,是,是词缀,语,语素。,2.6,词,词汇,(,(续),汉语中,由,由一个,语,语素构,成,成的词,叫,叫做单,纯,纯词,,由,由两个,或,或两个,以,以上语,素,素构成,的,的词称,为,为合成,词,词。,单纯词,包含一,个,个语素,构,构成的,词,词(例,如,如,“,人,人、走,、,、红、,天,天”等,),),双音节,连,连绵词,(,(例如,,,,“鸳,鸯,鸯、垃,圾,圾、葡,萄,萄、琳,琅,琅、吩,咐,咐”等,),),音译词,(,(例如,,,,“沙,发,发、咖,啡,啡、巧,克,克力、,巴,巴黎、,逻,逻辑”,等,等),译自少,数,数民族,的,的地名,(,(例如,,,,“哈,尔,尔滨、,呼,呼和浩,特,特、吐,鲁,鲁番”,等,等)。,2.6,词,词汇,(,(续),合成词,包,包括三,类,类:重,叠,叠、附,加,加和复,合,合,重叠式的词是,由,由两个,相,相同的,词,词根相,叠,叠构成,的,的词,,例,例如:,哥,哥哥、,姐,姐姐、,刚,刚刚、,星,星星、,整,整整齐,齐,齐等;,附加式的词是,由,由词根,和,和词缀,构,构成。,词,词缀在,词,词根之,前,前称为,前,前缀,,在,在词根,之,之后则,称,称后缀,,,,,,前加,式,式(前,缀,缀+词根),:,:老虎,、,、老乡,,,,阿姨,、,、阿毛,,,,微处,理,理器、,微,微笑,后加式,(,(词根+后缀),:,:刀子,、,、饼子,、,、胖子,、,、桌子,,,,石头,、,、木头,、,、苦头,,,,作者,、,、读者,、,、科技,工,工作者,、,、唯物,主,主义者,,,,芦花,、,、规范,化,化、现,代,代化,复合式词是由,两,两个或,两,两个以,上,上词根,成,成分组,成,成的附,加,加式合,成,成词。,汉,汉语复,合,合词的,内,内部结,构,构基本,上,上是和,句,句法结,构,构一致,的,的,有,主,主谓、,述,述宾、,补,补充、,偏,偏正、,联,联合等,,,,例如,,,,年轻,、,、民主,、,、自动,,,,司机,、,、站岗,、,、美容,,,,提供,、,、推广,、,、改进,,,,气功,、,、腾飞,、,、火红,,,,体制,、,、开关,、,、质量,,,,等等,。,。,2.7,语,语境,语境是,语,语言单,位,位出现,时,时的环,境,境。一,般,般分为,上,上下文,语,语境和,情,情景语,境,境。,词、短,语,语、句,子,子等在,文,文本中,出,出现时,,,,它前,面,面或后,面,面出现,的,的其他,语,语言单,位,位都是,该,该单位,的,的上下,文,文语境,。,。,“上下,文,文”是,一,一个宽,泛,泛的概,念,念,在,一,一段话,或,或一篇,文,文章中,凡,凡出现,在,在某语,言,言单位,之,之前的,词,词、短,语,语、句,子,子等都,是,是该语,言,言单位,的,的上文,,,,出现,在,在其后,的,的都是,其,其下文,。,。,2.8,计,计算机,中,中文信,息,息处理,的,的特点,解决汉,字,字信息,在,在计算,内,内部的,表,表示问,题,题。有,了,了机器,内,内部表,示,示方法,,,,才能,使,使汉字,信,信息在,计,计算机,内,内进行,相,相应的,处,处理。,由于汉,字,字自身,的,的特点,,,,不可,能,能一次,把,把现有,的,的汉字,和,和将来,出,出现的,汉,汉字全,部,部收录,在,在机器,内,内部(,实,实际上,也,也不可,能,能),,因,因此选,用,用多少,汉,汉字、,选,选录汉,字,字的原,则,则等就,成,成为中,文,文信息,处,处理面,临,临的新,问,问题。,由于西,文,文是一,种,种拼音,文,文字,,只,只有少,量,量的字,符,符,因,此,此用户,通,通常可,以,以通过,键,键盘直,接,接把西,文,文信息,输,输入到,计,计算机,内,内部。,而,而汉字,由,由于其,字,字符数,远,远远超,过,过西文,,,,因此,不,不可能,直,直接用,键,键盘进,行,行输入,。,。为此,,,,人们,必,必须要,找,找到一,种,种中间,转,转换方,法,法才能,把,把汉字,字,字符信,息,息输入,到,到计算,机,机内。,2.8计算机,中,中文信,息,息处理,的,的特点,(,(续),西文信,息,息由于,其,其字符,数,数量很,少,少,因,此,此在计,算,算机内,部,部的存,储,储就占,用,用很少,的,的空间,,,,而汉,字,字由于,其,其字符,数,数量大,,,,存储,汉,汉字信,息,息要占,用,用计算,机,机内的,大,大量资,源,源。,西文字,符,符的ASCII码已经,成,成为计,算,算机及,其,其外部,设,设备使,用,用的标,准,准,因,此,此在西,文,文信息,的,的存储,、,、交换,上,上不存,在,在信息,的,的转换,。,。而中,文,文信息,客,客观上,在,在计算,机,机内部,不,不能用,单,单字节,表,表示,,因,因此信,息,息交换,,,,特别,是,是在中,西,西文信,息,息的兼,容,容上面,要,要作必,要,要的转,换,换。,中文信,息,息的多,字,字节表,示,示特性,,,,为计,算,算机处,理,理中文,信,信息带,来,来了额,外,外的负,担,担。,在信息,输,输出方,面,面,西,文,文信息,通,通常是,横,横向排,列,列,由,左,左向右,进,进行输,出,出;而,中,中文信,息,息除了,可,可以按,照,照西文,信,信息一,样,样横向,排,排列输,出,出外,,还,还可以,纵,纵向排,列,列输出,。,。,2.9,汉,汉字的,认,认同,在中国,(,(包括,台,台湾和,香,香港地,区,区)、,日,日本、,韩,韩国和,越,越南(,简,简称CJKV,),),在,文,文字信,息,息处理,中,中,都,会,会遇到,大,大量的,汉,汉字。,为,为了实,现,现统一,的,的表示,。,。国际,标,标准组,织,织和Unicode,集,集团提,出,出了进,行,行汉字,认,认同的,基,基本概,念,念。即,汉,汉字的XYZ,模,模型(XYZmodeforIdeograph),,其,其中,X表,示,示字义,,,,Y表,示,示字形,(,(抽象,字,字形),,,,Z表,示,示字型,(,(具体,造,造型),2.9,汉,汉字的,认,认同,
展开阅读全文