资源描述
Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,B.,24,Click to edit Master title style,WordNet,介绍,1,WordNet,的词汇组织结构,WordNet,是一部在线词典数据库系统,采用了与传统词,典不同的方式,即按照词义而不是词形来组织,词汇信息。,1985,年由普林斯顿大学认知科学实验室建立,WordNet,将成为一种国际标准,许多国家在,筹划和建立与英文,WorNet,兼容的本国语言,WorNet,系统。,2,WordNet,的词汇组织结构,同义词集,(,Synsets,),WordNet,将英语的名词、动词、形容词、和副词组织为,Synsets,,,每一个,Synset,表示一个基本的,词汇概念,,并在这些概念之间建立了包括,同义关系(,synonymy),、,反义关系(,antonymy),、,上下位关系(,hypernymy & hyponymy),、,部分关系(,meronymy),等多种语义关系。,3,WordNet,的词汇组织结构,同义词集,(,Synsets,),Example:,地球绕着太阳转,自然,会有寒来暑往的四季交替,自然,奥秘,自然、必然、一定、必定,自然、天然,4,WordNet,的词汇组织结构,词汇(,Words,),、,同义词集、语义(,Senses),的数量,POS Unique Strings Synsets Total Word-Sense Pairs,Noun 109195 75804 134716,Verb 11088 13214 24169,Adjective 21460 18576 31184,Adverb 4607 3629 5748,Totals 146350 111223 195817,5,WordNet,的词汇组织结构,多义词信息(1),词 性,单义词和语义,多义词,多义词语义,名 词,动 词,形容词,副 词,94685,5920,15981,3820,14510,5168,5479,787,40002,18221,15175,1900,总 计,120406,25944,75298,6,WordNet,的词汇组织结构,多义词信息(2),词 性,平均词义(包括单义词),平均词义,名 词,动 词,形容词,副 词,1.23,2.17,1.45,1.24,2.75,3.52,2.76,2.41,7,WordNet,的词汇组织结构,词汇的矩阵模型,Word,Meanings,Word Forms,F1 F2 F3 Fn,M1,M2,M3,.,.,.,Mm,E1,1 E1,2,E2,2,E3,3,.,.,.,Em,n,8,WordNet,的词汇组织结构,WorNet,中词语间的关系,主要的词汇关系,同义关系(构成,Synsets),反义关系 (指针 !),上位关系 (指针),下位关系 (指针,),9,WorNet,中词语间的关系,整体关系 (名词、指针#,m/#s/#p),部分关系 (名词、指针%,m/%s/%p),蕴含关系 (动词、指针*),因果关系 (动词、指针),近似关系 (形容词、指针&),注:形容词如果是动词分词,用指针指(,树,-,植物,-,生物,下位词汇的词条继承了他们上位词汇的所有属性(,attributes),名词的语义元素,25个起始概念:一般性概念,作为独立的层次结构,各领域的名次数量不等,互不排斥,大体覆盖了明确的概念和词汇范围,16,WorNet,中词语间的关系,名词的语义元素,act, action, activity, ,natural object,animal, fauna, ,natural phenomenon,artifact, ,person, human being,attribute, property, ,plant, flora,body, corpus, ,possession,cognition, knowledge, ,process,communication, ,quantity, amount,event, happening, ,relation,feeling, emotion, ,shape,food, ,state, condition,group, collection, ,substance,location, place, ,time,motive,17,WorNet,中词语间的关系,名词的语义元素,plant, flora,living thing,organism, ,animal, fauna,person, human being,thing,entity,natural object,non-living thing,object, ,artifact,substance,food,18,WorNet,中词语间的关系,动词蕴涵关系(,entailment),、,动词的上位关系(,hypernymmy) 、,方式关系(,troponymy)、,因果关系(,cause relation),动词之间的组织关系成为动词的蕴涵,例如:,打鼾逻辑上蕴涵睡觉,因为句子“他正在打鼾”蕴涵了句子“他正在睡觉”;如果第一个句子成立,则第二个句子必定成立。,蕴涵是一种单向关系,方式关系是一种特殊的蕴涵。,例如:,一个较一般化的动词,V2,,它的每一个方式词,V1,也蕴涵,V2,V1,是,V2,的一种方式。,19,WorNet,中词语间的关系,动词的上位关系是方式关系的逆关系,例如:,一个较一般化的动词,V2,,它的每一个方式词,V1,也蕴涵,V2,V2,是,v1,的上位词,行走是跛行的上位词,因果关系也是一种特殊的蕴涵关系,如果,V1,必然导致,V2,,则,V1,蕴涵,V2,20,WorNet,中词语间的关系,动词的语义组织:,根据不同的语义领域划分为14类,verbs of,bodily care verbs functions verbs,change verbs cognition verbs,communication verbs competition verbs,consumption verbs contact verbs,creation verbs emotion verbs,motion, perception verbs possession verbs,social interaction verbs weather verbs,21,WorNet,中词语间的关系,部分关系,(,meronymy),“部分-整体”关系,例如:,if “A Y has an X,”,or “A n X is a part of Y”,then x1, x2, , xn are meronym,y1, y2, , ym are holonym,部分关系是一种不对称的关系,部分关系是名词概念之间的一种语义关系。,22,界面说明,23,界面说明,24,
展开阅读全文