自然语言理解-语义知识的形式化表示.ppt

上传人:xt****7 文档编号:6019669 上传时间:2020-02-14 格式:PPT 页数:92 大小:618.50KB
返回 下载 相关 举报
自然语言理解-语义知识的形式化表示.ppt_第1页
第1页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第2页
第2页 / 共92页
自然语言理解-语义知识的形式化表示.ppt_第3页
第3页 / 共92页
点击查看更多>>
资源描述
语义知识的形式化表示 什么是意义 关于意义的许多说法 指称论意念论行为论情境论实证论真值论用法论境况论 从计算机的角度看意义 计算机只能在符号世界里转圈圈 意义就是符号变换的游戏 纯粹从符号世界的角度看 A的意义是B 意味着什么 所谓知道一个符号串的意义 包含两层意思 1你可以把一个符号串A变换为符号串B 2原则上 关于这个符号串A的变换游戏没有止尽 意义 符号之间的变换关系 a 在一种语言内进行的符号变换 张三打了李四 李四被张三打了 b 在不同语言之间进行的符号变换 张三用手打了李四 ZhangSanhitLiSiwithhishand c 在不同性质的符号系统之间进行的符号变换 这是残疾人通道 意义 符号之间无止尽的变换关系 我买了辆车 意思1 我付钱从某处购买了一辆车意思2 我拥有了一辆车意思3 我可以使用这辆车意思4 我的钱都花完了 如何确定符号之间的变换关系 问题1 如何让计算机知道 A的意思是B 问题2 如何让计算机把符号A变换为符号B 问题1 问题2 困难 形式与意义的非一一对应性 一个形式 多个意义自然语言理解必须面对的问题一个意义 多个形式 意义 怎么能论 个 呢 自然语言生成必须面对的问题把上述问题换种表述法 符号A对应着多个可能的变换结果B1 B2 B3 在特定场合下 到底选哪一个 一个形式 多个意义 多义词 这个编辑很不错他每年要编辑一百万字的书兼名 动两个词性的多义词这小伙子是干警察的好材料把这个小伙子的材料送人事部这是一种新型材料只有名词一个词性的多义情形这是我刚买的字典我刚查的字典 难道还有错虚词的多义情形 一个形式 多个意义 多义词 多义句式 许多读者给编辑部打来了电话X1 有 Y1 空间关系这本书有许多读者X2 有 Y2 领有关系编辑部有许多读者张老大有很多手下许多人给编辑部打来了电话读者1 0价 这本书有许多人读者2 1价编辑部有许多人手下 0 1价 张老大有很多人 一个形式 多个意义 指代消解 张三i把他j出卖了张三i把他i j的朋友出卖了老张i有个漂亮的女儿j i j很骄傲老张i买了辆新车j j很贵老张i中了头奖j i很高兴 一个形式 多个意义 泛指与特指 人是会死的苏格拉底是人苏格拉底是会死的鲁迅的作品不可能在一天之内全部读完 祝福 是鲁迅的作品 祝福 不可能在一天之内全部读完 一个形式 多个意义 量化词组 驴子句 donkeysentence IfJohnownsadonkey hebeatsit Everyfarmerwhoownsadonkeybeatsit Johnownsadonkey 一个形式 多个意义 结构 关系 发现了敌人的哨兵牛奶饼干反对的是他他正在上课开刀的是张大夫在火车上写标语小明的信 一个形式 多个意义 隐喻 董永这回算是背上口大黒锅了这家伙真是个狐狸白天不懂夜的黒送温暖办教育董永终于抹平了七仙女心头的创伤教堂的钟又敲响了卧室的钟慢了整整一个小时 一个意义 多个形式 同义词 不 没 有 我不去西藏 我没去西藏我不知道结果 我没知道结果 我不病 我没病这锅肉还不烂 这锅肉还没烂 一个意义 多个形式 同义结构 A马文才害死了梁山伯 B1梁山伯被马文才害死了B2马文才把梁山伯害死了1 AB2 B1 又抢走了祝英台 2 A B2B1之后 一家人整日以泪洗面 语义知识的性质和作用 语义知识跟句法知识的性质差别主要在于知识颗粒度的粗细不同 语义知识就是细化了的句法知识 句法知识就是非常概括的语义知识 宏观而言 语义知识跟句法知识的作用是相同的 都是为了正确地进行符号串的变换操作 依赖语义知识进行结构分析 例1发现宝藏的人v n1 的 n2例2知道敌军的意图v n1 的 n2 依赖语义知识进行词义消歧 多义词义项释义英语译词例1想主意想1思索 思考think例2想女儿想2想念 怀念miss 依赖语义知识进行推理 例1乡长买了一瓶茅台 乡长拥有了一瓶茅台例2乡长给了村长一瓶茅台 村长得到了一瓶茅台 乡长失去了一瓶茅台例3乡长正在打鼾 乡长正在睡觉例4Everyfarmerwhoownsadonkeybeatsit Johnisafarmer Pandoraisadonkey DoesJohnbeatPandora Yes Idon tknow 语义 理解 语义知识 理解符号串A的意思 将A变换为符号串B对A进行句法结构分析在机器看来 只不过是在做符号串变换的操作对A进行词义排歧分析对A进行推理 要进行上述符号变换操作 除了需要句法知识外 还需要语义知识 语义知识的类型及其形式化表示 关于词义聚类关系的知识 纵向 关于词义组合关系的知识 横向 属性名 属性值 型语义知识 静态 词典 条件 动作 型语义知识 动态 规则句法知识与语义知识的一体化 同样的形式化表示 关于词义聚类关系的知识 同义 近义 关系反义关系同位关系上 下位关系 语义特征表示 语义场描述 语义场是对语义特征的系统化表述顺序 循环 层级 语义场为结构化的语义特征值提供了描述手段一月 二月 十二月星期一 星期二 星期日钱 两 斤 公斤 吨学士 硕士 博士国 省 市 县 镇 乡 村 语义场描述 颜色语义场 X Y的意思是 如果一种语言包含Y 则一定也包含XBerlin B Kay P 1969 BasicColorTerms BerkeleyandLosAngeles UniversityofCaliforniaPress 亲属关系语义场 亲属词本质上表示的是人与人之间的关系 复杂的关系可以还原为基本的关系和属性 最基本的关系是 亲子关系 Parent 夫妻关系 Consort 长幼关系 Order 最基本的属性是性别属性 Sex 值为男性 Male 女性 Female 任意一个亲属词都可以表达为参考人X的函数 e g 亲属名关系表达式属性描述妻子C X Y Sex X M Sex Y F哥哥O Y X P Z X P Z Y Sex Y M 语义分类树 语义知识应用示例 一 1 判断句子是否合法 句法分析例 1 手枪比步枪更难使用例 2 手枪比武器更难使用2 细化组合模式 从词类到语义类 句法分析修理汽车的工人 v n 的 n寻找烈士的遗物 v n 的 n 修理汽车 的工人 v 交通工具 的 人 寻找 烈士的遗物 v 人 的 具体物 语义类与语义特征 类与特征所描述的信息是等价的 有n个取二值的特征 就可以分出2n个类 反之亦然 烈士 家属 烈士家属 家属烈士烈士 语义类 人家属 语义类 人 关系 Yes 关心烈士的家属 v n 的 n v 人 的 人 v 人 的 人 关系 Yes 从词类到语义类到语义特征 是不断对结构模式进行细化的一个过程 关于词义组合关系的知识 理想目标 描述任意词语之间的组配关系动词 名词之间的组配关系论元个数 配价数论元类型 论旨角色对论旨角色的选择限制论旨角色与句法结构位置之间的对应关系广义配价模式 论元个数 配价数 反映动词所能投射的基本句法结构的性质V零元 价 动词 V一元 价 动词 V 二元 价 动词 V 三元 价 动词 X元 价 动词 X价动词 为 向 对 V董永总为别人着想大家向董永看齐董永对七仙女发火 VVP那个犯人企图逃跑董永觉得不舒服 VNPVP董永告诉七仙女晚上六点开会 论元类型 论旨角色 反映动词所能结合的名词语义角色 汉语动词的论旨角色层级系统 论旨角色的定义 原型施事 proto typicalagent 典型性渐减的三个小类 论旨角色的定义 施事 感事 主事句法上的分布 施事的句法定义 1 作基础句的主语 例如 弟弟哭了 小张吃了一碗汤面 2 作 把 字句的主语 例如 哥哥把校长给得罪了 3 作 被 由 等介词的宾语 例如 后勤工作由老刘负责 4 作 V一V V了V 等重叠形式的主语 例如 你试 一 试 5 作 不VP 和 没有VP 等否定形式的主语 例如 小沈不去 6 不在宾语位置上出现 除非句首是处所性成分 例如 笑了小明 选择限制 语义组配 如何描述选择限制 句法属性层次商量 当事 复数 Yes 争吵 对话 语义属性层次吃 施事 语义类 人 动物 受事 语义类 食物 词例层次嗑 施事 语义类 人 受事 词语 瓜子 正面描述与反面描述变卖 施事 语义类 人 集体 受事 语义类 人 论旨角色与句法结构的对应关系 动词各论旨角色可以出现的句法位置 S3 A 用 I P例如 妈妈用小刀切西瓜S4 I A P例如 这把刀我切肉S5 Ma A P例如 那些白菜我都包饺子了S6 A 用 Ma R例如 姐姐用细毛线织了一件上衣S7 A 把 Ma R例如 妈妈把板栗全包了粽子S8 A I例如 我切这把大刀S9 A Ma例如 我包韭菜馅儿 你包肉馅儿S10 A M例如 我包小包 你包大包 A 施事 I 工具 P 受事 Ma 材料 M 方式 R 结果 论旨角色与句法结构的对应关系 续 R1 vp vpnp 内部结构 述宾 IF vp 受事 npTRUE IF vp 结果 npTRUE R2 np vpunp IF vp 内部结构 述宾THEN vp 施事 npENDIF 发现宝藏的人 发现宝藏 的人 知道敌军的意图 知道 敌军的意图 发现敌人的哨兵 发现 敌人的哨兵 发现敌人 的哨兵 广义配价模式 纵向拓展从词到短语在两个方向上对标准配价模式进行扩展横向拓展从 动 名 关系拓展到 动 形 关系 形 名 关系 名 名 关系 副 形 关系 短语结构的组配性质 买 买衣服买贵了 这件衣服你买贵了 你买贵了这件衣服晾 晾衣服晾阳台上晾干 晾干衣服 晾干阳台上 动 形 语义组配描述 买便宜的布 买便宜染红 洗干净了洗胖了洗聪明了 洗僻静了 洗适宜了 洗远了 洗浓了动词形容词动词形容词名词 其他词类之间的组配约束 名 名组配 n n 整体 部分关系 没有盖儿的杯子 没有杯子盖儿 集合 成员关系 北大的学生 学生的北大 实体 材料关系 塑料凉鞋 凉鞋塑料 个体 亲属关系 老张的女儿 老张的 副词 形容词 动词 短语 正在知道 马上买贵了 认真地懂得了 格语法 CaseGrammarCharlesJ Fillmore 1966TowardsamodernTheoryofcaseThecaseforcase格辨SomeProblemsforCaseGrammar 格的含义 传统语言学中的格是表层格词尾变化词干音变格语法中的格是 深层格 体词与谓词的及物性关系句法语义关系 例子 Thedooropened Thekeyopenedthedoor Theboyopenedthedoor Thedoorwasopenedbytheboy Theboyopenedthedoorwithakey Theboy 施事格Thedoor 客体格Thekey 工具格 格语法 基本规则词汇部分转换部分 基本规则 S M PP V C1 C2 CnC K NP 基本规则 S M P一个句子S可以改写成情态和命题两大部分情态部分包括否定 时 式 体 以及其他被理解为全局情态成分的状语命题牵涉到动词和名词短语 动词和内嵌小句之间的关系 基本规则 P V C1 C2 Cn任何命题P都可改写成一个动词V和若干个格C 动词是广义上的动词 包括 动词 形容词 甚至包括名词 副词和连词 基本规则 C K NPK为格标 是各格范畴在底层结构中的标志 格表 施事格Agentive工具格Instrumental承受格Dative使成格Factitive方位格Locative客体格Objective收益格Benefactive源点格Source终点格Goal伴随格Comitative 词汇部分 在词库中标明词汇的底层格的特征Street Locative Idea Locative 标出动词的框架特征Cry A run A Cry和run可以带有一个表示施事的NP区分必选格和可选格 转换部分 和转换语法类似移动删除插入复写 格语法与汉语 有局限性汉语不是动词中心流水句 无动局 连动 紧缩等结构 无法用一个动词统率一个句子的模式来描述 义素分析法 丹麦语言学家叶姆斯列夫L Hjelmslev美国语言学家卡茨J Katz和福多尔J A Fodor提出解释语义学 义素分析法 义素是意义的基本要素义素是词的理性意义的区别特征词的理性意义是一系列语义特征的总和 例1 男人 人 成年 男性 女人 人 成年 男性 男孩 人 成年 男性 女孩 人 成年 男性 例2 陆军 军队 在陆地 作战 f 通常由 组成 步兵 炮兵 装甲兵 工程兵 各 专业部队 海军 军队 在海上 作战 f 通常由 组成 水面舰艇 潜艇 海军航空兵 海军陆战队 各 专业部队 同一类型的义素写在同一花括弧f 适用范围 各 是一个标志 它表示被标志的义素可以分解为若干同类的义素 义素分析法 了解词与词搭配是在语义上受到什么样的限制用于判断同义词 近义词之间的差别 蒙太古语法 MontagueGrammar语义研究的形式化问题蒙太古认为自然语言研究必须是数学的一个分支组成部分句法翻译语义 MG理论模式 词库 有意义的词语 义类 内涵逻辑表达式 语义规则 特定模型中的外延或内涵所指 对应函数f 翻译规则 基本词语 语类 句法规则 树形图 MG句法部分 语类categorye和t以及它们之间关系的一组集合e 表示个体词语 individualexpression 或实体词语 entityexpression 不同于名词或者名词短语e g chair不属于e语类 只有具体的某把椅子的词语才属于e语类t 表示具有真值的语言单位 真值词语 truthvalueexpression 或陈述语句 declarativesentence 语类 如果A和B位语类标记 则A B A B均为语类标记所有语类都是从e和t中推出A B表示一个可以与B语类词语结合而产生A语类标记的语类A B和A B表示属于不同句法范畴而具有相同语义范畴的语类 语类一览表 句法规则 句子依照费雷格原理 通过短语有小到大的结合而逐渐产生短语之间的结合通过句法规则来实现典型的句法规则Sn如果 PA PB 那么Fm PC 且Fm 基本规则 S1对于任何A语类来说 BA 即A类基本词语 PA 即A类短语 S3如果 PCN Pt 那么F3 n PCN 且F3 n s t 其中 来自 并根据 中第一个BCN的 阳 阴 中 性 用 he she it 或 him her it 来提换 中的每一个hen或himn S2如果 PCN 那么F0 F1 F2 PT 且F0 every F1 the F2 不是a 就是an 具体情况依中第一词和或搭配形式而定 合取和析取规则 S11和S13处理有and或or连接的合取或析取短语S11如果 Pt 那么F8 F9 Pt 且F8 and F9 or 量化规则 S14至S16为量化规则S14 PT PT 那么F10 PT 且 如果 不是hek形式短语 即不是传统意义上的人称代词 那么F10 就等于将 中第一个hen或himn用 代替 其后出现的hen或himn则根据 中第一个BCN或BT的性用 he she it 或 him her it 替换如果 hek 则F10 等于将 中所有的hen或himn用hek或himk来替换 时态及记号规则 S17为时态及记号规则 MG翻译部分 MG为表示句法和语义的同态性 通常将句子翻译成内涵逻辑表达式每一条句法规则都有相对应的一条翻译规则 MG翻译部分 表示 的内涵 表示 的外延P a P a 叫做括号等式 谓词变项P表示个体集合的属性人名和代词在MG中的依法分别为 P P P P hen 变换 变换指的是把主目代入含有 算子指定的那个变项的表达式中 并消掉 及变项 x x a a 函数应用规则 S4至S10将A B语类的短语与B语类的短语结合而产生A语类的短语S4如果 Pt IV PIV 那么F4 Pt 且F4 其中 是将 中的第一个动词替换成第三人称单数形式的结果 MG语义部分 MG内涵逻辑有句法和语义两部分组成句法部分主要确定内涵逻辑表达式义类问题语义部分主要有语义规则组成 这些规则根据模型来确定内涵逻辑表达式中的所指问题 MG内涵逻辑句法部分 内涵逻辑的句法主要确定内涵逻辑表达式的逻辑义类 logicaltype 问题基本义类有两个 e和te表示个体t表示真值义类和语类是不同的概念 义类的递归性的定义 t是一个义类 e是一个义类 如果a和b是义类 那么是一个义类 如果a是义类 则是一个义类其中表示一个由a向b映射的函数 表示a的内涵 义类与语类的对应关系 义类与语类一一对应 有一个函数关系 用f表示f t tf e e对于任何A B语类来说 f A B f A B f A MG内涵逻辑句法 基本成分常项变项内涵逻辑句法部分的作用主要是确定内涵逻辑表达式的义类 其规则表述如下 义类中的每一个变项都属于ME 即 义类的有意义词语 义类中的每一个常项都属于ME 如果 ME u为b义类变项 则 u ME 如果 ME ME 则 MEb 等等 MG内涵逻辑语义部分 内涵逻辑模型语义规则 主要确定内涵逻辑表达式的所指问题 内涵逻辑模型 具体表述如下Da ADt 0 1 D D 其中Da表示a的所指 denotation E的所指为模型中的个体集合 t的所指为一个真值集合 的所指是一个由a所指向b所指映射的函数 是a的内涵 内涵逻辑的语义规则 如果 是一个非逻辑常项 则如果 是一个变项 内涵逻辑的语义规则 如果 ME 是一个b义类变项 则是一个函数h 其定义域为Db 对于Db中任何一个x来说 其中g 表示对变项y的一次赋值 内涵逻辑的语义规则 如果 ME MEb 则 小结 句法与语义的分界与重叠 小结 语言知识的筛子模型 小结 意义的组合原则 principleofcompositionality 语言中有多少成分的意义可以被 组合 出来 有多少不能被 组合 呢 组合 函数 Meaning s F Meaning s1 Meaning s2 s s1s2
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!