世界上每一个国家或民族都有自己的语言文字.ppt

资源描述

世界上每一个国家或民族都有自己的语言文字它是人们表达思想交流信息的工具知识表示是人工智能研究的一个重要课题也是机器翻译重要的一环无论是词法分析句法分析语法分析和语义分析等要建立各种规则首先遇到的就是所涉及的知识如何加以表示不同的分析方式有不同的知识表示方法这里不单是解决如何将知识存储在计算机中的问题更重要的是应该能够方便且正确地使用知识合理的知识表示可以使机器翻译中分析环节变得容易提高机译效率一个好的知识表示方法应具备以下特点 1 具有表示机器翻译某部分分析所需要知识的能力并保证知识是相容的 2 具有从已知知识推到出新知识的能力容易建立表达新知识所需要的新结构 3 便于新知识的获取最简单的情况是能够由人直接输入知识到相应模块中 4 便于分析的完成且是高效率的表示是为解决某一特定问题所作的一组约定是知识的形式化或符号化过程知识表示是关于各种数据结构及其解释过程的结合知识表示的方法研究各种数据结构的设计以把一个问题的各种知识通过这些数据结构最后以程序实现正如我们可以用不同的方式描述同一事物一样对于同一种知识可以采用不同的表示方法从理论上讲任一种知识只要采用一种模式表示出来就行了但不同的表示方法会带来分析的难易程度不同迄今为止还没有找到一种通用完善的知识表示模式知识表示还没有完善的理论可循知识表示针对一个具体问题把已有的知识以某种方法存储在计算机中一种表示方法的选取往往由问题的自然结构所导致如果一个问题是基于唯一经验的结合表达方法也就是唯一的知识表示的目的是知识的利用由于机器翻译系统研究的特点知识利用一是各部分的分析再就是新知识的获取因此评价知识表示方法的好坏的准则就是分析的效率和新知识获取能力知识表示的扩展能力体现在模块中某项知识的增加删除或修改尽量保持对其余部分不产生大的影响这就要求表示的单项最小数据结构单元以及应用具有相对的独立性即表示模式的模块性模块性的结构以及由这样的结构所产生的软件易于维护理解单项的操作易于实现非模块性结构的问题在于知识的含义取决于知识被利用的上下文从而单个数据结构的变化往往引起各种交互作用的连琐反应不同的知识表示模式中数据结构间所固有的交互作用程度不一但各种知识的交互作用的控制仍是所有表示模式的重要特征之一我们不能期望有完全模块化表示的系统因为模块化同知识表示某些属性有相互制约的地方各种表示方法的模块化程度不一样有的较强知识的检索和推理是系统控制级知识一个机器翻译系统中一旦知识表示方法选定以后它们也就相应地被确定下来如果一种表示方法的数据结构过于复杂难以实现则必然给系统控制程序的设计带来很大困难影响翻译的效率因此从对知识的检索和各部分分析来说知识表示方法在数据结构的组织上应要求尽可能简单一致即保持清晰性清晰的数据结构便于系统的正确性和一致性检查但另一方面过于简单一致的数据结构既不适宜表达复杂问题同时也会影响系统的效率谓词逻辑是一种形式语言也是目前为止能够表达人类思维活动规律的一种最精确的语言它与人们的自然语言比较接近又可方便的存储到计算机中作精确的处理因此它成为最早应用于人工智能表示知识的一种方法规则通常用蕴含式表示例如对于如果X 则Y 可表示为X Y用谓词公式表示知识时需要首先定义谓词指出每个谓词的含义然后用连接词把有关的谓词连接起来形成一个表达的完整意义例设有下列语句 1 高山比他父亲出名 2 刘水是计算机系的一名学生但他不喜欢编程序 3 人人爱劳动为了用谓词公式表示这些语句应先定义谓词 BIGGER x y x比y出名COMPUTER x x是计算机系的学生LINK x y x喜欢yLOVE x y x爱yM x x是人此时可用谓词公式把上述三个语句表示为 1 BIGGER 高山父亲高山 2 COMPUTER 刘水 LINK 刘水程序 3 x M x LOVE x labour 例设有下列语句 1 自然数都是大于零的整数 2 所有整数不是偶数就是奇数 3 偶数除以2是整数定义谓词如下 N x x是自然数I x x是整数E x x是偶数O x x是奇数GZ x x大于零另外用函数S x 表示x除以2 此时上述三个句子可用谓词公式表示为 x N x GZ x I x x I x E x O x x E x I S x 我们能够容易地把语言中各种句子表示为逻辑命题把各种命题写成合适公式例如雨天表示为RAINING晴天表示为SUNNY雾天表示为FOGGY若为雨天则非晴天表示为RAINING SUNNY 应用这些命题能够译出如果天下雨就不是晴天的原意但是命题逻辑的结构需要规范例如李明是个工人可写为LIWORKER如果还要表示王华也是个工人应写出WANGWORKER这是一些完全独立的格式可以规范为如下形式 WORKER LI WORKER WANG 这就要好得多因为上述表达结构反映知识本身的结构谓词逻辑的基本组成部分是谓词符号变量符号函数符号和常量符号并用圆括弧方括弧花括弧和逗号隔开以表示论域内的关系例如函数符号mother可用来表示某人与他或她的母亲之间的一个映射可用下列公式表示李 LI 的母亲与他的父亲结婚这个句子 MARRIED father LI mother LI 一般用大写字母串表示谓词符号小写字母串表示函数符号如father和mother等在谓词分析中一个合适的公式可以通过规定语言的元素在论域内的对应关系来解释对于每个谓词符号必须规定定义域内的一个相应关系对于每个常量符号必须规定定义域内的一个相应实体对于每个函数符号必须规定定义域内的一个相应函数这些规定确定了谓词分析语言的语义在应用中用谓词分析明确表示有关论域内的确定语句对于已经定义了的某个解释的公式只有当其对应的语句在定义域内为真时才具有值T 真而当对应的语句在定义域内为假时才具有值F 假当一个公式含有变量符号时对定义域内实体的变量可能有几个设定原子公式是谓词分析的基本积木块应用连词与或以及蕴含等能够构成比较复杂的合适公式连词用来表示复合句子例如句子我喜欢音乐和绘画可写成 LIKE I MUSIC LIKE I PAINTING 此外某些较简单的句子也可以写成复合形式例如李住在一幢黄色的房子里即可用LIVES LI HOUSE 1 COLOR HOUSE 1 YELLOW 来表示谓词LIVES表示人与物体房子间的关系而谓词COLOR则表示物体与其颜色之间的关系用连词把几个公式连接起来构成的公式叫做合取而此合取式的每个组成部分叫做合取项连词用来表示或关系例如句子李明打篮球或踢足球可表示为 PLAYS LIMING BASKETBALL PLAYS LIMING FOOTBALL 用连词把几个公式连接起来所构成的公式叫做析取而次析取式的每一组成部分叫做析取项合取和析取的真值由其组成部分的真值决定如果每个合取项均取值T 则其合取值为T 否则合取值为F 如果析取项中至少有一个取T值则其析取值为T 否则取值F 连词用来表示如果那么的词句例如句子如果该书是何平的那么它是蓝色封面的可表示为OWNS HEPLING BOOK 1 COLOR BOOK 1 BULE 又如句子如果刘华跑得最快那么他取得冠军可表示为RUNS LIUHUA FASTEST WINS LIUHUA CHAMPION 用连词连接两个公式所构成的公式叫做蕴含蕴含的左式叫做前项右式叫做后项如果前项和后项都是合适公式那么蕴含也是合适公式符号非用来否定一个公式的真值也就是说把一个合适公式的取值从T变为F 或从F变为T 例如机器人不在2号房间内可表示为 INROOM ROBOT r2 前面具有符号的公式叫做否定一个合适公式的否定也是合适公式如果把句子限制为至今已介绍过的造句法所能表示的那些句子而且也不使用变量项那么可以把这个谓词分析的子集叫做命题分析命题分析对于许多简化了的定义域来说是一种有效的表示但它缺乏用有效的方法来表达多个命题的能力要扩大命题分析的能力需要公式中的命题带有变量有时一个公式如P x 对于所有可能的变量x都具有值T 这个特性可由在P x 前面加上全称量词 x 来表示如果至少有一个x值可使P x 具有值T 那么这一特性可由在P x 前面加上存在量词 x 来表示例如句子所有的机器人都是灰色的可表示为 x ROBOT x COLOR x GRAY 而句子 1号房间内有个物体可表示为 x INROOM x r1 这里 x是被量化了的变量量化一个合适公式上的某个变量所得到的表达式也是合适公式如果一个合适公式中某个变量是经过量化的就把这个变量叫做约束变量否则就叫它自由变量在合适公式中所有的变量都是受约束的这样的合适公式叫做句子 1 自然性谓词逻辑是一种接近于自然语言的形式语言人们比较容易接受用它表示的知识比较容易理解 2 精确性谓词逻辑是二值逻辑其谓词公式的真值只有真与假两个因此可以用它表示精确的知识 3 容易实现用谓词逻辑表示的知识可以比较容易地转换为计算机的内部形式其分析过程都容易在计算机上实现 1 效率低用谓词逻辑表示知识时把推导与知识的语义分开了这使得推导过程变长降低了系统的翻译速度 2 灵活性差谓词逻辑表示法只能表示精确的知识不能表示不精确的知识而人类的知识中有许多不精确或是模糊的知识这就使得表示知识的范围受到了限制单元表示是从谓词逻辑引伸过来的一种知识表示方法它将所有的信息描述为一组单元每个单元建立一些槽通过填充槽值的办法描述事物之间的逻辑关系下面给出一个单元的例子 G self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOK 它描述的是这样一个事件 JOHN给了MARY一本书其中self giver等在左边的部分称为槽名而 element ofGIVING EVENTS JOHN等在右边的部分称为槽值其中的self称为伪槽它没有具体的逻辑意义只是说明了给东西事件G1是属于给东西事件集GIVING EVENTS中的一个元素因而上例可以进一步理解为 G1属于一个给东西事件该事件中的给者是JOHN 接收者是MARY 所给的东西是书通过以上分析单元表达的是在谓词逻辑中以二元谓词出现的逻辑关系上式若用合适公式表达出来就是EL G1 GINING EVENTS giver G1 JOHN recip G1 MARY obj G1 BOOK 在谓词逻辑中可以通过简单的办法将一个多元关系转换为二元关系实际上上述公式就是三元关系give JOHN MARY BOOK 的一种二元表示单元表示法的主要优点是模块化可以很容易的添加新信息例如要表示出给东西事件所发生的时间则只需增添一个表示时间的槽就可以了而不必修改其它内容有时槽值可以不是常量符号如JOHN 而是一个函数表达式特别是这个函数可能相当于另一单元的槽名这样对于下面的事件 John给了Mary一本书 Bill把钢笔给了从John那里得到书的那个人我们可以用以下单元表示 G1self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOKG2self element ofGIVING EVENTS giver BILLrecip recip G1 obj PEN在这个例子中 recip G1 和MARY是描述同一个人的两种不同的表示方法 G2中recip的槽值可以通过计算recip G1 值即在G1中检索recip的槽值得到槽值也可以是一个存在量词量化的变量例如要表示句子某人给了Mary一本书则槽giver的值可以用人的集合PERSONS中的一员的办法给出 G3self element ofGIVING EVENTS giver element ofPERSONS recip MARYobj BOOK 同样对于JOHN MARY和BOOK等实体也可以用下述单元描述 JOHNself element ofPERSONS MARYself element ofPERSONS BOOKself element ofPHYS OBJS 从以上例子可以看出有关集合和集合的成员关系的概念起了很重要的作用所以有些特殊的集合描述是很有帮助为了描述由一些个体构成的集合可以使用函数the set of 例如the set of JOHN MARY BKLL 还可以使用intersection union以及complement等函数来分别表示集合的或与非等使用这些有关集合的函数可以有效地表达析取和否定语句例如句子 Jone买了一支笔它是钢笔或是圆珠笔但不是红色的可以用下述单元表示 B1self element ofGIVING EVENTS buyer JOHNbought element ofintersection union PENS BALL PEN complement RED THINGS 而句子 John把书给了Mary或者Bill 可以表示为 G4self element ofGIVING EVENTS giver JOHNrecip element ofthe set of MARY BILL obj BOOK 有了事件的单元表示可以通过匹配的方法得到一个提问的解答假设有以下事实单元 G1self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOKG2self element ofGIVING EVENTS giver BILLrecip recip G1 obj PEN 可以提问 Bill给了谁钢笔该提问可用以下的目标单元表示 Xself element ofGIVING EVENTS giver BILLrecip yobj PEN该目标单元与事实单元G2匹配的过程将置换 G2 X recip G1 y 因recip G1 是一个函数通过在G1中检索recip值来得到该函数的值从而得到最终的置换 G2 X MARRY y 这样就得到了上述提问的解答对于谓词逻辑中的蕴含关系也可以使用单元表示例如句子所有计算机系的学生都已经取得毕业文凭起蕴含式可以写为EL x CS STUDENTS EQ class x GRAD 对于这类蕴含关系可以用被称为描绘单元的单元来表示一个描绘单元描述了另一个单元所标记的集合的每一个体的特性例如上述例可以表达为下面的一个单元和为该单元的每一个体进行说明的描绘单元 CS STUDENDSself subset ofSTUDENDS x CS STUDENDSmajor CSclass GRAD其中x CS STUDENDS的含义为X是一个虚拟的典型个体其定义域是集合CS STUDENDS 假设有事实 John是计算机系的学生并想得到目标 John是一个毕业了的学生首先将事实和目标表示为单元形式事实单元JOHNself element ofCS STUDENDS 目标单元class GRAD可以正向或逆向地使用描绘单元来达到我们的目的当正向使用时要注意x CS STUDENDS与事实单元JOHN相匹配分量的变量x与CS STUDENDS的任一元素相匹配描绘单元应用于事实从而对它增添了新的槽 major CS 和 class GRAD 因而扩展之后的事实单元JOHN就与目标单元相匹配了当逆向使用描绘单元时它首先应用于目标单元从而产生子目标单元JOHNself element ofCS STUDENDS 由于该子目标单元正好与原始的事实单元相匹配所以得出目标单元是可以证明的描绘单元只能描述那些可以解释成只表示有关集合成员的信息的那些蕴含表达式而对于有些较复杂的蕴含关系则无能为力了为此可以引入单元规则的概念每个单元规则有前后两部分且均由一些单元组成例如要表示若y是x部门的经理则y在x部门工作这一规则可以表示为如下的蕴含式 EL x DEPARTMENTS EQ manager x y EQ works inly x 用单元规则表示出来就是R1ANTE xself element ofDEPARTMENTS manager yCONSE yworks in x 同描绘单元一样单元规则可以用于分析系统当正向使用单元规则时如果前项中的全部单元都与事实单元匹配则后项中的那些单元可以添加到事实单元集中去当对一目标单元逆向使用一条单元规则时后项单元中的一个单元必须与目标单元匹配如果匹配成功则前项中的单元被设置为子目标单元然后以这些子目标单元为新的目标单元再反复地进行逆向推理直到所有的新的目标都与事实单元匹配为止在对子目标单元集合合取式应用逆向单元规则时就要复杂一些知识表示是人工智能系统各个学科领域共同关心的一个热门课题也是机器翻译各模块分析所需要的一项重要技术本章只介绍了部分与机器翻译相关的知识表示事实上人工智能研究者还开发了许多其它的知识表示方法如特性表表示方法脚本表示方法概念从属表示方法和基于图的状态空间表示方法等等然而尽管知识表示的技术和理论研究已经取得了不少成就由于人类思维的奥秘还尚未完全揭示模拟人脑活动的研究工作还处于探索阶段知识表示中存在的问题还很多事实上它还没有形成一个严格的理论体系缺乏严格的表示标准知识表示能力同知识获取能力推理效率之间的矛盾都是显而易见的尽管知识表示方法问题很多但由于意义重大因此潜力也很大我们应当注重对问题求解的知识进行实用的表示方法设计的研究开展多种知识表示方法的结合研究制定一种形式的评价标准返回

展开阅读全文