世界上每一个国家或民族都有自己的语言文字.ppt

上传人:sh****n 文档编号:7434858 上传时间:2020-03-21 格式:PPT 页数:39 大小:296KB
返回 下载 相关 举报
世界上每一个国家或民族都有自己的语言文字.ppt_第1页
第1页 / 共39页
世界上每一个国家或民族都有自己的语言文字.ppt_第2页
第2页 / 共39页
世界上每一个国家或民族都有自己的语言文字.ppt_第3页
第3页 / 共39页
点击查看更多>>
资源描述
世界上每一个国家或民族都有自己的语言文字 它是人们表达思想 交流信息的工具 知识表示是人工智能研究的一个重要课题 也是机器翻译重要的一环 无论是词法分析 句法分析 语法分析和语义分析等 要建立各种规则 首先遇到的就是所涉及的知识如何加以表示 不同的分析方式有不同的知识表示方法 这里不单是解决如何将知识存储在计算机中的问题 更重要的是应该能够方便且正确地使用知识 合理的知识表示 可以使机器翻译中分析环节变得容易 提高机译效率 一个好的知识表示方法应具备以下特点 1 具有表示机器翻译某部分分析所需要知识的能力 并保证知识是相容的 2 具有从已知知识推到出新知识的能力 容易建立表达新知识所需要的新结构 3 便于新知识的获取 最简单的情况是能够由人直接输入知识到相应模块中 4 便于分析的完成 且是高效率的 表示是为解决某一特定问题所作的一组约定 是知识的形式化或符号化过程 知识表示是关于各种数据结构及其解释过程的结合 知识表示的方法研究各种数据结构的设计 以把一个问题的各种知识通过这些数据结构最后以程序实现 正如我们可以用不同的方式描述同一事物一样 对于同一种知识可以采用不同的表示方法 从理论上讲 任一种知识只要采用一种模式表示出来就行了 但不同的表示方法会带来分析的难易程度不同 迄今为止 还没有找到一种通用 完善的知识表示模式 知识表示还没有完善的理论可循 知识表示针对一个具体问题把已有的知识以某种方法存储在计算机中 一种表示方法的选取往往由问题的自然结构所导致 如果一个问题是基于唯一经验的结合 表达方法也就是唯一的 知识表示的目的是知识的利用 由于机器翻译系统研究的特点 知识利用一是各部分的分析 再就是新知识的获取 因此 评价知识表示方法的好坏的准则就是分析的效率和新知识获取能力 知识表示的扩展能力体现在模块中某项知识的增加 删除或修改尽量保持对其余部分不产生大的影响 这就要求表示的单项最小数据结构单元以及应用具有相对的独立性 即表示模式的模块性 模块性的结构以及由这样的结构所产生的软件易于维护 理解 单项的操作易于实现 非模块性结构的问题在于知识的含义取决于知识被利用的上下文 从而单个数据结构的变化往往引起各种交互作用的连琐反应 不同的知识表示模式中 数据结构间所固有的交互作用程度不一 但各种知识的交互作用的控制仍是所有表示模式的重要特征之一 我们不能期望有完全模块化表示的系统 因为模块化同知识表示某些属性有相互制约的地方 各种表示方法的模块化程度不一样 有的较强 知识的检索和推理是系统控制级知识 一个机器翻译系统中一旦知识表示方法选定以后 它们也就相应地被确定下来 如果一种表示方法的数据结构过于复杂 难以实现 则必然给系统控制程序的设计带来很大困难 影响翻译的效率 因此 从对知识的检索和各部分分析来说 知识表示方法在数据结构的组织上应要求尽可能简单 一致 即保持清晰性 清晰的数据结构便于系统的正确性和一致性检查 但另一方面 过于简单 一致的数据结构既不适宜表达复杂问题 同时也会影响系统的效率 谓词逻辑是一种形式语言 也是目前为止能够表达人类思维活动规律的一种最精确的语言 它与人们的自然语言比较接近 又可方便的存储到计算机中作精确的处理 因此 它成为最早应用于人工智能表示知识的一种方法 规则通常用蕴含式表示 例如对于 如果X 则Y 可表示为X Y用谓词公式表示知识时 需要首先定义谓词 指出每个谓词的含义 然后用连接词把有关的谓词连接起来 形成一个表达的完整意义 例 设有下列语句 1 高山比他父亲出名 2 刘水是计算机系的一名学生 但他不喜欢编程序 3 人人爱劳动 为了用谓词公式表示这些语句 应先定义谓词 BIGGER x y x比y出名COMPUTER x x是计算机系的学生LINK x y x喜欢yLOVE x y x爱yM x x是人 此时可用谓词公式把上述三个语句表示为 1 BIGGER 高山 父亲 高山 2 COMPUTER 刘水 LINK 刘水 程序 3 x M x LOVE x labour 例 设有下列语句 1 自然数都是大于零的整数 2 所有整数不是偶数就是奇数 3 偶数除以2是整数 定义谓词如下 N x x是自然数I x x是整数E x x是偶数O x x是奇数GZ x x大于零另外 用函数S x 表示x除以2 此时 上述三个句子可用谓词公式表示为 x N x GZ x I x x I x E x O x x E x I S x 我们能够容易地把语言中各种句子表示为逻辑命题 把各种命题写成合适公式 例如 雨天表示为RAINING晴天表示为SUNNY雾天表示为FOGGY若为雨天 则非晴天表示为RAINING SUNNY 应用这些命题 能够译出 如果天下雨就不是晴天 的原意 但是 命题逻辑的结构需要规范 例如 李明是个工人可写为LIWORKER如果还要表示王华也是个工人应写出WANGWORKER这是一些完全独立的格式 可以规范为如下形式 WORKER LI WORKER WANG 这就要好得多 因为上述表达结构反映知识本身的结构 谓词逻辑的基本组成部分是谓词符号 变量符号 函数符号和常量符号 并用圆括弧 方括弧 花括弧和逗号隔开 以表示论域内的关系 例如 函数符号mother可用来表示某人与他 或她 的母亲之间的一个映射 可用下列公式表示 李 LI 的母亲与他的父亲结婚 这个句子 MARRIED father LI mother LI 一般用大写字母串表示谓词符号 小写字母串表示函数符号 如father和mother等 在谓词分析中 一个合适的公式可以通过规定语言的元素在论域内的对应关系来解释 对于每个谓词符号 必须规定定义域内的一个相应关系 对于每个常量符号 必须规定定义域内的一个相应实体 对于每个函数符号 必须规定定义域内的一个相应函数 这些规定确定了谓词分析语言的语义 在应用中 用谓词分析明确表示有关论域内的确定语句 对于已经定义了的某个解释的公式 只有当其对应的语句在定义域内为真时 才具有值T 真 而当对应的语句在定义域内为假时 才具有值F 假 当一个公式含有变量符号时 对定义域内实体的变量可能有几个设定 原子公式是谓词分析的基本积木块 应用连词 与 或 以及 蕴含 等 能够构成比较复杂的合适公式 连词 用来表示复合句子 例如 句子 我喜欢音乐和绘画 可写成 LIKE I MUSIC LIKE I PAINTING 此外 某些较简单的句子也可以写成复合形式 例如 李住在一幢黄色的房子里 即可用LIVES LI HOUSE 1 COLOR HOUSE 1 YELLOW 来表示 谓词LIVES表示人与物体 房子 间的关系 而谓词COLOR则表示物体与其颜色之间的关系 用连词 把几个公式连接起来构成的公式叫做合取 而此合取式的每个组成部分叫做合取项 连词 用来表示 或 关系 例如 句子 李明打篮球或踢足球 可表示为 PLAYS LIMING BASKETBALL PLAYS LIMING FOOTBALL 用连词 把几个公式连接起来所构成的公式叫做析取 而次析取式的每一组成部分叫做析取项 合取和析取的真值由其组成部分的真值决定 如果每个合取项均取值T 则其合取值为T 否则合取值为F 如果析取项中至少有一个取T值 则其析取值为T 否则取值F 连词 用来表示 如果 那么 的词句 例如 句子 如果该书是何平的 那么它是蓝色 封面 的 可表示为OWNS HEPLING BOOK 1 COLOR BOOK 1 BULE 又如 句子 如果刘华跑得最快 那么他取得冠军 可表示为RUNS LIUHUA FASTEST WINS LIUHUA CHAMPION 用连词 连接两个公式所构成的公式叫做蕴含 蕴含的左式叫做前项 右式叫做后项 如果前项和后项都是合适公式 那么蕴含也是合适公式 符号 非 用来否定一个公式的真值 也就是说 把一个合适公式的取值从T变为F 或从F变为T 例如 机器人不在2号房间内 可表示为 INROOM ROBOT r2 前面具有符号 的公式叫做否定 一个合适公式的否定也是合适公式 如果把句子限制为至今已介绍过的造句法所能表示的那些句子 而且也不使用变量项 那么可以把这个谓词分析的子集叫做命题分析 命题分析对于许多简化了的定义域来说 是一种有效的表示 但它缺乏用有效的方法来表达多个命题的能力 要扩大命题分析的能力 需要公式中的命题带有变量 有时 一个公式如P x 对于所有可能的变量x都具有值T 这个特性可由在P x 前面加上全称量词 x 来表示 如果至少有一个x值可使P x 具有值T 那么这一特性可由在P x 前面加上存在量词 x 来表示 例如 句子 所有的机器人都是灰色的 可表示为 x ROBOT x COLOR x GRAY 而句子 1号房间内有个物体 可表示为 x INROOM x r1 这里 x是被量化了的变量 量化一个合适公式上的某个变量所得到的表达式也是合适公式 如果一个合适公式中某个变量是经过量化的 就把这个变量叫做约束变量 否则就叫它自由变量 在合适公式中 所有的变量都是受约束的 这样的合适公式叫做句子 1 自然性谓词逻辑是一种接近于自然语言的形式语言 人们比较容易接受 用它表示的知识比较容易理解 2 精确性谓词逻辑是二值逻辑 其谓词公式的真值只有 真 与 假 两个 因此可以用它表示精确的知识 3 容易实现用谓词逻辑表示的知识可以比较容易地转换为计算机的内部形式 其分析过程都容易在计算机上实现 1 效率低用谓词逻辑表示知识时 把推导与知识的语义分开了 这使得推导过程变长 降低了系统的翻译速度 2 灵活性差谓词逻辑表示法只能表示精确的知识 不能表示不精确的知识 而人类的知识中有许多不精确或是模糊的知识 这就使得表示知识的范围受到了限制 单元表示是从谓词逻辑引伸过来的一种知识表示方法 它将所有的信息描述为一组单元 每个单元建立一些槽 通过填充槽值的办法 描述事物之间的逻辑关系 下面给出一个单元的例子 G self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOK 它描述的是这样一个事件 JOHN给了MARY一本书 其中self giver等在 左边的部分称为槽名 而 element ofGIVING EVENTS JOHN等在 右边的部分称为槽值 其中的self称为伪槽 它没有具体的逻辑意义 只是说明了给东西事件G1是属于给东西事件集GIVING EVENTS中的一个元素 因而上例可以进一步理解为 G1属于一个给东西事件 该事件中的给者是JOHN 接收者是MARY 所给的东西是书 通过以上分析 单元表达的是在谓词逻辑中以二元谓词出现的逻辑关系 上式若用合适公式表达出来就是EL G1 GINING EVENTS giver G1 JOHN recip G1 MARY obj G1 BOOK 在谓词逻辑中 可以通过简单的办法将一个多元关系转换为二元关系 实际上上述公式就是三元关系give JOHN MARY BOOK 的一种二元表示 单元表示法的主要优点是模块化 可以很容易的添加新信息 例如要表示出给东西事件所发生的时间 则只需增添一个表示时间的槽就可以了 而不必修改其它内容 有时槽值可以不是常量符号 如JOHN 而是一个函数表达式 特别是这个函数可能相当于另一单元的槽名 这样对于下面的事件 John给了Mary一本书 Bill把钢笔给了从John那里得到书的那个人 我们可以用以下单元表示 G1self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOKG2self element ofGIVING EVENTS giver BILLrecip recip G1 obj PEN在这个例子中 recip G1 和MARY是描述同一个人的两种不同的表示方法 G2中recip的槽值 可以通过计算recip G1 值 即在G1中检索recip的槽值得到 槽值也可以是一个存在量词量化的变量 例如要表示句子某人给了Mary一本书 则槽giver的值可以用人的集合PERSONS中的一员的办法给出 G3self element ofGIVING EVENTS giver element ofPERSONS recip MARYobj BOOK 同样 对于JOHN MARY和BOOK等实体也可以用下述单元描述 JOHNself element ofPERSONS MARYself element ofPERSONS BOOKself element ofPHYS OBJS 从以上例子可以看出 有关集合和集合的成员关系的概念起了很重要的作用 所以有些特殊的集合描述是很有帮助 为了描述由一些个体构成的集合 可以使用函数the set of 例如the set of JOHN MARY BKLL 还可以使用intersection union以及complement等函数来分别表示集合的或 与 非等 使用这些有关集合的函数 可以有效地表达析取和否定语句 例如句子 Jone买了一支笔 它是钢笔或是圆珠笔 但不是红色的 可以用下述单元表示 B1self element ofGIVING EVENTS buyer JOHNbought element ofintersection union PENS BALL PEN complement RED THINGS 而句子 John把书给了Mary或者Bill 可以表示为 G4self element ofGIVING EVENTS giver JOHNrecip element ofthe set of MARY BILL obj BOOK 有了事件的单元表示 可以通过匹配的方法得到一个提问的解答 假设有以下事实单元 G1self element ofGIVING EVENTS giver JOHNrecip MARYobj BOOKG2self element ofGIVING EVENTS giver BILLrecip recip G1 obj PEN 可以提问 Bill给了谁钢笔 该提问可用以下的目标单元表示 Xself element ofGIVING EVENTS giver BILLrecip yobj PEN该目标单元与事实单元G2匹配的过程将置换 G2 X recip G1 y 因recip G1 是一个函数 通过在G1中检索recip值来得到该函数的值 从而得到最终的置换 G2 X MARRY y 这样就得到了上述提问的解答 对于谓词逻辑中的蕴含关系 也可以使用单元表示 例如句子所有计算机系的学生都已经取得毕业文凭起蕴含式可以写为EL x CS STUDENTS EQ class x GRAD 对于这类蕴含关系 可以用被称为描绘单元的单元来表示 一个描绘单元描述了另一个单元所标记的集合的每一个体的特性 例如 上述例可以表达为下面的一个单元和为该单元的每一个体进行说明的描绘单元 CS STUDENDSself subset ofSTUDENDS x CS STUDENDSmajor CSclass GRAD其中x CS STUDENDS的含义为X是一个虚拟的典型个体 其定义域是集合CS STUDENDS 假设有事实 John是计算机系的学生 并想得到目标 John是一个毕业了的学生 首先将事实和目标表示为单元形式 事实单元JOHNself element ofCS STUDENDS 目标单元class GRAD可以正向或逆向地使用描绘单元来达到我们的目的 当正向使用时 要注意x CS STUDENDS与事实单元JOHN相匹配 分量的变量x与CS STUDENDS的任一元素相匹配 描绘单元应用于事实 从而对它增添了新的槽 major CS 和 class GRAD 因而扩展之后的事实单元JOHN就与目标单元相匹配了 当逆向使用描绘单元时 它首先应用于目标单元 从而产生子目标单元JOHNself element ofCS STUDENDS 由于该子目标单元正好与原始的事实单元相匹配 所以得出目标单元是可以证明的 描绘单元只能描述那些可以解释成只表示有关集合成员的信息的那些蕴含表达式 而对于有些较复杂的蕴含关系则无能为力了 为此 可以引入单元规则的概念 每个单元规则有前后两部分 且均由一些单元组成 例如 要表示 若y是x部门的经理 则y在x部门工作 这一规则 可以表示为如下的蕴含式 EL x DEPARTMENTS EQ manager x y EQ works inly x 用单元规则表示出来就是R1ANTE xself element ofDEPARTMENTS manager yCONSE yworks in x 同描绘单元一样 单元规则可以用于分析系统 当正向使用单元规则时 如果前项中的全部单元都与事实单元匹配 则后项中的那些单元可以添加到事实单元集中去 当对一目标单元逆向使用一条单元规则时 后项单元中的一个单元必须与目标单元匹配 如果匹配成功 则前项中的单元被设置为子目标单元 然后以这些子目标单元为新的目标单元 再反复地进行逆向推理 直到所有的新的目标都与事实单元匹配为止 在对子目标单元集合 合取式 应用逆向单元规则时就要复杂一些 知识表示是人工智能系统各个学科领域共同关心的一个热门课题 也是机器翻译各模块分析所需要的一项重要技术 本章只介绍了部分与机器翻译相关的知识表示 事实上 人工智能研究者还开发了许多其它的知识表示方法 如特性表表示方法 脚本表示方法 概念从属表示方法和基于图的状态空间表示方法等等 然而 尽管知识表示的技术和理论研究已经取得了不少成就 由于人类思维的奥秘还尚未完全揭示 模拟人脑活动的研究工作还处于探索阶段 知识表示中存在的问题还很多 事实上 它还没有形成一个严格的理论体系 缺乏严格的表示标准 知识表示能力同知识获取能力 推理效率之间的矛盾都是显而易见的 尽管知识表示方法问题很多 但由于意义重大 因此潜力也很大 我们应当注重对问题求解的知识进行实用的表示方法设计的研究 开展多种知识表示方法的结合研究 制定一种形式的评价标准 返回
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!