厦门大学第四届机器翻译研讨会评测系统描述.ppt

上传人:sh****n 文档编号:8732271 上传时间:2020-03-31 格式:PPT 页数:19 大小:320.81KB
返回 下载 相关 举报
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第1页
第1页 / 共19页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第2页
第2页 / 共19页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第3页
第3页 / 共19页
点击查看更多>>
资源描述
厦门大学第四届机器翻译研讨会评测系统描述 陈毅东史晓东周昌乐 ydchen mandel dozero 厦门大学信息科学与技术学院智能科学与技术系2008年11月北京 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 概述 厦门大学参加了汉英新闻领域机器翻译 开放 汉英新闻领域系统融合英汉新闻领域机器翻译 受限 英汉科技领域机器翻译 受限 使用的模型汉英机器翻译 短语 短语 规则英汉机器翻译 短语 规则 规则 使用的融合方法和系统融合评测中使用的相同 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 机器翻译系统概要 1 统计翻译系统短语模型对数线性模型融合特征 短语翻译概率 正向 反向 词汇化短语翻译概率 正向 反向 语言模型 长度惩罚因子 短语惩罚因子单调解码 动态规划方法汉英机器翻译评测中 我们的短语翻译系统则结合了基于组块的词语调序模型 机器翻译系统概要 2 规则翻译系统基本模块 词法分析 句法分析 词义消歧 译文生成采用依存文法描述英语和汉语 文法由程序来描述词典条目大约10万结合了部分TM技术没有专门针对这次评测进行调整 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 系统融合方法概要 1 早在1994年就有研究者研究多引擎翻译系统 多引擎系统的研究可以粗略地分成两类 简单地在各系统的输出中选出一个最佳的结果 从各系统的输出中各选取最佳片段并构成新的结果 由于融合粒度更细 第二类方法常常可以获得更好的融合效果 第二类系统融合技术需要解决的两个问题 必须从候选翻译中抽取出与原文相对应的翻译片段 必须在这些可用的翻译片段中筛选并组合成新的翻译结果 系统融合方法概要 2 参考文献ChenYu AndreasEisele ChristianFedermann EvaHasler MichaelJellinghaus andSilkeTheison 2007 Multi EngineMachineTranslaitonwithanOpen SourceDecoderforStatisticalMachineTranslaiton In ProceedingsoftheSecondWorkshoponStatisticalMachineTranslation Prague 193 196 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 评测数据与结果 1 使用的外部工具GIZA 工具包对双语语料进行词对齐 训练模式是15H53545使用SRI语言模型工具包来训练语言模型使用CRF 工具包来训练组块分析器 汉英测评中 评测数据与结果 2 汉英新闻机器翻译评测数据结果 评测数据与结果 3 汉英新闻系统融合评测根据诸系统在ssmt2007测试集上的成绩仅挑选了前4名的系统参与融合采用的数据情况同汉英新闻机器翻译评测结果constrast系统使用和汉英新闻机器翻译评测相同的参数 primary系统则将长度惩罚因子参数增加到原来的两倍 评测数据与结果 4 英汉新闻机器翻译评测数据情况结果 评测数据与结果 5 英汉科技机器翻译评测数据情况结果xmu constrast memt2系统仅使用科技语料 提纲 概述机器翻译系统概要系统融合方法概要测评数据与结果小结 小结 本次评测我们参加的系统在技术上没有太多的进步 本次评测我们所使用的系统融合技术太简陋 是将来努力的重点 谢谢大家 陈毅东史晓东 ydchen mandel
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!