面向专利文献的机器翻译系统定制.ppt

上传人:zhu****ei 文档编号:5433264 上传时间:2020-01-29 格式:PPT 页数:18 大小:882KB
返回 下载 相关 举报
面向专利文献的机器翻译系统定制.ppt_第1页
第1页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第2页
第2页 / 共18页
面向专利文献的机器翻译系统定制.ppt_第3页
第3页 / 共18页
点击查看更多>>
资源描述
面向专利文献的机器翻译系统定制 SiriussoftCorp 目录 公司简介技术竞争力韩国专利文献的特点定制过程改良需求 2008 11 04 公司简介 Siriussoft目前拥有韩译英 英译韩 韩译日以及日译韩的机器翻译技术 公司计划扩展机器翻译所涵盖语种 如汉译韩 德译英 法译英以及俄译英 3 现行经营模式产品 集成有机器翻译引擎的在线专利检索系统韩国专利 K2E PAT EP US JP PCT专利 E2K 平台 KIPRIS网站 eng kipris or kr PIE网站 目标客户 终端用户一千四百万KIRRIS用户研究人员 信息专家个人发明者 专利律师等价格 30 篇 K2E 篇幅不限 公司简介 终端用户 研究人员 个人发明者 专利律师 信息专家 公司简介 历史与成就 2020 01 29 5 机器翻译 计算语言学的分支学科 研究如何运用计算机软件将文本或语音从一种自然语言翻译为另一种自然语言 语素处理技术句法处理技术语义处理技术语境处理技术句子生成技术 技术竞争力 源语句 语素分析器 句法分析器 词典 知识库 语境处理 语法库 生成器 目标语句 分析 语法 技术竞争力 专利领域专用MT系统词典和语法的涵盖范围限制在专利领域文章 使输出译文具有高准确度 K2E专利机器翻译系统K2J专利机器翻译系统E2K专利机器翻译系统J2K专利机器翻译系统MT方法K E引擎 以 基于模板 为主的机器翻译K J引擎 基于规则的机器翻译 将来会用到混合方法 目标文本 基于规则 基于模板 基于统计 词法分析 源文本 混合机器翻译系统 技术竞争力 专利技术 ETRI 多语言翻译设备中用于识别多语言短语的系统 KR0261273 基于概念的跨国语言翻译系统的自动语法修正方法 KR0204068 对大量机器翻译请求的快速响应翻译记忆例 OppositiontoUtilityModelRegistration例 Theduedateofsubmissionoftheamendmentforthepresentapplicationisnotalloweduntiltheaboveduedate 对同一个机器翻译请求进行分布式计算负载平衡技术多样与便捷的API网络翻译 批量翻译 电子文件翻译等 语序差异英语是SVO语言 而韩语是SOV语言格标记英语中不存在格标记没有对应于 的英文词冠词韩语中不存在冠词通常不被翻译成特定的词 韩国专利文献的特点 Heatethecookies SOV SVO 韩国专利文献的特点 间隔单位不同英语词与语素相对应不需要改变间隔单位韩语词 eojeol 与语素不同需要改变间隔单位 Eojeol是人性化的间隔单位主语韩语语句中 主语可以省略英语语句的主语不能被对应到一个韩语词汇 韩国专利文献的特点 专利文献极长又复杂的句子 韩语专利文献中 句子由平均14 5个Eojeol组成 韩语新闻文章中 句子由平均12 3个Eojeol组成独特的句型摘要例 本发明涉及 发明内容详述例 根据现有技术 如图N所示附图简要说明例 图n是用于说明 的视图有益效果例 本发明的有益效果在于 权利要求例 如权利要求n所述的 进一步包括 11 定制过程 半自动词典创建过程通过包含在专利文献中的括号提取韩英语对双语专利标题语料库双语专利标题 12 TFT ThineFilmTransistor patterning etching deposition 定制过程 手动词典创建过程日常处理机器翻译过程中未得到翻译的词汇被自动报告给翻译人员年度处理术语从一年中的韩语专利文献中抽取 新术语自动识别 新术语人工翻译 加入到字典 13 定制过程 名字翻译过程包含在PCT等同专利 申请代码 公司网站及罗马字体书写规则中的英文名 14 定制过程 语句模板创建过程手工创建专利特有语句模板例1 源文本 KR模板 NP1 匹配模板 NP1thatbe vachievedbythepresentinvention 目标文本 Thesystemthatisachievedbythepresentinventionisdeveloped 例2 源文本 KR模板 NP1 NP2 VP1 匹配模板 NP1 Topic VP1comparedtoNP2 目标文本 TheInventionimprovedperformancecomparedtothepriorart 15 定制过程 消除词语歧义DB建设 IPC的统计信息例 韩语词 可以被翻译成 电子领域中的 磁极 医药领域中的 刺激 16 改良需求 源语句自身的错误间隔错误例 synchronizationplan eastevaporationplan sameperiodfireplan sameperiodstudioplan 拼写错误 源句改写机器翻译系统错误通常出现在长句和复杂句中 混合方法缺少语言资源专利领域中的双语文本 PCT等同专利
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!