资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,面向百科全书编纂的语言分析及知识更新平台,2004年2月24日,1,内容,项目的提出,项目的意义,主要任务与目标,最终成果形式,2,项目的提出,合作单位:中国大百科全书出版社,成立于1978年,主要从事各类百科全书的编纂与出版。,最具代表性的出版物中国大百科全书,第一版:1980年-1993年,第二版:已耗时8年,需求:利用计算机技术和自然语言处理技术为百科全书二版服务。,3,项目的提出,合作契机:,与中国标准化研究院合作项目:“信息科学与技术领域术语辅助提取及术语库的建设”鉴定会;,海南“第二届东亚术语论坛”,感想:,已承担的项目一定要全力做好;,学会宣传自己;,多参加圈内的集体活动;,4,项目的意义,当今时代,科技迅猛发展,各个学科领域的新理论、新技术不断涌现,,与之同步产生的新概念层出不穷。,这种形势为百科全书的编纂和再版提出了新的挑战和任务:需要百科全书进行即时的知识更新,以满足人们对于新知识的渴求。,目前百科全书主要靠百科专家和领域专家人工编纂,其更新速度滞后,远远跟不上科技发展的需求。,需要探索在网络时代编纂百科全书的全新模式,。,5,项目的意义,互联网的高速发展,使得:,电子版本资源的获取越来越方便;,人们之间的交流和合作可以足不出户,通过网络的形式实现多成员之间的分工与协作。,6,项目的意义,计算语言学蓬勃发展。,7,项目的意义,建立“面向百科全书编纂的语言分析及知识更新平台”,利用计算机辅助百科专家对百科全书进行:,语言分析,知识更新,8,主要任务与目标,对,百科资源进行语言分析:,根据全书编纂及再版工作的需要,进行语言分析工具的定制和优化。,9,主要任务与目标,对,百科资源进行知识更新:,人机交互式术语提取及更新;,开放、互联、互动的新术语信息征集及管理,10,最终成果形式,建立“面向百科全书编纂的语言分析及知识更新平台”,利用计算机辅助百科专家对百科全书进行:,语言分析,知识更新,11,语言分析功能示例,主要内容,分词,词性标注,词频统计,词语的分布度统计,12,语言分析功能示例,条目:解释,/,定义,百科全书,卷,学科,分支,条目,逐级向上,统计信息,属性增加,统计数据多种排序,词性,/,常用词,/,术语,13,语言分析的意义,知识的覆盖度,知识的均衡度,知识的新颖度(时间上),14,语言分析的深入,提取关键词,做摘要,学科的相关性分析,机器翻译,15,知识更新功能示例,16,知识更新功能示例,17,知识更新功能示例,18,应用于百科全书编撰的意义,可以发现领域内的新条目,可以验证词条集合的完整性,可以给出条目的使用频度等属性,提高效率和质量,降低费用,19,新术语信息征集及管理背景,网络,加快了信息的交流,拉近了人们的距离,网络协同工作,,尤其适合大规模的公益性知识工程,20,新术语信息征集及管理,构成人员,领域专家,普通用户,管理人员,21,面向百科,对于普通用户,条目更详尽,相关信息和联系更多,实用性更强,22,面向百科,对于专家,自动提取系统与本系统无缝合成,提高效率,词条与语料参照,更为方便,分类调整,更多支持,23,面向百科,对于管理人员,集成语言分析处理,提供更好的内容总体控制,定制的完善的工作流程,提供面向编撰的更好的过程质量控制,24,未来发展,将为人服务的百科全书转变成为计算机服务的百科全书,为智能信息处理提供丰富的机读知识。,25,
展开阅读全文