培训教材分类编码课件

上传人:94****0 文档编号:241015627 上传时间:2024-05-24 格式:PPT 页数:37 大小:444.21KB
返回 下载 相关 举报
培训教材分类编码课件_第1页
第1页 / 共37页
培训教材分类编码课件_第2页
第2页 / 共37页
培训教材分类编码课件_第3页
第3页 / 共37页
点击查看更多>>
资源描述
科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据分类与编码标准科学数据分类与编码标准讲课人:何建邦,曹彦荣时 间:2006年5月24日1科学数据分类与编码标准讲课人:何建邦,曹彦荣1科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训主要内容主要内容1 1编制背景编制背景2 2标准总体结构标准总体结构3 3标准内容要点解析标准内容要点解析4 4标准使用标准使用2主要内容编制背景2科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训简介简介3简介3科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据分类与编码方案p1 1范围范围p2 2规范性引用文件规范性引用文件p3 3术语和定义术语和定义p4 4分类原则分类原则p5 5分类方法分类方法p6 6编码规则编码规则p7 7分类与编码的使用分类与编码的使用p8 8 分类代码表分类代码表4科学数据分类与编码方案1范围4科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训分类类目释义p6 6大大门门类类、3131亚亚门门类类、234234大大类类和和10081008中中类类,共共12791279条条类类目的释义目的释义 5分类类目释义6大门类、31亚门类、234大类和1008中类,科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训电子词典p主要功能主要功能n分类类目的管理分类类目的管理n分类类目的查询分类类目的查询n数据集标引数据集标引n分类映射分类映射n 6电子词典主要功能6科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训转换实例mapping机制p分分别别对对每每个个试试点点的的分分类类作作相相应应的的CrosswalkCrosswalk,实实现现标标准准之之间的映射;间的映射;p试试点点已已有有的的标标引引结结果果可可以以通通过软件直接映射。过软件直接映射。7转换实例mapping机制分别对每个试点的分类作相应的C科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训一、编制背景一、编制背景8一、编制背景8科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训背景背景p海量科学数据的共享需求海量科学数据的共享需求p海量科学数据需要有序组织、管理海量科学数据需要有序组织、管理p科学数据共享工程门户网站需要按照分类来组织数据科学数据共享工程门户网站需要按照分类来组织数据目录目录p数据用户需要从分类编码中查询数据数据用户需要从分类编码中查询数据9背景海量科学数据的共享需求9科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训解决的问题解决的问题p多学科、跨行业部门科学数据的分类多学科、跨行业部门科学数据的分类p分类编码如何应用分类编码如何应用p如何支持网络信息化的数据集分类和共享如何支持网络信息化的数据集分类和共享p与已有科学数据共享工程中诸多试点的分类标准之间与已有科学数据共享工程中诸多试点的分类标准之间如何交互如何交互10解决的问题多学科、跨行业部门科学数据的分类10科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训二、标准总体结构二、标准总体结构11二、标准总体结构11科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训标准目次标准目次p1 1范围范围p2 2规范性引用文件规范性引用文件p3 3术语和定义术语和定义p4 4分类原则分类原则p5 5分类方法分类方法p6 6编码规则编码规则p7 7分类编码的使用分类编码的使用p8 8 分类代码表分类代码表p附附录录A A 资资料料性性附附录录 科科学学数数据据共共享享工程分类编码标准的使用实例工程分类编码标准的使用实例p附附录录B B 资资料料性性附附录录 本本标标准准与与科科学学数数据据共共享享工工程程中中试试点点单单位位的的分分类类标标准之间的映射准之间的映射p附附录录C C 资资料料性性附附录录 科科学学数数据据共共享享工程数据分类编码标准工程数据分类编码标准XMLXML文件文件12标准目次1范围附录A 资料性附录 科学数据共享工程分类编科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训门类门类门类代码代码基础科学基础科学F F资源环境科学资源环境科学R R农业科学农业科学A A工程技术科学工程技术科学T T医药医药卫生卫生科学科学H H区域与综合领域区域与综合领域C C13门类门类代码基础科学F资源环境科学R农业科学A工程技术科学T科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训亚门类(资源环境科学为例)资资源源环环境境亚门类亚门类代码代码气象气候气象气候W W水文水资源水文水资源H H海洋海洋S S地矿与土地资源科学地矿与土地资源科学L L 14亚门类(资源环境科学为例)资源环境亚门类代码气象气候W水文水科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训大类门类门类亚门类亚门类 大类大类代码代码资源环境科资源环境科学学海洋科海洋科学学海洋资源海洋资源1111海洋经济海洋经济1212海洋环境海洋环境1313海洋生态海洋生态1414海洋灾害海洋灾害151515大类门类亚门类大类代码海洋资源11海洋经济12海洋环境13海科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训中类门类门类亚门亚门类类大类大类中类中类代码代码总代码总代码资源资源环境环境科学科学海洋海洋科学科学海洋海洋资源资源海洋自然资源海洋自然资源1111RS1111RS1111海洋生物资源海洋生物资源1212RS1112RS1112大洋矿产资源大洋矿产资源1313RS1113RS1113海水化学资源海水化学资源1414RS1114RS111416中类门类亚门类大类中类代码总代码海洋自然资源11RS1111科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训编码规则p门门类类、亚亚门门类类各各为为1 1位位英英文文字字母母码码,大大类类、中中类类各各2 2位位数数字字码码。采用线分类按门类、亚门类、大类、中类的从属关系顺序编码。采用线分类按门类、亚门类、大类、中类的从属关系顺序编码。第第1 1位位第第2 2位位第第3 3位位第第4 4位位第第5 5位位第第6 6位位门类门类亚门类亚门类大类大类中类中类字母码字母码字母码字母码数字码数字码数字码数字码17编码规则门类、亚门类各为1位英文字母码,大类、中类各2位数字科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训三、标准内容要点解析三、标准内容要点解析18三、标准内容要点解析18科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训分类依据(分类依据(1 1)p遵循遵循“数据分类与编码基本原则与方法数据分类与编码基本原则与方法”标准标准 p数据分类的基本单元(或者说分类的对象)是数据集数据分类的基本单元(或者说分类的对象)是数据集p保证高层数据分类统一,低层数据分类由各单位自行保证高层数据分类统一,低层数据分类由各单位自行研制研制p以数据中心有效管理、组织数据,最终用户快捷地查以数据中心有效管理、组织数据,最终用户快捷地查找数据为目的找数据为目的 19分类依据(1)遵循“数据分类与编码基本原则与方法”标准 19科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训分类依据(分类依据(2 2)p以科学数据共享工程的规划为依托以科学数据共享工程的规划为依托 p充分考虑各个数据共享中心的分类编码充分考虑各个数据共享中心的分类编码p结合学科分类标准、行业分类标准结合学科分类标准、行业分类标准20分类依据(2)以科学数据共享工程的规划为依托 20科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训分类编码标准的应用分类编码标准的应用p该标准只适用于数据集的分类,并将分类结果组织形该标准只适用于数据集的分类,并将分类结果组织形成数据目录。该标准不适用于数据库的改造,数据项成数据目录。该标准不适用于数据库的改造,数据项的改造,数据项内容的代码填写等。的改造,数据项内容的代码填写等。21分类编码标准的应用该标准只适用于数据集的分类,并将分类结果组科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训分类编码标准的维护分类编码标准的维护p随着科学数据共享工程的不断推进,该分类编码标准随着科学数据共享工程的不断推进,该分类编码标准必定会不断扩展和修订。必定会不断扩展和修订。p这种扩展必须是在遵从这种扩展必须是在遵从“数据分类与编码基本原则与数据分类与编码基本原则与方法方法”的基础上的扩充。的基础上的扩充。22分类编码标准的维护随着科学数据共享工程的不断推进,该分类编码科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训数据集的分类标引数据集的分类标引p分类标引的对象是数据集分类标引的对象是数据集 p分类标引是在数据集外部进行的分类标引是在数据集外部进行的 p分类标引的最终结果是标引结果集(数据库)分类标引的最终结果是标引结果集(数据库)23数据集的分类标引分类标引的对象是数据集 23科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训标引过程中组配方法的应用标引过程中组配方法的应用p在分类标引时,针对数据集的内容,从类目中找出与在分类标引时,针对数据集的内容,从类目中找出与数据集内容相对应的各个类目,用它们的编码组配表数据集内容相对应的各个类目,用它们的编码组配表达所标引的数据集内容。达所标引的数据集内容。24标引过程中组配方法的应用在分类标引时,针对数据集的内容,从类科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训标准的映射及标引结果集的转换标准的映射及标引结果集的转换p把各个数据中心采用的分类编码标准中的类目和科学把各个数据中心采用的分类编码标准中的类目和科学数据分类编码标准中的类目对应起来。数据分类编码标准中的类目对应起来。p把用数据中心分类编码标准标引的结果集,直接导入把用数据中心分类编码标准标引的结果集,直接导入到以科学数据分类编码标准为依据的标引结果集中。到以科学数据分类编码标准为依据的标引结果集中。25标准的映射及标引结果集的转换把各个数据中心采用的分类编码标准科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训四、标准的使用四、标准的使用26四、标准的使用26科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训示例一:林业科学数据中心的“森林资源概况表”数据集p通过分析该数据集的内容,应该属于通过分析该数据集的内容,应该属于“农业科学农业科学林林业科学业科学森林资源数据森林资源数据”,在,在“森林资源数据森林资源数据”这个这个大类下,有大类下,有“全国森林资源数据全国森林资源数据”、“省级森林资源省级森林资源数据数据”等小类,可以根据查阅数据集的具体内容,得等小类,可以根据查阅数据集的具体内容,得出应该属于哪个小类。如,这个数据集是全国范围内出应该属于哪个小类。如,这个数据集是全国范围内的森林资源概况,则最后的类就是的森林资源概况,则最后的类就是“农业科学农业科学林业林业科学科学森林资源数据森林资源数据全国森林资源数据全国森林资源数据”,具体编,具体编码为:码为:AF1112AF1112。27示例一:林业科学数据中心的“森林资源概况表”数据集通过分析该科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训示例二:农业科学数据中心的“主要农作物种质资源评价数据库”p通过分析该数据集的内容,应该属于通过分析该数据集的内容,应该属于“农业科学农业科学农农业科学数据业科学数据作物科学作物科学-主要农作物种质资源评价数据主要农作物种质资源评价数据”,则具体编码为:,则具体编码为:AS1211AS1211。28示例二:农业科学数据中心的“主要农作物种质资源评价数据库”通科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训示例三:农业科学数据中心的“中国湖泊数据库”p通过分析该数据集的内容,发现其既可以属于通过分析该数据集的内容,发现其既可以属于“农业农业科学科学农业科学数据农业科学数据水产科学水产科学”(编码为:(编码为:AS2113AS2113),又可以属于),又可以属于“资源环境科学资源环境科学水文水资源水文水资源科学科学水资源水资源水资源调查水资源调查”(编码为:(编码为:RH1211RH1211)。)。因此,可以采用组配的方式,将这两个类目的代码,因此,可以采用组配的方式,将这两个类目的代码,全部标注在这个数据集上。全部标注在这个数据集上。29示例三:农业科学数据中心的“中国湖泊数据库”通过分析该数据集科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训示例四示例四:医药卫生科学数据集使用范例医药卫生科学数据集使用范例30示例四:医药卫生科学数据集使用范例30科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据分类编码工具软件科学数据分类编码工具软件31科学数据分类编码工具软件31科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训电子词典软件框架32电子词典软件框架32科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训电子词典功能p标准的管理和维护标准的管理和维护p查询查询n以类名查询,以代码查询,以释义查询;以类名查询,以代码查询,以释义查询;n精确查询,模糊查询。精确查询,模糊查询。p标引标引p映射映射33电子词典功能标准的管理和维护33科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训标引保证标准和数据之间的关系SDCC数数据据集集A标引数据库标引数据库用户用户1用户用户2检索检索1检索检索2得到数据集得到数据集A A标引标引系统轮排系统轮排从外部进行标引,从外部进行标引,数据集本身无需任何变动数据集本身无需任何变动34标引保证标准和数据之间的关系SDCC数标引数据库用户1用科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训关键技术(1)p高效的信息管理和查询高效的信息管理和查询n灵活地管理机制,可实现多层次的分类树的高效存储;灵活地管理机制,可实现多层次的分类树的高效存储;n实实现现了了类类目目和和代代码码的的双双向向查查询询采采用用了了高高效效的的算算法法,可可以以支支持持1010万级别万级别以上,乃至以上,乃至100100万级别万级别的类目的快速查询;的类目的快速查询;n可快速提取分类树的信息及标引结果集信息。可快速提取分类树的信息及标引结果集信息。35关键技术(1)高效的信息管理和查询35科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训关键技术(2)p数据的标引数据的标引n电电子子词词典典及及辅辅助助编编码码器器使使得得用用户户对对数数据据的的分分类类可可以以不不再再依依赖赖于于文文件件系系统统,可可以以在在后后台台数数据据库库的的支支持持下下直直接接完完成成,最最后后打打包提交即可。包提交即可。36关键技术(2)数据的标引36科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训科学数据共享工程通用标准培训演示演示37演示37
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!