海洋数据库建设规范实例:中国近海和西北太平洋温盐声密数据库.doc

上传人:jian****018 文档编号:7990697 上传时间:2020-03-26 格式:DOC 页数:13 大小:119.50KB
返回 下载 相关 举报
海洋数据库建设规范实例:中国近海和西北太平洋温盐声密数据库.doc_第1页
第1页 / 共13页
海洋数据库建设规范实例:中国近海和西北太平洋温盐声密数据库.doc_第2页
第2页 / 共13页
海洋数据库建设规范实例:中国近海和西北太平洋温盐声密数据库.doc_第3页
第3页 / 共13页
点击查看更多>>
资源描述
海洋数据库建设规范实例:中国近海和西北太平洋温盐声密数据库建设规范1前 言海洋信息是海洋科研、教学、工程设计、规划管理、环境测报及评价、海洋经济可持续发展和军事海洋环境条件保证等的主要依据,因此海洋科学数据的收集、处理和数据库建设具有重大的社会科学意义和紧迫的国家需求。众所周知,物理海洋学是海洋科学研究和应用的基础,以海水温度、盐度、密度等参数为核心的海洋水文数据则是气候和海洋环境生态研究、环境预报和评价、工程设计、减灾防灾及军事海洋环境条件保证等的主要背景信息。我国渤、黄、东、南海是世界大洋的一部分,其变化相互联系,并深受世界大洋的影响。要研究和预测中国近海和邻近大洋的海洋环境变化,必须进行大范围的长期、同步海洋观测。进行这样的海洋调查需要巨大投资,任何一个单位、部门、甚至国家都不可能单靠自己的调查力量或依据未经系统整理的数据去开展大规模海洋研究工作。因此,海洋水文数据库建设不但有重要的使用价值,还具有昂贵的产出价值和显著的社会共有性,同时必须依据科学合理的建设规范来进行。国际海洋水文信息是海洋水文数据库的主要数据源。国际海洋水文数据种类繁多,时间序列长,空间分布广,信息量巨大,且积累速度快。这些数据分别来自全球几十个国家和地区;使用的观测仪器千差万别;资料的整理方法各不相同;导出参数的计算方法和公式各异;由实测层数据内插标准层的方法也各有长短;甚至采用的数据处理标准和编码,以及记录的资料的格式也仍在统一过程中。因此,规范化的建库方法和标准化的建设流程,以及先进的排重技术和严谨的质控方法都是保证建设合理、适用的海洋信息管理系统的前提条件。本规范是在总结海洋数据库体系中有代表性的“中国近海和西北太平洋温盐声密数据库”的多年建库经验的基础上逐步发展完善起来的。本规范的创新及特色之处包括:通用的ODSF1数据输入/输出格式、统一的数据排重程序、标准的数据质控方法、规范的数据库建设流程和全套国内外通用代码。它不仅指导了该数据库的建设,同时对海洋科学其他数据库的建设有借鉴作用。2中国近海和西北太平洋温盐声密数据库建设规范21适应范围本规范适用于海洋物理(含温、盐、密、声、流、浪、潮)、海洋气象和化学数据库建设中的相关数据处理工作及相关数据库建设。22引用标准国家标准:(1)GB12763.191 海洋调查规范海洋调查规范总则 (2)GB12763.791 海洋调查规范海洋调查资料处理(3)GB12763.391 海洋调查规范海洋气象观测(4)GB12763.491 海洋调查规范海洋化学要素观测(5)GB12763.591 海洋调查规范海洋声、光要素调查(6)GB12763.291 海洋调查规范海洋水文观测(7)GB12763.691 海洋调查规范海洋生物调查(8)GB31003102-82 量和单位(9)GB/T17839-1999 警戒潮位核定方法(10)GB/T 1.11993 标准化工作导则(11)GB123271998 海道测量规范(12)GB17501-1998 海洋工程地形测量规范(13)GB/T14158-93 区域水文地质工程、地质环境、地质综合勘察规范(比例尺1:50000)(14)GB/T 177981999 地球空间数据交换格式 (15)GB 1240990 地理格网 (16)GB/T GB2808-81 全数字式日期表示法 23技术术语定义/解释2.3.1主子表结构和数据分组(1)主子表结构:通过关联字段使主、子表对应,以解决数据记录表头和观测层数据存、取的速度问题;主子表结构是数据记录“一对多”关系的具体体现。(2)数据分组:根据数据的某些特征将数据存储在不同的数据库对象中;检索时,只需要根据数据特征来定位数据,并快速得到查询结果。2.3.2数据查询(1)网格数据查询:在显示网格数据信息时,直接读取和调用数据统计信息的过程。数据统计信息是在进行数据维护时生成的,并存储到单独的数据库对象中。(2)鼠标点击查询:鼠标点击事件发生时,系统先通过中间数据定位查找结果,然后再将查询结果反馈给应用程序的全过程。中间数据是在数据维护过程中生成的,将基本数据中的某些信息进行提炼,并存储到单独的数据库对象中。2.3.3 数据定位确定数据所在位置(测站)的技术和过程,包括:(1)“极值”定位:依照网格数据的统计结果、根据统计网格编号和经、纬度值,查询检索到该网格中的极值存在于特定测站的技术和过程。(2)“站次ID”定位:通过给定的经、纬度和站次ID,检索和查阅该测站全部信息的过程。(3)“航迹图”定位:使用航次信息绘制的航迹或断面图去诊断和定位“有疑问”资料的技术和过程。(4)模糊定位:由于鼠标点击定位时,“点击点”与“真实数据点”之间存在位置上的差异,“模糊定位”是帮助用户查找到距“点击点”处最近的数据点的技术。2.3.4数据格式参数化把数据格式以“自定义参数的形式”设计在程序中,统计调用时,通过函数名称进行调度的技术。2.3.5相关参数“函数化”将数据类型、观测参数、航次信息等先以函数的形式存放在数据表中,然后在程序运行中通过函数进行转换以便达到只改变列表,不改动程序,就能容易达到预期的变更目的之技术。2.3.6数据库对象命名将参数直接写在数据表中,通过数据表的名称来判断和定位数据,并缩小检索范围,以解决参数快速准确存取的技术。2.3.7 元数据(metadata)描述某类数据的属性、特征、时、空变化范围及其质量、精度等相关信息的集合。2.3.8 编码将信息分类的结果用一种易于被计算机和人识别的符号体系表示出来的过程,是人们统一认识、统一观点、相互交换信息的一种技术手段。编码的直接产物是代码。2.3.9 空间数据结构指空间数据在计算机内的组织和编码形式;它是一种适合于计算机存储、管理和处理空间数据的逻辑结构,是实体的空间排列和相互关系的抽象描述。2.3.10 图文资料扫描数字化通过扫描把以纸介质为载体的图文资料由模拟信息转变为数字信息,并按一定的质量要求对电子文件进行加工和制作,然后存储在磁带、磁盘或光盘等介质上的过程。2.3.11源数据集本系统所使用的数据来源之集合。2.3.12基础(存档)数据集指来自于源数据集的数据,经过格式转换、代码统一、重复排除和质量控制后形成的实测层数据集合(相对“标准数据集”而言)。值得一提的是:对于在标准层上发现的资料质量问题,必须到实测层存档数据集中寻找出错原因,再加以改正,然后重新计算标准层后入库。2.3.13标准数据集根据实测层数据计算出的准备入库之标准层数据集合。标准层定义见下表序号系统名称标准层的层次1营养盐数据子系统0,5,10,15,20,25,30,50,75,100,125,150,200,250,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,1750,2000,2500,3000,3500,4000,4500,5000,5500,6000,6500,7000,7500,8000,8500,90002深层流数据子系统3海峡通道数据子系统4温盐密声数据子系统5ARGO数据子系统6统计产品信息子系统2.3.14排重排除数据集中重复数据的过程和技术。2.3.15质量控制剔除数据集或数据库中随机错误和“人为虚构”测站资料与数据的过程及技术之总称。24 编码、属性表命名规则2.4.1 编码规则本数据库中使用了包括网格编号、国家编码、资料源代码、资料类型、参数编码等在内的诸多编码,其编码规则均采用由美国国家海洋数据中心编制的世界海洋数据库(WOD)编码规则。为了方便数据循环调用和统计,字段编码采用代码制,即根据数据参数的特点,事先制订字段参数-代码表,然后依据参数-代码表进行数据库设计2.4.2 数据库命名规则数据库名称为9位编:如ODMS_4002XXXX _ XX XX子系统编码子系统版本系统名称2.4.3 数据表命名规则X _ XXXX X XXXXX 数据表参数2数据表参数1数据表类型数据表名称为12位编:如T_13120111112.4.4 字段命名规则为了方便数据循环调用和统计,字段编码采用代码制,即根据数据参数的特点,事先制订字段参数-代码表,然后依据参数-代码表进行数据库设计25 元数据标准采用的元数据标准为WDCD海洋学资料元数据标准(见附件1)。26 文档格式本系统吸收国际各种数据格式的优点,自行研发和采用了“海洋资料共享格式(ODSF)”,并改进为ODSF1,作为输入、输出格式(见附录2)。27 数据库建设流程温-盐-密-声库的建设流程如下图所示。在做好数据收集提取、格式转换、编码统一、质量控制和排重工作的基础上,根据需求分析的结果,并灵活运用建库理论,通过数据管理子系统,将经过校验的数据导入库内,建成数据库实体。资料收集/预处理解压/可视化代码统一格式转换合并 排重 排序生成重复文件1首次排重后的实测层数据文件 择优 人/机结合质控/审核质控模块三质控模块二质控模块一质控模块四生成实测层数据存档文件计算标准层 程 纠错后重新计算标准层 序数 据 校 验 纠 错 入库统计排重 生成重复数据文件2 库内分析诊断模块极值定位 可使用程序纠错 可人工纠错资料 经重 二新 不可纠错的测站资料ODV V5.8绘图软件之接口模 块提取元数据 次导 诊入 断数 盐密模检验航迹图诊断剖面分析同步类比纠错处理实 体 库数据库系列产品生成元数据库 处据 温、盐超异常信息库温盐密声数据库 理库 后内28 数据质量控制281 质量监控体系质量监控体系包括数据入库前的质量控制流程和排重流程,以及数据入库后的库内分析诊断模块。282 数据质量监控1、数据质量控制流程图 合并对不同源南森站实测资料经格式转换、排重、统一代码及标准后进行合并 分 区 根据本海区特点,将全区分成35个独立的质控分区 内插 标准层用内插方法分别计算出各分区数据文件不同季度、不同层次上温、盐和溶解氧参数的标准层值 取得第一代 质控参数对内插的标准层资料进行人/机结合的审核、质控、统计出各分区、各层、各季的均值/频数和极大/极小值(质控参数) 第一次 质控用新产生的质控参数对分区内WOD98等六类资料(CTD/STD/SD2/XBT/MBT/SBT/IBT)进行首次质控和梯度检验。 人/机结 合纠错对质控出的问题,进行人/机结合审核,找出引起标准层上的资料有误的实测层资料的原因,并加以改正(质控参数中增加梯度值) 第二次 内插用各分区已改正的实测层资料重新计算标准层,产生第二代质控参数 第二次 质控用第二代质控参数对JMA资料进行质控,并配合梯度检验 第二次 纠错对二次质控出的问题进行人/机结合审核、筛选把关,再次判断引起实测层资料出错的原因,并改正之 第三次 内插对修改后的实测层数据文件重新计算标准层,得到各分区不同季节、不同层次的第三代温、盐和溶解氧质控参数 注:WOD01资料由此开始质控! 第三次 质控用第三代质控参数对WOD01等来源的十类资料(OSD/CTD/MBT/ XBT/MRB/DRB/PFL/UOR/APB/SURF)进行质控,并结合梯度检验在各分区实测层数据文件中,人/机结合,改正质控出的实测层上的质量问题 第三次 纠错 第四次 插值使用改正后的实测层数据文件,重新计算标准层,获得下一代质控参数 开始新一轮 质控过程利用上一轮质控参数,对新收集到Argo等其它来源的资料进行下一轮质控;不断循环往复,逐步改进完善各分区不同季节/月份,不同层次上的质控参数2、排重工作流程图(以OSD类型资料为例)解压、合并后的OSD资料总文件年度造假Y程序块 拷 贝 对 第一次排重 用经纬度和时间的第一组参数分离出完全重复的资料 确 应 认 的 重 复 可能完全重复数据文件 重 不重复月份造假M程序块 复 站可能不重复数据文件 确 至 人工 审核重复 认 REP 否 调 用 日子造假D程序块 左 是从两个或多个站中优选出一个站 边 确 各 认 程 序 择 劣 合 并H程序块生成*.comb1文件小时造假 模 确 块 选 优 认 第二次排重 使用经、纬度和时间组合的第二组参数 排 除 可能重复数据文件 部 经度造假 LO程序块重 分 可能不重复数据文件 造 人工 审核 重复 确 假 否 认 资 料 是从两个或多个站中优选出一个站 纬度造假 LA程序块 合 并生成*.comb2文件 确 认 第三次排重 使用经、纬度和时间组合的第三组参数可能重复文件 肯定不重复文件 并 重复 入 拷贝对应重复站 人工 审核 重 至REP 否 复 数 是从两个或多个站中优选出一个站 据 拷贝至重复站REP 集 生成统一的重复数据文件REP,供IOCAS和OCL检验时使用生成*.comb3最终文件,供质控使用 合 并3、库内分析诊断模块(1)极值定位利用本系统“通过给定站位和站次ID,可以查阅、检索,并显示该站完整信息”的功能,并“根据网格数据的统计结果,可进行极值(极大或极小值)定位” 的功能模块,能够确认从0.1*0.1到10*10任意方区内的极值是否合理,从而达到诊断资料真实性的的目的;因为“错情”通常是与观测参数特定空间范围和特殊时段的“极值”(极大/小值)紧密相关。(2)同步观测资料类比将数据类型、观测参数、航次/断面信息先以函数的形式存放在数据表中,然后在程序中通过函数进行转换,使相关参数“函数化”;这样只改列表,而不动程序,就可容易地达到预想的变更目的。有质量问题的资料(造假)入库后,通过相关参数“函数化”处理和系统强大的统计检索功能,可以把与该资料(造假)同属一个航次/断面的有关资料和其它航次/断面的同步或准同步测量资料调度到同一平面上类比,从而确认该(造假)资料的真实性。实践证明,相当数量人为制造的资料与真实资料在同一时空环境下类比就会暴露“伪”的原形。(3)盐-密模定量分析表征水团特性的温盐曲线在特定海区具有定常的形态(Svordrup等 1942),因此使用温-盐或盐-密双变量频率分布所形成的模式,可以检验现有观测资料的质量。美国国家海洋资料中心Douglas Hamilton 博士于1976年率先研制了55网格的盐-密模,并用于定性质控(Environmental Models for Quality Control, 1976, Douglas Hamilton)。借鉴美国的经验,使用了数据子系统的温、盐资料计算出条件密度,再用盐度和密度值及其它相关参数制成不同海区、季节/月份、以及不同层次上的盐-密模型;之后再用盐-密模型检验入库资料的质量,剔除可能会严重影响统计结果的非真实资料。(4)航次/断面分析诊断如果某一航次/断面中的“一个或多个”测站出现“有疑问”的资料,系统会根据具体需要和该航次综合信息绘制出航次/断面图,以确诊“疑问”之所在,并帮助纠正元数据,同时提供纠错办法与可能的“订正量”,即订正值的大小。29 数据库汇交(集成)(汇交至的方法和途径等)(1)由研发单位向中科院科学数据库中心汇交本数据管理系统;(2)所有的数据库建设成果及相关文档(项目设计书、总体方案、建库合同、协议等)均按科学数据库有关要求存档保管;(3)汇交数据文件的存储介质为光盘;(4)提交成果之前,应进行全面查、杀毒,以确保数据的安全。附录1 WDCD海洋学资料元数据标准数据集名称:中国近海和西北太平洋温盐声密数据库数据集编码:待定数据集内容关键词:海洋信息、格式、质控、排重、管理系统、标准数据集内容:海洋学各分支学科的现场观测资料数据集开始时间:1876年6月数据集结束时间:2004年4月数据空间范围(最低经度,最高经度):100E140E数据空间范围(最低纬度,最高纬度):10S50N数据空间范围(最低高度,最高高度):海面海底数据质量说明:数据质量可靠,误码率小于万分之六数据存储介质:CD-ROM、DVD、活动硬盘数据存储格式:入库数据均以数据表的形式存储数据量:12.6GB数据来源:全球海洋科学团体数据集使用的语种:中文、英文系统、数据集、数据库等作者信息:科学顾问:胡敦欣系统总设计:许崇金、王 凡、代 亮、孙丰山、陈献辉、孙东丽、陈永利等管理子系统设计:代 亮、许崇金、王凡、孙丰山、孙东丽、陈永利、陈献辉温-盐数据库设计:王凡、许崇金、代亮、孙丰山、孙东丽、陈永利、陈献辉数据集存放地点:中国科学院海洋研究所数据集索取方式:函索/面商皆可。数据更新周期:每半年至一年更新一次附录2 “海洋资料共享格式(ODSF)”本数据库吸收国际各种数据格式的优点,自行研发和采用了“海洋资料共享格式(ODSF)”,并改进为ODSF1,作为输入、输出格式。格式例样1: 1 2 3 4 5 6 123456789012345678901234567890123456789012345678901234567890 CC cruise Latitde Longitde YYYY MM DD Time Station # 第一个记录:英文表头说明 49 PR19 26.830 121.255 1990 11 15 12.26 IS-13 9 第二个记录:英文对应的信息 Nvar= 2 第三个记录;“2”参数个数 1 2 第四个记录:按顺序排列的参数代码(ParaCodes.txt) 0.0 23.732 (2) 0 33.649 (2) 0 第五个记录以下为各层次之数据资料 5.0 23.741 (2) 0 33.649 (2) 0 9为观测层次数 10.0 23.746 (2) 0 33.651 (2) 0 15.0 23.742 (2) 0 31.654 (2)10 20.0 23.731 (2) 0 33.661 (2) 0 25.0 23.637 (2) 0 33.696 (2) 0 30.0 23.569 (2) 0 33.722 (2) 0 50.0 33.560 (2)20 33.723 (2) 0 63.4 23.571 (2) 0 33.728 (2) 0 资料来源国原有质量码位(空位) 美国资料中心质量代码位 本数据库新加质量码位“2”和“1”格式例样2:表头信息序号名称含义长度示例1国家代码IOC国家编码A221=中国2调查船代码各国家自己定义A43航次号由调查单位设置A84断面号由调查单位设置A55经度测站的位置F8.36纬度测站的位置F7.3710*10,5*5,2*2,1*1, 0.5*0.5,0.25*0.25,0.1*0.1网格号根据WMO编码原则设立的各网格号I4I2I18时间省略年月日后的时间F5.29观测层次数该站有多少个实测层I510水深测站处的水深F7.111水色色级编码I212透明度Secchi diskI213能见度分09十个等级I114资料来源本中心使用的缩略语A4WOD215资料类型由五个字母表示的资料类型A2SD2,XBT格式例样3:实测层信息序号名称含义长度示例1层次观测层的深度F7.12温度该层的温度值F8.33盐度该层的盐度值F8.34溶解氧该层的溶解氧值F8.35密度该层的密度值F8.36声速该层的声速值F8.37硝酸盐该层的硝酸盐值F8.38亚硝酸盐该层的亚硝酸盐值F8.39硅酸盐该层的硅酸盐值F8.310磷酸盐该层的磷酸盐值F8.311pH值该层的pH值F8.3
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文书 > 方案规范


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!