内蒙古草原大数据标准_基础数据征求意见稿

上传人:H****r 文档编号:9342456 上传时间:2020-04-04 格式:DOC 页数:31 大小:1.13MB
返回 下载 相关 举报
内蒙古草原大数据标准_基础数据征求意见稿_第1页
第1页 / 共31页
内蒙古草原大数据标准_基础数据征求意见稿_第2页
第2页 / 共31页
内蒙古草原大数据标准_基础数据征求意见稿_第3页
第3页 / 共31页
点击查看更多>>
资源描述
ICS点击此处添加ICS号点击此处添加中国标准文献分类号DB内蒙古自治区地方标准DB XX/ XXXXXXXXX内蒙古草原大数据 基础数据Grassland big data in Inner Mongolia Basic data点击此处添加与国际标准一致性程度的标识XXXX - XX - XX发布XXXX - XX - XX实施内蒙古自治区市场监督管理局发布DBXX/ XXXXXXXXX目次前言 II引言 IV1 范围 12 规范性引用文件 13 总则 1 3.1 数据类型格式 2 3.2 内部标识符编码规则 24 草原大数据标准体系基本架构 35 术语和定义 46 草原大数据数据元数据属性的描述方法 77 草原大数据标识类属性 87.1 中文名称 8 7.2 同义名称 8 7.3 表示符号 8 7.4 数据类型 9 7.5 表示格式 97.6 值域范围 10 7.7 交换约束 107.8 字段名称 107.9 标识符 107.10 蒙文名称 118 草原大数据技术 11 8.1 草原大数据质量 118.2 数据处理与分析关键技术 128.3 草原大数据采集规定 139 数据质量评估与监测技术 14 9.1 数据质量评估体系 15 9.2 数据质量评价方法 1510 草原大数据安全 1510.1 通用安全 16 10.2 行业安全 1611 平台及工具类标准 1611.1 系统类工具 1611.2 应用类工具 1611.3 管理类标准 25参考文献 26前言本标准依据GB/T 1.1-2009 标准化工作导则 第1部分:标准的结构和编写给出的规则起草。本标准由内蒙古自治区农牧厅提出。本标准由内蒙古大数据与云计算标准化技术委员会归口。本标准起草单位:内蒙古自治区农牧业信息中心、内蒙古云利科技有限公司、内蒙古草原工作站、内蒙古草原监督管理局、内蒙古草原勘察规划院、内蒙古饲料草种监督检验站、内蒙古农业大学等。本标准主要起草人:刘永志、马超、付学良、王晓峰、朱玉成、王威宇、冯国荣、刘正垣、赵于东、张彦、李慧旻、李宏慧、潘新、董改芳、罗小玲、王云利、李雪东、刘爱军、高文渊、常炳文、金花、巩少飞、李华、刘利民、张巧燕、王泽华等。引 言根据内蒙古自治区政务信息资源共享管理暂行办法、内蒙古自治区政务信息系统整合共享推进方案等文件的要求,为解决内蒙古自治区草原大数据信息共享过程中草原大数据采集、分类、技术、平台及工具以及信息安全等规范性问题,本标准的制定为内蒙古自治区的有关草原政务数据交换提供统一的、各领域内共同遵守的依据。本规范所包含的相关国家标准、行业标准都会被修订,使用本规范的各方应探讨使用相关国家标准、行业标准最新版本的可能性。本规范未尽事宜及与有关法律法规相抵触的,按有关法律法规执行。本规范自发布之日起执行。27内蒙古草原大数据 基础数据1 范围本文件规定了内蒙古自治区草原大数据信息草原大数据采集、草原大数据处理技术、草原大数据平台及工具以及草原大数据信息安全等技术及管理要求。本文件适用于内蒙古草原信息的共享、交换、评价与服务。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 19710-2005 地理信息 元数据 标准LY/T 2930-2017 林业数据采集规范GB/T 24450-2009 社会经济目标分类与代码QX/T 102-2009 气象资料分类与编码LY/T 2181-2013 湿地信息分类与代码LY/T 2182-2013 荒漠化信息分类与编码LY/T 1814-2009 自然保护区生物多样性调查规范LY/T 2179-2013 野生动植物保护信息分类与编码GB/T 31495.1-2015 信息安全技术 信息安全保障指标体系及评价方法 GB/T 31495.2-2015 信息安全技术 信息安全保障指标体系及评价方法GB/T 31495.3-2015 信息安全技术 信息安全保障指标体系及评价方法GB/T 34978-2017 信息安全技术 移动智能终端个人信息保护技术要求GB/T 22080-2016 信息技术 安全技术 信息安全管理体系GB/Z 28828-2012 信息安全技术公共及商用服务信息安全系统个人信息保护指南GB/T 37721-2019 信息技术 大数据分析系统功能要求GB/T 29262-2012 信息技术面向服务的体系结构(SOA)术语GB/T 29263-2012 信息技术面向服务的体系结构(SOA)应用的总体技术要求GB/T 37722-2019 信息技术 大数据存储与处理系统功能要求标准GB/T 32908-2016 非结构化数据访问接口规范GB/T 34949-2017实时数据库C语言接口规范DL/T 1456-2015 电力系统数据库通用访问接口规范GBT 37721-2019信息技术大数据分析系统功能要求标准GB/T 20531-2006 移动数据库应用编程接口规范GB/T 20157-2006/ISO/IEC 14764:1999 信息技术 软件维护标准GB/T 36073-2008 数据管理能力成熟度评估模型GB/T 349605-2018 信息技术服务 治理3 总则3.1 数据类型格式本标准中数据元值的类型长度的表示格式如下:a =字母字符n =数字字符an =字母数字字符m(m为自然数) =定长m个字符(字符集默认为GB2312).ul =长度不确定的文本.p,q(p,q均为自然数) =最长p个数字字符,小数点后q位YYYYMMDDhhmmss =“YYYY”表示年份,“MM”表示月份,“DD”表示日期,“hh”表示小时,“mm”表示分钟,“ss”表示秒,可以根据具体情况组合使用。二进制 =上述无法表示的其它数据类型,比如图像、音频等。例1:an.7(aaannnn) 表示最长7个字符,前3个字符为字母字符,后4个字符为数字字符。例2:n.15,3 表示最长15个数字字符,小数点后3位。例3:un2.6 表示最大长度为6,最小长度为2的不定长的字母数字字符3.2 内部标识符编码规则草原大数据内部标识符编码规则采用四段式编码规则,编码结构如下: a) 第一段:1-2位,数据元英文名称Data Element的缩写,用大写字母“DE”表示;b) 第二段:3-4位,数据元的大类编码,用两位阿拉伯数字表示,数据元大类及编码见表1中“大类”、“大类编码列”;c) 第三段:5-6位,数据元的小类编码,用两位阿拉伯数字表示,数据元大类及编码见表1中“小类”、“小类编码”列;第二段与第三段间用“.”分隔;d) 第四段:7-9位,数据元的顺序码,用三位阿拉伯数字表示,第三段与第四段间用“.”分隔; 如表5-1所示。表 5-1 内部标识符编码规则大类大类编码小类小类编码公共01人员类01机构类02时间类03位置类04数量类05空间类06其他99植物保护02测报类01防治类02其他99草原植物03天然类01种植类02其他99草原确权04发包方类01承包方类02承包地块类03承包合同类04其他99其他994 草原大数据标准体系基本框架草原大数据标准体系基本框架包含草原大数据基础、草原大数据技术、草原大数据安全、草原大数据平台及工具以及草原大数据管理等5个模块,如图1所示。a) 草原大数据基础数据基础标准为整个标准体系提供包括总则、参考架构、草原大数据元数据等通用的基础性标准。b) 草原大数据技术技术类标准主要是对大数据相关的技术进行标准化规范。包括:数据质量标准、数据处理与分析关键技术标准、数据质量评估与监测技术标准等。其中数据质量标准分类参考ISO8000系列标准,并根据当前内蒙古自治区大数据产业发展需求,等同或修改后采用国际标准;数据处理与分析关键技术标准主要是针对数据从收集到使用过程中的关键技术进行规范;数据质量评估与监测技术主要是针对草原大数据质量进行评估和监测。c) 草原大数据安全安全类标准主要是针对通用的安全和行业安全,其中通用要求基于信息安全技术的系列标准;行业安全重点针对人工智能、电子政务、工业互联网等各行业与信息主体利益密切相关的隐私数据。d) 草原大数据平台及工具平台及工具类标准主要是从数据使用过程中的过程性工具和终端应用类工具进行规范,主要包括系统类工具和应用类工具;系统类工具标准细分为平台基础设施、存储类工具、数据库、平台管理类工具等。 e) 草原大数据管理管理类标准是大数据标准的重要支撑,主要包括草原大数据运维和数据治理,其中数据运维包括数据库维护、运行维护、运行安全及大数据系统及相关工具等方面的运维及服务标准;数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。5 术语和定义5.1 大数据 Big data具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。 注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并分别赋予了它们在大数据语境下的定义: a) 体量(volume):构成大数据的数据集的规模; b) 多样性(variety):数据可能来自多个数据仓库、数据领域或多种数据类型; c) 速度(velocity):单位时间的数据流量; d) 多变性(variability):大数据其他特征,即体量、速度和多样性等特征都处于多变状态。 5.2 草原大数据 Grassland big data通过大数据技术将草原生态环境相关的数据整合起来应用在草原管理相关的业务领域,赋能政府机构,提升政务实施效能的数据。这些数据包含了政府开展工作产生、采集以及因管理服务需求而采集的外部大数据,以及为政府自有和面向政府的大数据。从数据属性来看,草原大数据数据分为:a) 自然信息类:地理、资源、气象、环境、水利等;b) 建设类:交通设施、旅游景点、住宅建设等;c) 管理统计监察类:工 商、税收、人口、机构、企业、商品等;d) 服务与民生消费类:水、电、燃气、通信、医疗、出行等。5.3 元数据 metadata关于数据的数据。GB/T 19710-2005,定义4.55.4元数据元素 metadata element元数据的基本单元。GB/T 19710-2005,定义4.65.5 元数据实体 metadata entity 一组说明数据相同特性的元数据元素。 注:可以包括一个或一个以上的元数据实体。GB/T 19710-2005,定义4.75.6 核心元数据 core metadata描述草原大数据最基本信息的元数据最小集合。5.7数据源 data source数据的来源,是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。草原大数据的数据源必需可靠且具备更新能力,常用的数据源有:a) 观测数据,即现场获取的实测数据,它们包括野外实地勘测、量算数据,台站的观测记录数据,遥测数据等;b) 分析测定数据:利用物理和化学方法分析测定的数据;c) 图形数据:各种地形图和专题地图等;d) 统计调查数据:各种类型的统计报表、社会调查数据等;e) 遥感数据:由地面、航空或航天遥感获得的数据。5.8 结构化数据 structureddata可以组织成行列结构,可识别的数据。这类数据通常是一条记录,或者一个文件,或者是被正确标记过的数据中的某一个字段,并且可以被精确地定位。5.9 半结构化数据 semi-structureddata 半结构化数据不具有结构化数据严格的存储结构,但它可以使用标签或其他形式的标记方式以保证数据的层次结构。5.10 非结构化数据 un-structureddata 非结构化数据一般被认为是大量纯文本数据,其中还可能包含日期,数字和实例。5.11 复杂结构的数据 complexstructureddata由两个或多个复杂而相互关联部分组成的数据,这类数据不能简单地由结构化查询语言(SQL)或工具解析。5.12 云计算 cloudcomputing构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)。5.13 聚类分析 clusteringanalysis它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。这种分析方法的目的在于分析数据间的差异和相似性5.14 数据聚合工具 Dataaggregationtools将分散于众多数据源的数据转化成一个全新数据源的过程5.15 数据虚拟化 Datavirtualization数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库、应用程序、文件系统、网页技术、大数据技术等等。5.16 去身份识别 de-identification 也称为匿名化(anonymization),确保个人不会通过数据被识别。5.17 文件存贮数据库 documentstoredatabases也称为文档数据库(document-orienteddatabase),为存储、管理、恢复文档数据而专门设计的数据库,这类文档数据也称为半结构化数据。5.18 数据抽取、转换及装载 Extract,TransformandLoad,ETL是一种用于数据库或者数据仓库的处理过程。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库。5.19 Hadoop数据库(HBase)一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用。5.20 Hadoop分布式文件系统 Hadoopdistributedfilesystem 是一个被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统。5.21 内存数据库 in-memory database一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。其特点在于能高速地进行数据的处理和存取。5.22 物联网 InternetofThings 在普通的设备中装上传感器,使这些设备能够在任何时间任何地点与网络相连。5.23 法律上的数据一致性 juridicaldatacompliance存储在云上的数据要符合当地的法律。例如,当用云计算存储数据放在美国,该数据应该符合美国当地数据存放的法律。5.24 M2M数据 machine to machinedata两台或多台机器间交流与传输的内容。5.25 机器数据 machinedata由传感器或算法在机器上产生的数据。5.26 机器学习 machinelearning机器学习是人工智能的一部分,指的是机器能够从它们所完成的任务中进行自我学习,通过长期的累积实现自我改进。5.27 多维数据库 multi-dimensionaldatabase 用于优化数据联机分析处理(OLAP)程序,优化数据仓库的一种数据库。5.28 多值数据库 multiValuedatabase一种特殊的多维数据库:能处理3个维度的数据。主要针对非常长的字符串,能够完美地处理HTML和XML中的字串。5.29 NoSQL数据库 NoSQL database顾名思义,就是“不使用SQL”的数据库。这类数据库泛指传统关系型数据库以外的其他类型的数据库。这类数据库有更强的一致性,能处理超大规模和高并发的数据。5.30 再识别 re-identification将多个数据集合并在一起,从匿名化的数据中识别出个人信息。5.31 无线射频识别 radio Frequency Identification 是自动识别技术的一种,通过无线射频方式进行非接触双向数据通信,利用无线射频方式对记录媒体(电子标签或射频卡)进行读写,从而达到识别目标和数据交换的目的。这种识别技术使用一种无线非接触式射频电磁场传感器来传输数据。射频识别技术依据其标签的供电方式可分为三类,即无源RFID,有源RFID,与半有源RFID。5.32 实时数据 real-timedata 指在几毫秒内被创建、处理、存储、分析并显示的数据。5.33 主数据 master data指满足跨部门业务协同需要的、反映业务实体状态属性的主体对象核心信息。5.34 主数据管理 master data management指一整套用于生成和维护主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。5.35 交换 switching部门间通过信息资源交换体系技术支撑环境实现草原大数据信息资源在线传送的过程。5.36 交换节点 Switching node在跨政务部门业务系统中,实现信息资源传送和处理的系统单元。 示例:前置机。 6 草原大数据元数据属性的描述方法草原大数据元数据属性应依照一种标准方式来描述。下面的描述符只对元数据属性的描述有效(对元数据的描述无效)。a) 名称赋予元数据属性的标记。名称是唯一的,以字符串形式表示。b)定义属性的描述,可使一种属性与其他属性清晰地区别开来。定义以字符串形式表示。c)约束显示一个属性是始终还是有时出现的描述符。该描述符可以有两个取值:必选或可选,前者表示该属性必须出现,后者表示该属性可以出现,也可以不出现。d)出现次数显示一个属性出现多少次的描述符。该描述符有以下四种情况:0:1(表示不出现或出现1次),0:n(表示不出现或出现n次),1:1(表示出现且仅出现1次),1:n(表示出现1次或多次)。e)类型描述属性的所有取值的类型。属性值的数据类型示例有:“字符”、“字符串”、“数字”、“日期”。f)备注与属性应用有关的注释。7 草原大数据标识类属性7.1 中文名称定义:赋予元数据的单个或多个中文字词的称谓。约束:必选。出现次数:1:1。类型:字符串。备注:命名应明确的表达数据元的含义,尽量减少冗余,增加精确度;在同一环境下的所有名称应该是唯一的。7.2 同义名称定义:一个元数据在应用环境下的不同称谓。如国家安全生产监督管理总局的同义名为国家安全监管总局。约束:可选。出现次数:1:1。类型:字符串。说明:一个元数据可以有多个同义词,第一个同义词应该是统一的约定名称。7.3 表示符号定义:元数据的含义的描述,表达一个元数据的本质特性并使其区别于所有其他元数据的陈述(特别明确的可省略)。约束:可选。出现次数:1:1。类型:字符串。注意:a) 每个定义必须区别于目录中的任何其他定义,以保证专一性。定义中所表述的一个或多个特性必须使被定义的概念与其他概念相区别。b) 用描述性的短语或句子阐述,阐述必须简练、准确而不含糊,避免跟其他元数据定义互相依存。c) 定义中仅可使用人们普遍理解的缩略语。d) 所有简称在第一次出现时,必须予以说明。7.4 数据类型定义:表示数据元值的不同值的集合。约束:必选。出现次数:1:1。类型:字符串。说明:可能的实例为:“字符”、“序数”、“实数”、“比例数”、“二进制数”、“有理数”。7.5 表示格式定义:从应用的角度规定的数据元值的格式需求,包括所允许的最大或最小字符长度,数据元值的类型和表示格式等。约束:必选。出现次数:1:1。类型:字符串。说明:数据格式的表示如下表所示:基本格式举例说明cc中文字符,可以包含汉字(中、国等)、字母字符(a-z,A-Z)和数字字符等。c1212位字符(即6个汉字)固定长度的中文字符c.12最多为12位字符(即6个汉字)长度的中文字符(默认GB 2312 信息交换用汉字编码字符集、基本集)aa特指字母字符(A、B、C)a33位字母字符,定长a.3最多为3位字母字符nn数值型字符(0、1、2、3)n33位数字字符,定长n.3最多为3位数字字符n.9,2数值型, 总长度最多为9位数字字符,小数点后保留2位数字anan字母和数字字符an33位字母数字字符,定长an.3最多为3位字母数字字符dd日期型d8日期型,按年、月、日顺序,格式为8位定长、全数字表示(YYYYMMDD)。年用4位数字表示,月、日各用2位数字表示,彼此之间没有分隔符d10日期型,按年、月、日、时顺序,格式为10位定长、全数字表示(YYYYMMDDhh)。年用4位数字表示,月、日、时各用2位数字表示,彼此之间没有分隔符。如2003年1月5日9时,应表示为2003010509d14日期型,按年、月、日、时、分、秒顺序,格式为14位定长、全数字表示(YYYYMMDDhhmmss)。年用4位数字表示,月、日、时、分、秒各用2位数字表示,彼此之间没有分隔符。如2003年1月5日9时48分43秒,应表示为20030105094843bb布尔值 0:否,1:是ulu1长度不确定的文本7.6 值域范围定义:根据相应属性中所规定的表示形式、格式、数据类型和最大与最小长度而决定的数据元的允许实例表示的集合。该集合可以根据名称、引用来源、实例表达的枚举,或者根据实例生成规则来规定。约束:可选。出现次数:1:1。类型:字符串。备注:当值域范围是编码表示的枚举形式时,每一个数据元值及其实例都应当成对表示。7.7 交换约束定义:根据对象的来源特性,在数据采集时,从应用角度规定该数据元是否为必选或可选约束:必选出现次数:1:1。类型:字符串。7.8 字段名称定义:在提供的共享数据中对应的字段名称。约束:可选。出现次数:0:1。类型:字符串。7.9 标识符定义:由注册机构分配的、与语言无关的元数据的唯一标识符。约束:必选。出现次数:1:1。类型:数字。7.10 蒙文名称定义:中文名称对应的蒙文。约束:可选。出现次数:0:1。类型:字符串。8 草原大数据技术草原大数据技术包括:大数据质量、数据处理与分析关键技术、数据检测与评估技术等标准。8.1 草原大数据质量高质量数据是分析和利用大数据、保证大数据的价值的前提。草原大数据质量标准规范了草原大数据生命周期、大数据质量框架以及大数据的质量维度等方面的规范。 8.1.1 草原大数据生命周期草原大数据一般要经历四个不同的阶段:数据生成、数据采集、数据存储、数据分析。其中,数据生成阶段,是数据被创建的阶段,包括创建的结构化数据和非结构化数据;数据采集阶段,由数据收集、数据传输和数据预处理组成;数据存储阶段,结合分布式、云计算技术,达到低成本、低能耗及高可靠性的目标;数据分析阶段,结合降雨、气温、土壤状况与历年草原动植物产量等相关数据,运用大数据挖掘技术,预测草原未来的生态环境发展状况。8.1.2 草原大数据的质量框架 从用户的角度,草原大数据的质量架构如图2所示。8.1.3 草原大数据的质量维度 草原大数据的质量维度包含5各维度,分别是可得性、可用性、可靠性、相关性、外观质量等。每一个维度有包含13个要素。 a) 可得性。可得性包含可访问性和实效性两个要素,其中数据的可访问性应明确数据提供访问的标准接口、数据使用权限等;数据的实效性应明确数据准确接收的时间、数据更新时间以及数据收集和过程解释的时间间隔等。 b) 可用性。数据的可用性包含可靠性良好的数据源、数据规范化、数据产生的时间等三个要素。 c) 可靠性。可靠性包含数据的准确性、数据一致性以及数据完整性等三个要素,其中数据准确性应明确得到的数据与真实数据之间的误差,包括数据数据源的准确性、数据源的真实状态以及数据表示的标准化等;数据的一致性应明确数据经过处理之后,它们的概念、值域或格式与处理前的数据匹程度、在一定时间内数据保持一致并且可以验证以及数据和其他数据源的数据可验证性;数据的完整性应确保数据在内容上,应包括数据使用者所需的全部项目,做到没有残缺和疏漏,包括数据格式是清晰的并且满足标准、数据与结构完整性以及数据与内容完整性是一致的。 d) 相关性。相关性表示数据在多大程度上适合当前工作,包括收集的数据阐述的内容、大多数检索的数据集是在检索主题用户需要以及信息主题提供与用户检索主题的匹配等。 e) 外观质量。外观质量表示根据已知或定义良好的术语、属性、单位、代码、缩写或其他信息,来正确解释数据内容的能力,应包括明确数据的内容、格式等是清晰的并且是可理解的、可以很容易地判断提供的数据满足要求以及数据描述、分类和编码内容满足规范并且很容易理解。8.2 数据处理与分析关键技术 数据处理关键技术标准包括数据采集和数据分析两个部分。8.2.1 数据采集8.2.1.1 采集的内容内蒙古草原大数据依据性质及使用目的不同,主要包括公共基础数据、草原基础数据、专题数据、综合数据和元数据等。a)公共基础数据,包括基础地理信息数据、遥感影像数据、社会经济和气象数据等,用于辅助草原大数据处理分析。b)草原基础数据,包括资源数据、湿地资源数据、荒漠化资源和沙化资源数据、生物多样性资源数据等,提供草原业务基础数据。c)专题数据,包括草原资源管理数据、草原培育及生态工程建设数据、灾害监控与应急数据、草原产业数据、草原科技等数据。d)综合数据,包括草原社会经济数据、草原文献资料数据、草原政策法规数据、草原教育培训数据等数据,辅助草原清查及统计分析。e)元数据,包括草原数据标识信息、数据时间序列信息、数据质量信息、数据共享信息、空间参照信息等。f)其他数据,不分属于以上类别的草原数据资料。8.2.1.2 采集的流程草原数据采集流程包含三个部分,即采集前期准备、数据采集以及数据后期处理等。(1) 采集前期准备草原数据采集前期准备工作,包括组织准备、技术准备和其他准备。a)组织准备:组织草原数据采集队伍,明确队伍责任分工等。b)技术准备:制定数据采集工作方案、技术方案和操作细则等c)其他准备:明确数据采集目标,确定数据采集对象,整理历史数据,收集调查工具等。(2) 数据采集草原数据按照内容及性质不同,分为公共基础数据、草原基础数据、专题数据、综合数据、元数据。草原数据采集按照以上五类包括的数据类别、技术规范、采集方式进行数据采集。(3) 数据后期处理对采集数据按照相应的标准规范进行处理,包括数据分析、数据处理、数据质检、数据入库等操作。 LY/T 2930-2017 林业数据采集规范 4.2.38.2.1.3 采集的手段草原数据采集手段包含实地调查数据采集、遥感影像数据采集、传感网络数据采集、问卷调查及访谈法数据采集、互联网数据采集以及元数据采集等6种途径。(1) 实地调查数据采集实地调查数据采集手段包括手工记录方式和基于移动设备的自动数据采集方式。a)手工记录方式:通过随身携带或预先布设在外的仪器设备获取草原相关信息,以手工记录的方式进行收集。b)基于移动设备的自动数据采集方式:通过移动终端设备及专业数据采集软件,实时收集、上报草原信息数据。(2) 草原遥感影像数据采集依据影像数据采集方式不同,分为卫星遥感影像数据采集、航空遥感影像数据采集。a)卫星遥感影像数据采集,通过国内外卫星遥感技术获取草原影像数据,包括全色影像、多光谱影像及高光谱影像。b)航空遥感影像数据采集,通过飞机、飞艇等航拍设备获取草原数据,如利用无人机搭载多光谱成像仪、数码相机、红外扫描仪等设备,实现草原数据的采集。(3) 传感器网络数据采集通过光照传感器、温度传感器、湿度传感器、气体感应器、红外感应器、摄像头等信息传感设备,可将数据实时传回指挥或管理中心,实现对草原资源的智能化识别、监测和管理等,主要用于草原防火烟火智能识别、生物多样性动态监测、草原有害生物监测预警、生态监测等。(4) 问卷调查与访谈法数据采集a)问卷调查:通过既定的问题来收集草原专项数据。b)访谈法:结合实地考察等,以谈话、会议等形式收集草原数据资源材料。(5) 互联网数据采集在手持移动终端、便携式计算机、台式计算机等互联网应用设备中抓取草原相关网络舆情信息数据,以及草原业务系统应用中的痕迹数据。(6) 元数据采集元数据贯穿草原数据资源建设的全过程,主要包括草原业务元数据、技术元数据和管理元数据等。8.3 草原大数据采集规定8.3.1公共基础数据采集公共基础数据采集规定,主要包括对基础地理信息数据、基础测绘成果数据、遥感影像数据和社会经济气象数据等相关业务部门数据的规定。a)基础地理信息数据,包括各种比例尺数字化地形图、DEM数据、省、市、县多级比例尺的行政区划图、交通道路、水系、城镇居民点、独立建筑物等数据、多级比例尺的土壤数据等。可按照GB/T13923-2006中的规定采集。b)基础测绘成果数据,按照基础测绘成果提供使用管理暂行办法(国测法字(2006)13号),向国家和地方测绘地理信息局申请使用基础测绘成果数据。c)遥感影像数据,包括多源、多时相、多分辨率海量遥感数据;根据林草局部门不同业务要求采集数据。d)社会经济和气象数据等相关业务部门数据,社会经济数据包括人口、经济产值等数据,其中社会经济数据按照GB/T24450-2009中的规定采集;气象数据包括气温、降水量、极端最高、最低温度、年积温等数据,气象数据按照QX/T102-2009中的规定采集。8.3.2 草原基础数据采集草原基础数据采集规定,主要包括对草原资源数据、湿地数据、荒漠化数据和生物多样性等数据的规定。a)资源数据,包括草原资源清查数据、资源规划设计调查数据、作业设计调查数据、年度核查数据、草原确权数据、资源利用数据、草原自然保护区数据以及其他标准、文档、技术规程数据等。b)湿地数据,包括湿地调查和监测、湿地标准、湿地履约数据等,信息采集目标是查清湿地资源现状和动态变化。采取方法包括全国范围采取宏观遥感调查、典型野外样地调查、踏查和数据收集。专项野外调查,可按照LY/T2181-2013中的规定采集。c)荒漠化和沙化数据,包括全国荒漠化气候类型数据、全国沙尘暴监测数据以及其他标准、文档、技术规程数据等,可按照LY/T2182-2013中的规定采集。d)生物多样性数据,包括保护区数据、重点工程、专项调查、野生动植物、全国自然保护区分布以及其他标准、文档、技术规程数据等,可按照LY/T1814-2009中的规定采集。e)野生动植物数据,按照LY/T2179-2013中的规定采集。8.3.3 草原专题数据采集分为草原资源管理、草原培育及生态工程建设、灾害监控与应急、草原产业数据、草原科技等数据。a)草原资源管理数据,包括草场作业设计数据、草场限额执行检查数据、草原生态管护数据等;通过县级自查、省级复查、国家林草局按照一定比例以机械或典型抽样方式抽查、现场勘查、核实的方法。b)草原培育及生态工程建设数据,包括草场作业设计数据、草场实绩综合核查数据、天然草原资源保护工程数据、退耕还草数据、牧草种质资源数据等。c)灾害监控与应急数据,包括草原防火数据、草原有害生物数据等;其中草原火灾调查利用航天遥感、航空巡视、嘹望台观察和地面巡护的实时监测方法;草原有害生物利用遥感和实地监测、动植物检疫检查的方法调查。d)草原产业数据,包括草业市场数据、草原产品交易数据、价值行情数据等;根据企业上报草业部门和互联网等网络平台获取数据。e)草原科技数据,包括草原科技成果数据、草原实用技术数据、草业专家数据等;根据各级草业部门上报和互联网等网络平台获取数据。8.3.4 草原综合数据采集依据草原综合数据性质不同,获取方式不同,草原综合数据采集,主要包括对草原社会经济数据、草原文献资料数据、草原政策法规数据和草原报告数据等的规定。a)社会经济数据,各级草业部门上报和互联网络平台获取草原行业相关的经济数据。b)文献资料数据,包括草原资料和草原相关综述等材料。c)政策法规数据,各级草原管理相关部门按照权限发布的政策法规等,并且逐级上报。d)草原报告数据,报告数据依据草原行政部门职责不同,划分为国家级、省(区)级、市(县)草原管理站报告数据,由草监局、县级、市(县)级、省(区)级、国家级逐级上报数据,并统计分析。8.3.5 元数据采集元数据需标识草原数据资源数据基本属性,包括标识信息、数据质量信息、空间数据标识信息、空间参照信息、数据集内容描述、数据发行信息、引用信息、时间序列信息、联系信息。9 数据质量评估与监测技术 数据质量评估与监测技术主要是针对草原大数据质量进行评估和监测。9.1 数据质量评估体系本标准结合内蒙古自治区草原大数据特点,制定了草原大数据质量完整的评估体系,如图3所示。9.2 数据质量评价方法数据质量评价的核心是如何评价每个维度。目前,数据质量评估有定性和定量两种方法。a) 定性评价方法。定性评价方法是依据一定的评价标准和要求,根据评估的目的和用户需求,从定性分析的角度,来描述和评估数据资源。定性分析应由学科专家或专业人士执行。b) 定量评价方法。定量的方法是一个正式的、客观的、系统的过程,利用数值的数据来获得信息。因此,客观性、普遍性、数字特征往往会与这种方法相联系,其评价结果更直观、具体。10 草原大数据安全本标准规定草原大数据通用的安全规范和行业安全,其中通用要求基于信息安全技术的系列标准;行业安全重点针对人工智能、电子政务、工业互联网等各行业与信息主体利益密切相关的隐私数据。10.1通用安全 国标GB/T 31495.1-2015 信息安全技术 信息安全保障指标体系及评价方法 第1部分:概念和模型、国标GB/T 31495.2-2015 信息安全技术 信息安全保障指标体系及评价方法 第2部分:指标体系、 GB/T 31495.3-2015信息安全技术 信息安全保障指标体系及评价方法 第3部分:实施指南以及GB/T 34987-2017信息安全技术 移动智能终端个人信息保护技术要求等适用于本标准。10.2 行业安全国标GB/T22080-2016 信息技术 安全技术 信息安全管理体系 要求以及GB/Z 28828-2012 信息安全技术公共及商用服务信息安全系统个人信息保护指南等标准适用于本文件。11 平台及工具类标准本标准从数据使用过程中的过程性工具和终端应用类工具进行规范,主要包括系统类工具和应用类工具标准;系统类工具标准细分为平台基础设施、存储类工具、数据库、平台管理类工具等。11.1 系统类工具标准11.1.1 平台基础设施 国标GB/T 37721-2019 信息技术 大数据分析系统功能要求、GB/T 29262-2012 信息技术面向服务的体系结构(SOA)术语以及GB/T 29263-2012 信息技术面向服务的体系结构(SOA)应用的总体技术要求等标准适用于本文件。11.1.2存储类工具 国标GB/T 37722-2019 信息技术 大数据存储与处理系统功能要求标准适用于本文件。11.1.3数据库 国标GB/T 32908-2016 非结构化数据访问接口规范、GB/T 34949-2017实时数据库C语言接口规范以及行业标准 DL/T 1456-2015 电力系统数据库通用访问接口规范等标准适用于本文件。11.1.4平台管理类工具 国标 GBT 37721-2019信息技术大数据分析系统功能要求标准适用于本文件。11.2 应用类工具11.2.1 SQL操作函数如果对数据库中对象的访问可以通过SQL来完成 ,那么应用程序需要调用该部分接口函数来完成 。本标准中该类API函数的主要功能是执行SQL语句,获取查询语句执行结果。 GB/T 20531-2006 移动数据库应用编程接口规范标准 7。11.2.1.1 SQLAllocHandle语法INTEGER SQLAllocHandle(HANDLE DbHandle,HANDLE SQLHandle );参数DbHandle输入数据库句柄SQLHandle 输出分配的语句句柄,指向内存中已经分配的一个数据结构缓冲区返回值如果成功则返回MDB_SUCCESS;如果失败返回HDB_ERR。功能分配语句句柄。用法该函数分配的语句句柄用于对DbHandle对应的数据库进行操作,执行该函数之前,必须已经等该函数要操作的数据库打开,其句柄为DbHandle。差错诊断信息如果INT返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.1。11.2.1.2 SQLPrepare语法INTEGER SQLPrepare(HANDLE SQLHandle,CHARPTR SQLText,INTEGER SQLTextLen,INTPTR SQLType );参数SQLHandle 输入 语句句柄SQLText 输入 要执行的SQL语句SQLTextLen 输入 SQL语句的长度SQLType 输出 SQL语句类型,主要用于区分是查询语句还是非查询语句返回值如果成功返回MDB_SUCCESS;如果失败返回MDB_ERR。功能准备一个要执行的SQL查询语句,不立即执行。用法该函数在分配的语句句柄上完成执行该语句的准备工作,移动数据库引擎可以完成语句的语法分析、查询优化等。准备好的语句中可以使用位置参数。在SQLExecute之前调用。差错诊断信息如果INT返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.211.2.1.3 SQLBind Parameter语法INTEGER SQLBindParameter(HANDLE SQLHandle,INTEGER ParaNum,CHARPTR ParaBuf,INTEGER ParaBufType,INTEGER ParaBufLen);参数SQLHandle 输入 语句句柄ParaNum 输入 参数序号,起始序号为0ParaBuf 输入 存放绑定参数数据的缓冲区ParaBufType 输入 缓冲区的数据类型ParaBufLen 输入 缓冲区的数据长度,为正整数返回值如果成功则返回MDB_SUCCESS;如果失败返回MDB_ERR。功能将指定类型的数据缓冲区绑定到指定查询语句中的位置参数。用法该函数将绑定到语句参数的应用程序变量的地址填写到语句句柄的相应项中。差错诊断信息如果返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.311.2.1.4 SQLColAttribute语法INTEGER SQLColAttribute(HANDLE SQLHandle,INTEGER ColNum,CHARPTR ColName,INTPTR ColType,INTPTR ColLen,INTPTR ColScale);参数SQLHandle 输入 SQL语句句柄ColNum 输入 列号,取值为0,表的列数-1区间的正整数ColName 输出 列名ColType 输出 列类型ColLen 输出 列长度ColScale 输出 列标度返回值如果成功返回MDB_SUCCESS;如果失败返回MDB_ERR。功能返回指定语句句柄上关联的结果集的某列的属性信息。用法无特殊说明。差错诊断信息如果返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.411.2.1.5 SQLColCount语法INTEGER SQLColCount(HANDLE SQLHandle,INTPTR ColCount);参数SQLHandle 输入 SQL语句句柄ColCount 输出 SQL语句执行结果中的列数返回值如果成功返回MDB_SUCCESS;如果失败返回MDB_ERR。功能返回指定查询输出的结果集的列数。用法只有当SQLHandle指向的是一个SELECT类型的语句句柄时可用。差错诊断信息如果返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.511.2.1.6 SQLExecute语法INTEGER SQLExecute(HANDLE SQLHandle);参数SQLHandle 输入 要执行的SQL语句的句柄返回值如果成功返回MDB_SUCCESS;如果失败返回MDB_ERR。功能使用语句中当前已经绑定的参数,执行已经准备好的语句。用法必须在SQLPrapre之后执行,如果语句为查询语句,执行后结果集的信息将填写到语句句柄中的相应结果集缓冲区。差错诊断信息如果返回值为MDB_ERR,通过读取MDBCA中的MDBERRCODE确定出错原因。GB/T 20531-2006 移动数据库应用编程接口规范标准 7.611.2.1.7 SQLExecDirect语法INTEGER SQLExecDirect(HANDLE SQLHandle,CHARPTR SQLText,INTEGER SQLTextLen);参数SQLHandle 输入 语句句柄SQLText 输入 要执行的SQL语句SQLTextLen 输入 要执行的SQL语句的长度返回值如果成功返回MDB_SUCCESS;如果失败返回MDB_ERR。功能
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 各类标准


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!