气象资料及其表示课件

上传人:风*** 文档编号:241327756 上传时间:2024-06-18 格式:PPT 页数:120 大小:5.28MB
返回 下载 相关 举报
气象资料及其表示课件_第1页
第1页 / 共120页
气象资料及其表示课件_第2页
第2页 / 共120页
气象资料及其表示课件_第3页
第3页 / 共120页
点击查看更多>>
资源描述
气象统计方法气象统计方法气象统计方法第一章 气象资料及其表示方法1.1 单要素的气象资料单要素的气象资料 单要素数据资料的表示单要素数据资料的表示 基本统计量基本统计量1.2 多要素的气象资料多要素的气象资料 多要素数据资料的表示多要素数据资料的表示 基本统计量基本统计量1.3 正态分布的统计检验正态分布的统计检验1.4 区域资料的整理和利用区域资料的整理和利用第一章 气象资料及其表示方法1.1 单要素的气象资料 用统计方法作气象要素的分析和预报是依据用统计方法作气象要素的分析和预报是依据大量的大量的气象观测资料气象观测资料来进行的。来进行的。某个气象要素及其变化可看成为一个变量某个气象要素及其变化可看成为一个变量(或或随机变量随机变量)。总体总体(变量全部可能的取值变量全部可能的取值)、)、样本样本(收集的一组资料)(收集的一组资料)诊断分析诊断分析:利用统计学方法对样本进行分析:利用统计学方法对样本进行分析来估计和推测总体的规律性。来估计和推测总体的规律性。气象上的气象上的单个或多个气象要素单个或多个气象要素可看成为统计可看成为统计学中学中单个或多个变量单个或多个变量。用统计方法作气象要素的分析和预报是依据大量的气象观测 研究对象研究对象-气象要素气象要素 如温度、湿度、降水量、气压等等。如温度、湿度、降水量、气压等等。月、季、年平均值月、季、年平均值 日、侯平均值日、侯平均值第一节第一节 单个要素气象资料单个要素气象资料(短期气候预测)(短期气候预测)(短期天气预报)(短期天气预报)研究对象-气象要素第一节 单个要素气象资料(短期气候目的:目的:了解气象要素随时间变化的规律性。了解气象要素随时间变化的规律性。如:选取南京市如:选取南京市1961-2010年逐年年逐年7月份降水月份降水资料进行研究。资料进行研究。问题的提出:问题的提出:如何用数学方法表示样本?如何用数学方法表示样本?如何描述样本的统计特征?如何描述样本的统计特征?(研究样本)(研究样本)目的:了解气象要素随时间变化的规律性。问题的提出:如何用数学一、单要素数据资料一、单要素数据资料 1、表示:、表示:某要素某要素x有有n次观测值,其向量表达形式为次观测值,其向量表达形式为:n:样本容量样本容量或或常用常用一、单要素数据资料 1、表示:n:样本容量或常用2、含义:、含义:随时间变化的数据序列,习惯称为时间序列。随时间变化的数据序列,习惯称为时间序列。3、几何意义:、几何意义:(1)n维空间中的一个点;维空间中的一个点;(2)一维空间中的)一维空间中的n个点。个点。2、含义:二、基本统计量二、基本统计量 在气候诊断中,常用一些量来表征气在气候诊断中,常用一些量来表征气候状态的基本统计特征。候状态的基本统计特征。二、基本统计量 在气候诊断中,常用一些量来表征气1、平均值、平均值(均值均值)是描述某一气候变量样本)是描述某一气候变量样本平均平均水平水平的量。它代表样本取值的量。它代表样本取值中心趋势中心趋势的统计量。的统计量。其表达式为:其表达式为:n 个样本个样本n+1个样本个样本推导?推导?中心趋势统计量中心趋势统计量65324143.51、平均值(均值)是描述某一气候变量样本平均水平的量。它代表平均值作为要素总体数学期望的一个估计,反平均值作为要素总体数学期望的一个估计,反映了该要素的映了该要素的平均(气候)状况平均(气候)状况。气象上经常出现的气象上经常出现的月平均气温月平均气温、年平均气温年平均气温及及某要素某要素多年平均值多年平均值就是这种统计量。就是这种统计量。(注意不同平均值的含义和计算方式,以(注意不同平均值的含义和计算方式,以1961-1961-20102010年南京逐月平均气温资料为例)年南京逐月平均气温资料为例)意义及应用:意义及应用:平均值作为要素总体数学期望的一个估计,反映了该要素的平均(气1月月2月月3月月4月月5月月6月月7月月8月月9月月10月月11月月12月月1961年年a1a2a3a4a5a6a7a8a9a10a11a12Y11962年年a13a14a15a16a17a18a19a20a21a22a23a24Y21963年年a25a26a27a28a29a30a31a32a33a34a35a36Y3.2010年年a589a590a591a592a593a594a595a596a597a598a599a600Y50M1M2M3M4M5M6M7M8M9M10M11M12A1961-2010年南京历年逐月平均气温资料年南京历年逐月平均气温资料1月2月3月4月5月6月7月8月9月10月11月12月11961-2010年南京历年逐月平均气温年南京历年逐月平均气温1961-2010年南京历年逐月平均气温15.615.6南京各月多年平均降水量南京各月多年平均降水量南京历年月降水量南京历年月降水量南京各月多年平均降水量南京历年月降水量问题:问题:1.1.气温和降水量在计算统计平均值时有何不同?气温和降水量在计算统计平均值时有何不同?2.2.月平均气温与月气温是否一样?月平均气温与月气温是否一样?3.3.月平均降水量与月降水量是否一样?月平均降水量与月降水量是否一样?4.4.南京多年平均南京多年平均1 1月气温与南京历年月气温与南京历年1 1月平均气温的月平均气温的区别?区别?问题:2、中位数、中位数 中位数是表征气候变量中心趋势的另一个量。在中位数是表征气候变量中心趋势的另一个量。在按按大小顺序排列大小顺序排列的气候变量中,的气候变量中,位置居中的那个数位置居中的那个数就就是中位数。其优点是它不易受异常值的干扰。特别是中位数。其优点是它不易受异常值的干扰。特别是在样本量较小的情况下。是在样本量较小的情况下。样本奇数情况下直接取中位数样本奇数情况下直接取中位数 样本偶数情况?样本偶数情况?取中间两数取中间两数的平均值的平均值2、中位数 取中间两数的平均值3、众数、众数1)概念)概念 要素(变量)值中要素(变量)值中出现次数最多出现次数最多的那个数。的那个数。2)意义)意义 表征研究要素的一般水平。表征研究要素的一般水平。众数和中位数又称为众数和中位数又称为位置平均数位置平均数,不受极端变量,不受极端变量值的影响。值的影响。3、众数1)概念注:若有特别大的极大值和特别小的极小注:若有特别大的极大值和特别小的极小值存在,最好采用众数和中位数。值存在,最好采用众数和中位数。变量取值次数较少,或虽然取值次数变量取值次数较少,或虽然取值次数多,但无明显集中趋势,计算众数就没有多,但无明显集中趋势,计算众数就没有意义了。意义了。注:若有特别大的极大值和特别小的极小值存在,最好采用众数和中变化幅度统计量变化幅度统计量 气气象象和和气气候候研研究究中中,大大家家更更关关心心的的是是其其变变化化。如如气候变化,天气变化等。气候变化,天气变化等。均均值值和和中中位位数数等等只只告告诉诉气气候候变变量量变变化化的的平平均均水水平平,却无法知道这种变化与正常情况的偏差和变化的波动。却无法知道这种变化与正常情况的偏差和变化的波动。有没有其他的统计量来表征变化幅度和变化波动呢?有没有其他的统计量来表征变化幅度和变化波动呢?描述气候变化与正常情况的偏差和变化的波动量描述气候变化与正常情况的偏差和变化的波动量:距平距平 方差与标准差方差与标准差 变率和变差系数变率和变差系数变化幅度统计量 气象和气候研究中,大家更关心的1、距平、距平 (anomaly)描描述述气气候候变变量量偏偏离离正正常常情情况况的的偏偏差差。气气象象上上常常用用的的变量,也就是通常说的变量,也就是通常说的异常。异常。一组数据中的某一个数一组数据中的某一个数xi与均值的差就是与均值的差就是距平。距平。单变量样本(序列)中单变量样本(序列)中每个样本资料点的距平值每个样本资料点的距平值组组成的序列称为该变量的成的序列称为该变量的距平序列距平序列。6532421-1-204xixdi1、距平 (anomaly)单变量样本(序列)中每个样本资1月月2月月3月月4月月5月月6月月7月月8月月9月月10月月11月月12月月1961年年a1a2a3a4a5a6a7a8a9a10a11a12Y11962年年a13a14a15a16a17a18a19a20a21a22a23a24Y21963年年a25a26a27a28a29a30a31a32a33a34a35a36Y3.2010年年a589a590a591a592a593a594a595a596a597a598a599a600Y50M1M2M3M4M5M6M7M8M9M10M11M12A1961-2010年南京历年逐月平均气温资料年南京历年逐月平均气温资料1月2月3月4月5月6月7月8月9月10月11月12月1举例:举例:1月份和月份和7月份南京降水量情况,距平月份南京降水量情况,距平 值比原始绝对数量更能说明问题。值比原始绝对数量更能说明问题。南京降水南京降水降水总量降水总量降水距平降水距平1月月54.918.87月月120.5-24.2降水距平百分率:降水距平百分率:(距平距平/平均平均值)*100%举例:1月份和7月份南京降水量情况,距平南京降水降水总量降水气象上的应用:气象上的应用:中中心心化化的的概概念念:把把资资料料处处理理为为距距平平的的方方法法叫叫中中心心化化。气气象象上上常常用用距距平平值值代代替替原原样样本本中中的的资资料料值值作作为为研研究究对象。对象。中中心心化化的的必必要要性性:因因为为气气象象要要素素的的年年变变化化周周期期影影响响很很大大,各各月月的的平平均均值值不不一一样样,为为了了使使之之能能在在同同一一水水平平下下比比较较,常常使使用用距距平平值值。用用距距平平直直接接作作为为预预报报值值,比较直观(偏高比较直观(偏高/偏低)。偏低)。主要特征:主要特征:任何变量序列,经过距平化处理后,任何变量序列,经过距平化处理后,都可以化为平均值为都可以化为平均值为0的序列。(的序列。(证明?证明?)气象上的应用:主要特征:任何变量序列,经过距平化处理后,都可28.12.428.12.419612008年黄河流域区域平均的夏季降水年黄河流域区域平均的夏季降水量距平的年量距平的年际变化(化(单位:位:mm)正、负值正、负值总和相等总和相等如何判断距平图是否正确?如何判断距平图是否正确?19612008年黄河流域区域平均的夏季降水量距平的年际变地气温差()19612008年西北干旱区春季地气温差距平的年际变化年西北干旱区春季地气温差距平的年际变化地气温差()错误的错误的图图正确的正确的图图地气温差()19612008年西北干旱区春季地气温差距平问题:问题:请请问问一一个个距距平平序序列列与与其其原原始始序序列列的的演演变变趋势(曲线图形状)有何不同?趋势(曲线图形状)有何不同?谁来回答?谁来回答?问题:气象资料及其表示课件2、标准差(均方差)与方差、标准差(均方差)与方差 方差方差s2与标准差(均方差)与标准差(均方差)s是描述样本中数据是描述样本中数据与平均值差异的平均状态,反映变量以平均值为与平均值差异的平均状态,反映变量以平均值为中心的中心的平均振动幅度(平均振动幅度(离散程度离散程度)的特征量。的特征量。2、标准差(均方差)与方差方差的向量表示形式:方差的向量表示形式:xdi为距平值,为距平值,T 表示转置表示转置.方差的向量表示形式:xdi为距平值,T 表示转置.1)如果如果12月份气温标准差比月份气温标准差比1月份大,反映了月份大,反映了12月月份气温随时间份气温随时间变化幅度变化幅度比比1月大。月大。气象上的应用:气象上的应用:均方差:均方差:12月月 1.75 1月月 1.09问题:问题:均方差小的要素预报比大的困难还均方差小的要素预报比大的困难还是容易?原因?是容易?原因?1)如果12月份气温标准差比1月份大,反映了12月份气温随时3)变量加(减)某常数后均方差)变量加(减)某常数后均方差相同相同。t123456789均方差均方差xt100 105 106 108 110112114115995.40 xt-100056810121415-15.402)对对于于同同一一个个月月,如如果果南南京京气气温温的的标标准准差差比比北北京京小小,说说明明北北京京气气温温变变化化幅幅度度大大。(内内陆陆日日变变化化较沿海大,这个比较就是使用标准差比较的较沿海大,这个比较就是使用标准差比较的)3)变量加(减)某常数后均方差相同。t123456789均方近近100100年北半球海平面气压场的方差分布图年北半球海平面气压场的方差分布图1.图中是否会有负值?图中是否会有负值?2.图中高,低值分别表示什么意思?图中高,低值分别表示什么意思?近100年北半球海平面气压场的方差分布图图中是否会有负值?资料的资料的标准化标准化处理处理Why standardized?在气象要素中,各个要素的单位不一样,平均值在气象要素中,各个要素的单位不一样,平均值及方差也不同。为使它们能在同一水平上进行比及方差也不同。为使它们能在同一水平上进行比较,采用标准化办法,较,采用标准化办法,使它们变成同一水平的使它们变成同一水平的无无单位单位(量纲量纲)的变量的变量-标准化变量。标准化变量。在气候诊断分析中,也常对资料进行在气候诊断分析中,也常对资料进行标准化处理标准化处理,得到标准化序列来代替气候变量本身的观测数据。得到标准化序列来代替气候变量本身的观测数据。资料的标准化处理Why standardized?在气象要素 气象气象变量量xi,样本容量本容量为n,为平均平均值,方差是,方差是s2,标准化后准化后变量量为xzi,平均,平均值为 ,方差,方差为任何气候变量序列经过标准化处理后,都任何气候变量序列经过标准化处理后,都可以化为可以化为平均值为平均值为0、方差为、方差为1的序列的序列 气象变量xi,样本容量为n,为平均值,方差是s2,标标准化处理的好处:标准化处理的好处:1 1)不同气象要素经标准化处理)不同气象要素经标准化处理消去单位消去单位后,具有后,具有相同的均方差相同的均方差,可以互相比较异常程度;,可以互相比较异常程度;2 2)标准准化化处理理后后,变量量的的值一一般般在在(-3-33 3)之之间,绘图方方便便;变量量值不不在在(-3-33 3)之之间的的概概率率仅为0.00270.0027。3 3)一一般般距距平平达达到到或或者者大大于于2 2倍倍均均方方差差概概率率不不到到5%5%,可以可以确定异常确定异常标准(如准(如严寒、高温、旱寒、高温、旱涝年等)。年等)。4 4)可以)可以检查资料的可靠性和正确性料的可靠性和正确性。标准化处理的好处:气象资料及其表示课件3、变率和率和变差系数差系数1)意)意义:说明明变量量值变化的大小。化的大小。2)变率:率:绝对变率率:距平:距平绝对值的平均。的平均。相相对变率率:绝对变率与平均率与平均值之比(百分比)。之比(百分比)。3、变率和变差系数1)意义:3 3)变差系数差系数:标准差与平均准差与平均值之比(之比(%),表示),表示变量的相量的相对变化。化。3)变差系数:注意:注意:变率率和和标准准差差的的数数量量级与与变量量平平均均值的量的量级有关。有关。有有些些同同类型型变量量,彼彼此此之之间平平均均值差差别大大,若若要要比比较它它们的的变化化性性用用绝对变率率和和标准准差差不不恰恰当当,应当当利利用用相相对变率率或或变差系数。差系数。注意:累积频率累积频率是反映分布形态统计量的一个指标。是反映分布形态统计量的一个指标。概念的引入:概念的引入:t123456789101112平均值平均值均方差均方差x-6-5-4-3-2001246704.04y-8-5000000003.159.8504.04平均值和均方差相同,但取值有很大区别,为平均值和均方差相同,但取值有很大区别,为区别其特征,需引入新的统计量区别其特征,需引入新的统计量-累积频累积频率。率。累积频率是反映分布形态统计量的一个指标。t12345678累积频率累积频率(样本特征样本特征)-)-有限样本的统计有限样本的统计累积频率的定义:累积频率的定义:变量变量小于某上限值小于某上限值的次数的次数 与总次数之比。与总次数之比。上限上限-8-7-6-5-4-3-2-1X的累积频率的累积频率0001/122/123/124/125/12Y的累积频率的累积频率01/121/121/122/122/122/122/12t123456789101112平均值平均值均方差均方差x-6-5-4-3-2001246704.04y-8-5000000003.159.8504.04上限上限012346710X的累积频率的累积频率5/127/128/129/129/1210/1211/1212/12Y的累积频率的累积频率2/1210/1210/1210/1211/1211/1211/1212/12累积频率(样本特征)-有限样本的统计累积频率的定义:上限上限上限l分布函量分布函量:无限总体中的累积频率。无限总体中的累积频率。为概率密度函数为概率密度函数,其常见的函数形式为其常见的函数形式为正态分布正态分布:上限上限和和为变量为变量的总体平均值(数学期望)和均方差的总体平均值(数学期望)和均方差分布函量:无限总体中的累积频率。为概率密度函数,其常见的函数状状态资料:料:表征气象要素的各种状表征气象要素的各种状态,观测结果无法用数据表示。果无法用数据表示。如如雾、冰雹、霜、冰雹、霜-用用“有有”或或“无无”、“强强”或或“弱弱”等表示。等表示。雨的雨的强强度度-等等级表示,如大暴雨、大雨等。表示,如大暴雨、大雨等。风的的强强度等度等级-1-1级、2 2级、1212级等等。等等。状态资料及其统计特征:状态资料及其统计特征:状态资料:表征气象要素的各种状态,观测结果无法用数据表示。状 对对于于气气温温、气气压压及及降降水水量量等等气气象象要要素素,观观测测值值在在正正、负负无无穷穷之之间间,这这种种类类型型要要素素可可看看成成为为连连续续型随机变量型随机变量。气气象象中中一一些些气气象象要要素素,如如冰冰雹雹、晕晕、雾雾等等天天气气现现象象,气气象象资资料料中中仅仅记记录录为为“有有”或或“无无”可可用用“1”或或“0”二二值值数数字字化化表表征征,这这类类变变量量可可看看成成离离散散型型随随机机变变量量。其其中中云云量量,常常用用110来来分分级级也属于这一类型。也属于这一类型。状态资料及其统计特征:状态资料及其统计特征:对于气温、气压及降水量等气象要素,观测值在正、负无穷之间频率表、分布列频率表、分布列对气象要素对气象要素现象现象的各种状态如何描述其统计特征?的各种状态如何描述其统计特征?列出各个状态出现的频率。列出各个状态出现的频率。对样本而言是对样本而言是频率表频率表,总体而言称为,总体而言称为分布列分布列。状态资料及其统计特征:状态资料及其统计特征:频率表、分布列对气象要素现象的各种状态如何描述其统计特征?状第一章 气象资料及其表示方法1.1 单要素的气象资料单要素的气象资料 单要素数据资料的表示单要素数据资料的表示 基本统计量基本统计量1.2 多要素的气象资料多要素的气象资料 多要素数据资料的表示多要素数据资料的表示 基本统计量基本统计量1.3 正态分布的统计检验正态分布的统计检验1.4 区域资料的整理和利用区域资料的整理和利用第一章 气象资料及其表示方法1.1 单要素的气象资料*也可以理解为同一要素多个也可以理解为同一要素多个站点(格点)的资料。站点(格点)的资料。第二节第二节 多要素的气象资料多要素的气象资料*也可以理解为同一要素多个站点(格点)的资料。第二节 多要素气象资料及其表示课件气象资料及其表示课件气象资料及其表示课件全国全国160站站点分布站站点分布全国160站站点分布一、数据资料的表示一、数据资料的表示 1 1、表示:、表示:多气象要素的样本如何表示?多气象要素的样本如何表示?-矩矩阵阵 设有设有m个气象要素,每个要素有个气象要素,每个要素有n次观测值,则数次观测值,则数据矩阵为:据矩阵为:一、数据资料的表示第第j个样本的资料向量为个样本的资料向量为:第j个样本的资料向量为:温度温度/站点站点A降水降水/站点站点BR型因子分析型因子分析Q型因子分析型因子分析2 2、数据的两种空间表示、数据的两种空间表示(几何意义)(几何意义)n维空间中的维空间中的m个点(行)个点(行)R型因子分析:型因子分析:研究研究m个变量之间的关系个变量之间的关系-相关系数相关系数m维空间中的维空间中的n个点(列)个点(列)Q型因子分析:型因子分析:研究研究n个样本之间的关系个样本之间的关系-相似系数相似系数温度/站点A降水/站点BR型因子分析Q型因子分析2、数据的两3、均值向量m个变量的样本平均值组成的向量。个变量的样本平均值组成的向量。m维空间中的维空间中的n个点的重心个点的重心.3、均值向量m个变量的样本平均值组成的向量。m维空间中的n个 多年平均多年平均1月气温月气温(19712010年)年)多年平均多年平均7月气温月气温(19712010年)年)多年平均1月气温(19712010年)多年平均 多年平均多年平均1月降水量月降水量(19712010年)年)多年平均多年平均7月降水量月降水量(19712010年)年)多年平均1月降水量(19712010年)多年平2013年年7月月131日日,淮淮河河以以南南地地区区平平均均气气温温30.6,比比常常年年同同期期偏偏高高2.9,为为1961年以来同期最高。年以来同期最高。2013年7月131日,淮河以南地区平均气温30.6,比沿江苏南部分台站极端最高气温超其建站以来极值沿江苏南部分台站极端最高气温超其建站以来极值。沿江苏南部分台站极端最高气温超其建站以来极值。月降水量大部分地区偏少月降水量大部分地区偏少月降水量大部分地区偏少衡量任意两个气象要素衡量任意两个气象要素(变量)之间关系(变量)之间关系的统计量主要有的统计量主要有协方差、相关系数协方差、相关系数。二、基本统计量二、基本统计量-相关程度统计量相关程度统计量衡量任意两个气象要素(变量)之间关系的统计量主要有协方差、相1、协方差、协方差:2个变量距平向量的乘积。个变量距平向量的乘积。定义:定义:n个样本的资料序列个样本的资料序列 ,其协方差为:其协方差为:协方差是反映两个气象要素协方差是反映两个气象要素异常关系异常关系的平均状况。的平均状况。变量自身的协方差变量自身的协方差-方差方差1、协方差:2个变量距平向量的乘积。协方差是反映两个气象要T0与与T1的距平符号相同率高,有相同的变化趋势;的距平符号相同率高,有相同的变化趋势;H与与LE的距平符号相反率高,有相反的变化趋势;的距平符号相反率高,有相反的变化趋势;两组变量均有良好的关系。两组变量均有良好的关系。协方差为协方差为正正 变化变化一致一致 负负 变化变化相反相反 问题:问题:协方差带单位,不同要素之间不好比较,如何解决?协方差带单位,不同要素之间不好比较,如何解决?T0与T1的距平符号相同率高,有相同的变化趋势;12121:12月月2:1月月3:2月月12121:12月气象资料及其表示课件协方差矩阵协方差矩阵m阶对称矩阵,对角线元素是第阶对称矩阵,对角线元素是第i个变量的方差。个变量的方差。协方差矩阵m阶对称矩阵,对角线元素是第i个变量的方差。为方便起见,可用为方便起见,可用离差积离差积表示,构成离差矩阵。表示,构成离差矩阵。总体协方差矩阵的无偏估计:总体协方差矩阵的无偏估计:为方便起见,可用离差积表示,构成离差矩阵。总体协方差矩阵的若若 是是未未知知参参数数的的一一个个点点估估计计量量,即即 ,则则 称称为为的的无无偏偏估估计计值值.此时,用此时,用 代替代替不含系统误差不含系统误差.样样本本均均值值是是总总体体均均值值的的无无偏偏估估计计值值;修修正正样本方差是总体方差的无偏估计值样本方差是总体方差的无偏估计值.无无偏偏估估计计值值未未必必是是唯唯一一的的,当当然然应应选选对对的的平平均均偏偏差差较较小小者者为为好好(有有效效性性),即即估估计计值值应应有有尽尽量量小小的的方方差差,方方差差最最小小的的估估计计值值就就是是有效估计值。有效估计值。若 是未知参数求北京气温求北京气温12月、月、1月、月、2月的协方差月的协方差 阵:阵:求北京气温12月、1月、2月的协方差 阵:协方差是带单位的统计量,不便于比较不协方差是带单位的统计量,不便于比较不同要素的异常关系。利用标准化处理方法,对同要素的异常关系。利用标准化处理方法,对变量先进行标准化,然后计算协方差(不带单变量先进行标准化,然后计算协方差(不带单位),这种协方差就是位),这种协方差就是相关系数。相关系数。相关系数相关系数-标准化的协方标准化的协方差差 2、相关系数相关系数 (Pearson相关系数)相关系数)协方差是带单位的统计量,不便于比较不同要素的异相关系数计算公式:相关系数计算公式:相关系数相关系数是描述两个随机变量是描述两个随机变量线性相关线性相关的统的统计量。用计量。用r表示。设有两个变量序列:表示。设有两个变量序列:;相关系数计算公式:相关系数是描述两个随机变量线性相关的统计量用标准差的形式表示的相关系数:用标准差的形式表示的相关系数:变量自身对自身的相关系数为多少?变量自身对自身的相关系数为多少?相关系数值的范围为相关系数值的范围为-1 +1 r0?r 0 偏左偏左 g1 =0 对称对称 0 陡陡 g2坡度坡度 =0 正好正好 0 平平1、正态分布检验的统计量偏度系数:表征分布形态与平均值偏离的若若g1=0,g2=0时,变量为理想正态分布时,变量为理想正态分布。所以,可以利用。所以,可以利用g1、g2值测定出偏离值测定出偏离0的程度,确定变量是否遵从正态分布。的程度,确定变量是否遵从正态分布。实际应用时,对实际应用时,对g1和和g2进行统计检验,以判定变量是否近似进行统计检验,以判定变量是否近似正态分布。正态分布。偏右偏右偏左偏左若g1=0,g2=0时,变量为理想正态分布。所以,可以利用g利用公式算出利用公式算出g1=0.96,g2=-0.17。表明:天津夏季降水量的。表明:天津夏季降水量的分布图形分布图形顶峰向左偏顶峰向左偏,坡度稍平坡度稍平。要判定其是否遵从正态分。要判定其是否遵从正态分布或近似正态分布,还需进一步做分布的统计检验。布或近似正态分布,还需进一步做分布的统计检验。利用公式算出g1=0.96,g2=-0.17。表明:天津夏2、正态分布检验、正态分布检验 当样本量当样本量n足够大时,标准偏度系数和标准峰度足够大时,标准偏度系数和标准峰度系数都以系数都以标准正态分布标准正态分布N(0,1)为渐近分布为渐近分布。所以,。所以,对变量作整体性检验,就是提出变量遵从正态分布对变量作整体性检验,就是提出变量遵从正态分布的原假设,通过的原假设,通过标准正态分布表标准正态分布表对对g1和和g2作检验。作检验。确定出信度范围确定出信度范围,查表即可得出结论。,查表即可得出结论。2、正态分布检验 当样本量n足够大时,标准偏度系数和标准=a)u=注意:注意:由于正态分布的对称性,查表查的信度为由于正态分布的对称性,查表查的信度为/2。=a)u=注意:信信度度u信度u必要性:必要性:各类统计预报模型和统计检验方法(各类统计预报模型和统计检验方法(F、t 和和 u 检验检验等)首先要求资料符合正态分布(等)首先要求资料符合正态分布(先决条件先决条件)。)。经验表明:经验表明:年、月平均气温、气压、多雨地区的月降水量通常符年、月平均气温、气压、多雨地区的月降水量通常符合正态分布合正态分布;旬平均气温基本符合,旬平均气温基本符合,旬、侯降水量不一定符合旬、侯降水量不一定符合;日降水和少雨地区月降水通常是偏态的日降水和少雨地区月降水通常是偏态的!3、正态化处理、正态化处理必要性:经验表明:3、正态化处理3、正态化处理方法、正态化处理方法对于不遵从正态分布的变量可以作适当的变换,使其正对于不遵从正态分布的变量可以作适当的变换,使其正态化。常用方法有:态化。常用方法有:对数变换对数变换(对原始数据去对数):(对原始数据去对数):角变换角变换(适用于遵从二项分布的变量):(适用于遵从二项分布的变量):立方根立方根(或四次方根)转换法:(或四次方根)转换法:或双曲正切转换法双曲正切转换法:平方根变换平方根变换(对离散型变量比较奏效):(对离散型变量比较奏效):3、正态化处理方法对于不遵从正态分布的变量可以作适当的变换,第四节第四节 区域资料的整理和利用区域资料的整理和利用1 1、区域资料的整理方法、区域资料的整理方法2 2、资料的审查和订正方法、资料的审查和订正方法第四节 区域资料的整理和利用1、区域资料的整理方法 区域资料的整理主要用于考虑某个变量在某个区域内的区域资料的整理主要用于考虑某个变量在某个区域内的整体分布情况,更多地用于分析整个区域变量的时间变化。整体分布情况,更多地用于分析整个区域变量的时间变化。(1 1)代表站方法代表站方法(平均相关系数最大的台站)(平均相关系数最大的台站)(2 2)区域平均法区域平均法(区域内所有站的平均值)(区域内所有站的平均值)(3 3)综合指数法综合指数法(考虑各台站方差的差异)(考虑各台站方差的差异)一、区域资料的整理一、区域资料的整理Kj意义:意义:综合反映了区域内综合反映了区域内m个测站气象要素的个测站气象要素的异常异常情况情况用于区域内各测站要素的方差较大情况下。用于区域内各测站要素的方差较大情况下。区域资料的整理主要用于考虑某个变量在某个区域内的(13种方法种方法 优优 点点 缺缺 点点代表站法代表站法计算算简便,便于分析便,便于分析代表站点不易确定代表站点不易确定区域平均法区域平均法计算算简便,与便,与实际情情况况较为一致一致如果出如果出现异常站点异常站点则影响整体分析影响整体分析综合指数法合指数法考考虑因素因素较多,比多,比较合理合理计算算较繁繁琐通常综合考虑代表站法和区域平均法。通常综合考虑代表站法和区域平均法。具体方法:利用代表站法去除区域中的异常具体方法:利用代表站法去除区域中的异常站点,然后再用区域平均法计算。站点,然后再用区域平均法计算。一、区域资料的整理一、区域资料的整理3种方法 优 点 缺 点代表站法计二、资料的审查和订正方法二、资料的审查和订正方法 统统计计气气候候观观测测记记录录的的目目的的就就是是要要比比较较不不同同地地区区的的气气候候特特征征,研研究究气气候候要要素素的的时时空空变变化化规规律律。因因此此,在在统统计计这这些些观观测测记记录录序序列列之之前前,必必须须首首先先检检查查资资料料的可靠性和均匀(均一)性。的可靠性和均匀(均一)性。可靠性可靠性:记录的:记录的精度和准确性达到一定的要求精度和准确性达到一定的要求。均均一一性性:记记录录序序列列逐逐年年的的变变化化仅仅受受气气候候条条件件的的影影响响,不不受受仪仪器器的的更更换换、测测站站位位置置的的变变迁迁、观观测测规规程程的的改改变以及观测员的主观偏见等因素的影响。变以及观测员的主观偏见等因素的影响。气候资料的质量审查主要依据气候学原理和统计气候知识。气候资料的质量审查主要依据气候学原理和统计气候知识。二、资料的审查和订正方法 统计气候观测记录的目的 在在资资料料审审查查后后,必必须须对对资资料料序序列列中中个个别别缺缺、错错的的记记录录加加以以适适当当订订正正,称称为为资资料料的的插插补补。由由于于非非气气候候因因素素造造成成的的记记录录不不均均一一性性,也也必必须须以以适适当当的的方方法法加加以以纠纠正正。对对于于观观测测记记录录长长度度不不一一致致的的一一些些台台站站,为为了了比比较较各各个个台台站站的的统统计计特特征征值值,观观测测记记录录时时期期必必须须大大体体一一致致。因因此此假假如如观观测测序序列列太太短短,就就需需将将其其记记录录订正到长年时期,称为资料的订正到长年时期,称为资料的延长延长。在资料审查后,必须对资料序列中个别缺、由由于于气气候候变变化化严严重重影影响响世世界界经经济济的的发发展展和和人人类类社社会会的的生生产产及及生生活活,迫迫使使国国际际上上对对于于气气候候变变化化观观测测事事实实研研究究愈愈加加重重视视,因因而而特特别别强强调调气气候候历历史史资资料料的的整整理理和和恢恢复复。采采用用统统计计学学方方法法订订正正单单个个测测站站的的气气候候资资料料,不不但但在在以以往往若若干干年年已已取取得得相相当当的的成成效效,而而且且借借助助多多元元统统计计的的复复杂杂方方法法还还可可将将气气候候资资料料订订正正的的思思想想推推广广至至气气候候序序列列的的订订正正或或整整个统计分布的订正。个统计分布的订正。由于气候变化严重影响世界经济的发展和人类社会的生1 1、气候资料的质量标准、气候资料的质量标准 从从统统计计意意义义上上讲讲,各各种种气气象象要要素素观观测测值值都都可可以以看看作作随随机机变变量量。一一地地的的气气候候状状态态可可以以用用描描述述气气候候特特征征的的各各种种气气候候要要素素指指标标来来表表示示,如如算算术术平平均均值值、均均方方差差等等。这这些些气气候候指指标标实实质质上上都都是是要要素素总总体体数数字字特特征征的的样样本本值值。气气候候要要素素指指标标能能否否很很好好地地反反映映一一地地真真实实的的气气候候特特征征,主主要要取取决决于于两两方方面面的的因因素素:(1)观观测测值值对对真真值值的的误误差差(观观测测误误差差);(2)样样本本值值对对总总体值的抽样误差。体值的抽样误差。1、气候资料的质量标准 从统计意义上讲,各种气象要素观1)要素观测值对真值的观测误差)要素观测值对真值的观测误差,观测误差分为三类:系统误差、随机误差和过失误差观测误差分为三类:系统误差、随机误差和过失误差。系统误差系统误差:由于仪器不良、观测方法不完善等因素造成。这由于仪器不良、观测方法不完善等因素造成。这种误差在各次观测中的大小和符号保持不变。种误差在各次观测中的大小和符号保持不变。通过校正仪器和改善观测方法可基本消除。通过校正仪器和改善观测方法可基本消除。根据规定进行器差订正后的观测值对真值的系统误差:温根据规定进行器差订正后的观测值对真值的系统误差:温度不超过度不超过0.05,气压不超过,气压不超过0.05hPa,降水量不超过,降水量不超过0.05mm。如果在整个记录时期,误差无改变,则由如果在整个记录时期,误差无改变,则由N次观测求得的算次观测求得的算术平均值对真值的系统误差等于每次观测中的系统误差。而术平均值对真值的系统误差等于每次观测中的系统误差。而N次观测值总和的系统误差将是每次观测的系统误差的次观测值总和的系统误差将是每次观测的系统误差的N倍。倍。1)要素观测值对真值的观测误差,观测误差分为三类:系统误差过失误差过失误差:由于责任心不强,操作不慎等原因由于责任心不强,操作不慎等原因造成的与实际情况明显不符的错误观测值对真造成的与实际情况明显不符的错误观测值对真值的误差。如读错刻度、记错读数、计算错误值的误差。如读错刻度、记错读数、计算错误等。等。通过对资料的仔细审核、校对进行改正通过对资料的仔细审核、校对进行改正过失误差:由于责任心不强,操作不慎等原因造成的与实际情况明显随随机机误误差差各各次次观观测测值值是是相相互互独独立立的的。所所以以,N次次观观测测值值算算术术平平均均值值对对真真值值的的误误差差的的方方差差是是一一次次观观测测的的随随机机误误差差的的1/N倍倍,而而N次次观观测测总总和和的的随机误差的方差则是一次观测时的随机误差的方差则是一次观测时的N倍。倍。因因此此,旬旬、月月、年年平平均均气气温温的的随随机机误误差差一一般般可可以以忽忽略略不不计计;但但降降水水总总量量则则不不同同,如如果果降降水水量量每每次次观观测测精精确确到到0.1mm,则则年年、月月降降水水量量的的随随机误差可达几个毫米。机误差可达几个毫米。随随机机误误差差:随随机机因因素素造造成成。如如四四舍舍五五入入的的小小数数位位数的取舍、仪器刻度的限制。数的取舍、仪器刻度的限制。随机误差各次观测值是相互独立的。所以,N次观测值算术平均值对2)数字特征样本值对总体值的抽样误差)数字特征样本值对总体值的抽样误差一般的,样本容量越大,特征值的抽样误差越小。一般的,样本容量越大,特征值的抽样误差越小。如样本平均值的抽样误差:如样本平均值的抽样误差:m为真实平均数为真实平均数.2)数字特征样本值对总体值的抽样误差一般的,样本容量越大,特1)精确性和准确性)精确性和准确性2)均一性)均一性3)代表性)代表性4)比较性)比较性2 2、对气候资料质量的要求、对气候资料质量的要求1)精确性和准确性2、对气候资料质量的要求(1 1)准确性和精确性)准确性和精确性精确性精确性:指测量得到数据的集中程度。:指测量得到数据的集中程度。准确性准确性:指观测值与真值的符合程度。:指观测值与真值的符合程度。对对准准确确性性的的审审查查:主主要要检检查查资资料料中中有有无无明明显显过过失失误误差差和和系系统统误误差差,如如发发现现有有,应应将将其其改改正正或或订订正正,无无法改正的,则不参加统计分析;法改正的,则不参加统计分析;精精确确性性的的审审查查:主主要要看看其其记记录录是是否否达达到到规规定定的的精精度度,如如气气温温达达到到0.1,气气压压达达到到0.1hPa,降降水水达达到到0.1mm等。等。(1)准确性和精确性精确性:指测量得到数据的集中程度。(2 2)均一性)均一性 如果测站气象记录序列仅仅是气候变化的反映,如果测站气象记录序列仅仅是气候变化的反映,那么资料是均一的。那么资料是均一的。测站位置的迁移,周围环境的改变,观测仪器和安测站位置的迁移,周围环境的改变,观测仪器和安装方法的更新,观测时制的改变都可能破坏资料的装方法的更新,观测时制的改变都可能破坏资料的均一性。分析时应注意。均一性。分析时应注意。(2)均一性 如果测站气象记录序列仅仅是气候变化的反映,一一般般说说,由由于于地地理理环环境境的的差差异异各各个个测测站站所所能能代代表表的的范范围围是是很很不不一一样样的的。气气候候记记录录的的代代表表性性是是指指某某个个测测站站记记录录能能否否反反映映我我们们研研究究地地区区范范围围内内的的气气候候状状况况。在在不不同同目目的的、不不同同尺尺度度的的气气候候分分析析中中,同同一一测测站站代代表表性性可可以以是是不不同同的的。如如河河谷谷中中的的测测站站,由由于于地地形形对对降降水水的的影影响响,常常偏偏大大,大大范范围围气气候候分分析析中中其其降降水水记记录录就就无无代代表表性性,但但在在中中小小尺尺度度分分析析特特别是研究地形对降水量的影响时就有代表性。别是研究地形对降水量的影响时就有代表性。只只要要观观测测场场地地的的设设置置符符合合规规范范要要求求,气气象象站站的的记记录录都都可代表类似地理环境下相当大范围的气候状况。可代表类似地理环境下相当大范围的气候状况。(3 3)代表性)代表性 一般说,由于地理环境的差异各个测站所能代表的范(4 4)比较性)比较性 不不同同测测站站进进行行气气候候时时空空变变化化特特征征分分析析时时,要要求求资资料料要要有有可可比比性性。如如不不同同测测站站气气候候变变化化的的空空间间比比较较时时,要要求求各各测测站站的的资资料料都都在在同同一一时时期期;另另外外是是否否相相同同的的观观测测制制式式,仪仪器器性性能能等等,如如城城郊郊对对比比观观测时测时,最好观测同时段,使用相同的设备。,最好观测同时段,使用相同的设备。(4)比较性 不同测站进行气候时空变化特征分析时3 3、气候资料的审查方法、气候资料的审查方法 气气候候资资料料的的审审查查是是一一项项复复杂杂而而细细致致的的工工作作。需需要要具具备备一一定定的的气气象象学学、天天气气学学、气气候候学学和和气气象象观观测测知识,更需要有相当丰富的气候资料工作经验。知识,更需要有相当丰富的气候资料工作经验。通常将审查工作分为两类:通常将审查工作分为两类:一一:技术性检查技术性检查 二:二:合理性检查合理性检查3、气候资料的审查方法 气候资料的审查是一项复杂而1 1)技术性检查)技术性检查主要从下列几方面进行:主要从下列几方面进行:查查阅阅测测站站历历史史沿沿革革和和资资料料说说明明,分分析析是是否否存存在在因因测测站站迁迁移移、仪仪器器和和观观测测方方法法更更新新、观观测测时时制制改改革革等等引引起的非均一性。起的非均一性。根根据据观观测测规规范范、统统计计规规定定、检检查查观观测测记记录录和和统统计计结结果是否符合规定、校对统计计算有否错误。果是否符合规定、校对统计计算有否错误。检查同一要素的各个统计项目之间是否协调。检查同一要素的各个统计项目之间是否协调。1)技术性检查主要从下列几方面进行:2 2)合理性检查)合理性检查 主主要要是是以以气气象象学学、天天气气学学,气气候候学学知知识识为为依依据据,从从气气象象要要素素的的时时、空空变变化化规规律律和和各各要要素素间间的的相相互互联联系系规规律律出出发发,分分析析气气候候资资料料是是否否合合理理。主主要采用以下几种方法:要采用以下几种方法:本站前后期资料比审法本站前后期资料比审法区域资料比审法区域资料比审法气象要素相关法气象要素相关法2)合理性检查 主要是以气象学、天气学,气候学知(1)(1)本站前后期资料比审法。气候变化是缓慢的、连续的。因此虽然逐年本站前后期资料比审法。气候变化是缓慢的、连续的。因此虽然逐年的观测值不一样,但它们应在一个大致的水平上随机波动。如果通过的观测值不一样,但它们应在一个大致的水平上随机波动。如果通过前后资料的对比,发现资料序列中存在明显的不连续变化,则可能存前后资料的对比,发现资料序列中存在明显的不连续变化,则可能存在非均一性,应配合测站历史沿革情况作进一步的分析判断。在非均一性,应配合测站历史沿革情况作进一步的分析判断。(2)(2)区域资料比审法。相邻测站由于受同一天气系统的影响,常常有相当区域资料比审法。相邻测站由于受同一天气系统的影响,常常有相当好的一致性和相关性。相邻测站气象要素之间的相互联系规律,可以好的一致性和相关性。相邻测站气象要素之间的相互联系规律,可以成为我们发现和订正错误记录的重要依据。成为我们发现和订正错误记录的重要依据。(3)(3)气象要素相关法。各种不同的气象要素从不同的测面描写了一地的天气象要素相关法。各种不同的气象要素从不同的测面描写了一地的天气、气候特征以及它们之间存在着各种不同程度的相关。在实际工作气、气候特征以及它们之间存在着各种不同程度的相关。在实际工作中,常常用同一测站或者若干个地理环境相似测站的相关密切的两个中,常常用同一测站或者若干个地理环境相似测站的相关密切的两个要素的观测值作成相关图进行审查。当资料符合要求时,所有点子应要素的观测值作成相关图进行审查。当资料符合要求时,所有点子应密集地落在一根曲线或直线附近。如果个别点子明显偏离相关线,则密集地落在一根曲线或直线附近。如果个别点子明显偏离相关线,则这个点子的观测值可能有明显的误差。这个点子的观测值可能有明显的误差。(1)本站前后期资料比审法。气候变化是缓慢的、连续的。因此虽1)回归订正法2)差值订正法3)比值订正法4 4、订正方法、订正方法1)回归订正法4、订正方法1 1)回归订正法)回归订正法 由由于于相相距距不不远远的的测测站站都都受受到到相相同同的的大大尺尺度度环环流流背背景景制制约约,所所以以它它们们的的平平均均气气温温、年年降降水水量量和和气气压压等等气气象象要要素素的的年年际际变变化化都都或或多多或或少少地地存存在在着着一一定定程程度度的的统统计计相相关关。经经验验证证明明,愈愈是临近的台站,其同一要素的相关联系愈近似于线性。是临近的台站,其同一要素的相关联系愈近似于线性。若若x为为基基本本站站,y为为订订正正站站,可可根根据据订订正正站站和和基基本本站站的的平平行观测资料行观测资料建立一元回归方程建立一元回归方程:一一个个测测站站的的某某一一要要素素与与相相邻邻的的几几个个基基本本站站的的要要素素值值都都可可能能相相关关,因因此此可可以以对对周周围围的的基基本本站站进进行行逐逐步步筛筛选选来来建建立立多多元元回归订正方程回归订正方程。用用基基本本站站不不同同要要素素值值作作为为逐逐步步回回归归因因子子建建立立与与订订正正站站某某一要素的联系方程。一要素的联系方程。1)回归订正法 由于相距不远的测站都受到相同的大尺2 2)差值订正法)差值订正法 观观测测资资料料表表明明,相相邻邻测测站站气气象象要要素素的的差差值值的的年年际际变变化化较较之之它它本本身身的的年年际际变变化化要要小小得得多多,这这就就是是差差值值的稳定性的稳定性。相相邻邻不不远远的的测测站站处处于于相相同同的的大大尺尺度度环环流流背背景景下下,其其逐逐年年的的温温度度变变化化有有联联系系,形形成成大大致致平平行行的的振振动动。因因此此,尽尽管管月月平平均均温温度度逐逐年年变变动动很很大大,但但临临近近台台站站月平均温差差值的变化几乎为常数。月平均温差差值的变化几乎为常数。差差值值订订正正最最适适宜宜于于两两个个地地理理环环境境相相近近的的台台站站做做气气温、气压等要素的订正。温、气压等要素的订正。2)差值订正法 观测资料表明,相邻测站气象要素的差3 3)比值订正法)比值订正法 在在两两个个相相邻邻测测站站,并并非非所所有有的的气气象象要要素素的的差差值值都都可可以以认认为为是是趋趋于于常常数数的的。如如降降水水量量这这样样的的要要素素。但但是他们的比值却往往具有稳定性。是他们的比值却往往具有稳定性。一一般般地地说说,若若要要素素的的变变化化性性小小于于其其绝绝对对值值时时,差差值值可可以以代代替替比比值值,如如气气温温和和气气压压。而而降降水水量量的的变变化化性性可可大大于于其其绝绝对对值值,所所以以处处理理降降水水资资料料是是不不能能以以差差值法代替比值法。值法代替比值法。3)比值订正法 在两个相邻测站,并非所有的气象要素5 5、资料订正的适当性、资料订正的适当性 对对于于任任何何一一种种序序列列订订正正方方法法,均均需需考考虑虑其其在在一一定定条条件件下下的的适适当当性性,即即通通过过订订正正,我我们们能能否否对对一一地地的的气气候候状状况况有有更更准准确确的的认认识识。所所谓谓订订正正适适当当,就就是是指指订正值能更好的反映气候特征的实际情况。订正值能更好的反映气候特征的实际情况。只只有有在在基基本本站站与与订订正正站站距距离离不不很很远远,两两站站气气象象要要素素相相关关相相当当密密切切,且且平平行行观观测测时时期期比比较较长长时时才才用用回回归归订订正正法法进进行行序序列列延延长长。如如果果平平行行观观测测时时期期不不长长,通通常常还还是是以以采采用用计计算算简简便便的的差差值值订订正正法法或或比比值值订订正正法为好。法为好。5、资料订正的适当性 对于任何一种序列订正方法,复习思考题 1.理解并掌握统计量平均值、众数、中位数、距平、标准差、理解并掌握统计量平均值、众数、中位数、距平、标准差、变率、变差系数、协方差和相关系数的概念和计算公式,变率、变差系数、协方差和相关系数的概念和计算公式,特别是其在气象上的意义。特别是其在气象上的意义。2.思考如何求出北半球思考如何求出北半球1980-1989年年10年逐月年逐月850hPa纬向风纬向风场的气候场、异常场和均方差场。?场的气候场、异常场和均方差场。?3.理解总体、样本、累计频率、分布函量、频率表与分布列、理解总体、样本、累计频率、分布函量、频率表与分布列、均值向量、协方差阵和相关阵的概念。均值向量、协方差阵和相关阵的概念。4.何谓资料的中心化、标准化、正态化,做这样处理的必要何谓资料的中心化、标准化、正态化,做这样处理的必要性为何性为何?如何处理?如何处理?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!