资源描述
,单击此处编辑母版文本样式,二级,三级,四级,五级,9/17/2014,#,单击此处编辑母版标题样式,第三章,水文统计的基本原理与方法,3.1,概述,水文统计的意义,水文现象是自然现象,既具有,必然性,,又有,偶然性,。,水文统计,是利用概率论和数理统计的理论方法,研究和分析水文的随机现象(已经观测到的水文现象),找出水文现象的统计规律性,并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。,水文统计,的意义,水文分析计算常用到数理统计的方法,进行流域或地区水资源开发,利用,首先要了解流域内未来的河道的来水量,以合理规划,;,进行水利工程规划设计,,需弄清未来时期河流中可能的洪水量及其过程,以确,定工程的规模,这种对未来长,期的径流情势(属随机变量)的估计,只能依据其统计规律,利用数理统计的方法进行“概率预估”。,所谓“,概率预估,”,即分析水文变量出现大过或小于某个数值的可能性为,多少,河川水文现象的特点,多变和不完全重复性,水文现象在发生的时间和数值的大小上都具有随机性。因此不能依靠短期的观测资料对今后的变化趋势做准确的判断,地区性,水文现象因地区不同而异。因此引用经验公式要注意其地区特点,周期性,水文现象具有周期性循环变化的性质,收集水文资料的要求,一致性,即要求同一计算系列中的水文资料属于同一类型,是在同一条件下产生的,一般需要将径流资料修正到流域被大规模治理前的接近天然状态的水平,这项修正工作被称为,还原计算,W,天然,=W,实测,+W,还原,包括农业灌溉用水量、工业用水量、城镇用水量、水库蓄水量的年变化值、水面面积扩大增加的水面蒸发量、水库渗漏量、跨流域引水量等,代表性,代表性分析是针对某一具体样本,研究它的频率分布与总体概率分布的差异情况,差异愈小,两者愈接近,说明该样本代表性愈高,收集水文资料的要求,可靠性,收集资料时,应对原始资料进行复核,对测验精度、整编成果作出评价,对资料中精度不高、写错、伪造等部分进行改正,以保证分析结果的客观性及准确性,独立性,根据数理统计的要求,选用的资料应具有一定的独立性,彼此有关系的资料不能收入同一系列,3.2,概率论,在水文学中的应用,水文统计的基本概念,事件,对随机现,象的观测称为随机试验,。,随机试验的结果叫做,事件,事件分为三类,:,必然,事件,不可能事件,随,机事件,水文统计的基本概念,随机变量,用以表示随机试验结果的一个数量,(,事先是未知的,),,由于它事先不能确定,是随机的,称为,随机变量,。水文现象中的随机变量,一般指某个水文特征值,(,如年径流量、年降雨量、洪峰流量等,),。,它是指随机试验结果,的一个数量。在水文学中,常用大写字母表示,记作,X,,而随机变量的可能取的值记作,x,,即,:,X,=x,1,X=x,2,X=x,n,一般称之为,随机系列,或,随,机数列,。,水文统计的基本概念,随机变量,随机变量分为:,A.,离散型随机变量,Discrete random variable,随机变量仅取得区间内某些间断,的离散值,则称为,离散型随机变量,。如洪峰次数,只能取,0,1,2,,不能取相邻两数值之间的任何值,。,B.,连续型随机变量,Continuous random variable,随机变量可以取得一个有限区间内的任何数值,则称为,连续型随机变量,。如某河流断面的流量可以取,0,极限值之间,的任何实数值,水文统计的基本概念,总体,在统计数学中,把某种随机变量所取数值的全体,称为,总体,。,水文现象个体沿时程变化的数量包括过去、现在和将来的所有情况,属于无限总体,故无法,取得总体,。,样本,从,总体中不带主观成分任意抽取的一部分,称为,样本,。,容量,样本,所包含的项数,,称为,样本容量,如实测,的水文数据是有限的,是一样本。,概率与频率,概率,为了比较某随机事件出现(或不出现,),的可能性大小,必然赋予一种量化的(以数量表示,),指标,这个数量指标就是,事件的,概率,,亦称机率,简单,(,古典,),的随机事件的概率定义用下式表示,:,式中,P,(A,),:,一定条件下随机事件,A,的概率,;,n,:,试验中所有可能的出现的结果数,;,m,:,出现随机事件,A,的结果数。,概率与频率,【,例,】,袋中,有手感完全相同的,20,个白球和,10,个黑球,问:摸出白球、黑球的概率各是多少?摸出白球或黑球的概率为多少?摸出红球的概率为多少,?,【,解,】P(,白,)=20/,(,20+10,),=2/3,P(,黑,)=10/(20+10)=1/3,P(,白或黑,)=(20+10)/(20+10)=1,P(,红,)=0/(20+10)=0,概率与频率,频率,设,事件,A,在,n,次随机试验中出现了,m,次,则定义,:,为,事件,A,在,n,次试验中出现的,频率,。,注意,:,n,不是所有可能的结果总数,仅是,随机试验的次数,。,概率与频率,频率,与概率的关系,当试验次数,n,不大时,事件频率有明显的不稳定性。当试验次数,n,增加到充分大时,事件频率显著地出现稳定的趋势,,例如,频率是实测值、经验值;而概率是理论值,当试验次数很多时,可以通过实测样本的频率分析来推论事件总体概率特性,即推论随机事件在客观上可能出现的程度,这是数理统计法的基本原理,皮尔逊掷硬币试验:,丢币次数,出现正面的次数,频率,4040 2048 0.5069,12000 6019 0.5016,24000 12014 0.5005,概率运算定理,概率运算,定律,I.,概率,相加定理,互斥,事件:在一次试验中,只有一个事件发生,其余事件均不能发生,这类事件称为互斥事件,;,概率,相加定理,:互斥的各事件中,至少有一个发生的概率等于各个事件发,生的概率总和,【,例,】,袋中,有手感完全相同的,20,个白球和,10,个黑球,问:摸出白或黑求的概率是多少?,概率运算定理,【,例,】,某测站有,40,年的实测枯水位记录,各种水位出现的频率,如下表所,示,试确定水位,H2.0m,和,H,2.7m,的频率?,序号,水位,H,(,m,),频数,f,(,a,),频率,W,(,%,),累积频率,P,(,%,),1,2,3,4,5,4.0,3.5,2.7,2.0,1.9,2,10,16,9,3,5,25,40,22.5,7.5,5,30,70,92.5,100,40,100,概率运算定理,概率运算,定律,II.,概率相乘定理,独立,事件:某一事件的出现并不影响其他事件的出现,这类事件称为独立,事件,概率相乘,定理,:几个独立事件一并(先后)出现的概率等于各事件出现的概率之积,。,【,例,】,有三条互不影响,的排水管道,它们遭遇满溢的破坏概率各为,1/10,,求这三条排水管道在工作中同时都出现满溢的概率。,概率运算定理,条件,概率,:,在事件,B,发生的情况下事件,A,的概率。记为,P(AB,),P,(AB)=P(B,),P,(AB),【,例,】,一纸箱中,有相同大小的乒乓球,50,个,其中白色,40,个,黄色,10,个,现任意从中取一个不放回,再从中取另一个,问两次取球均为白色的概率,。,【,解,】,设,A,为第一次取得白色球的事件,,B,为第二次取得白色球的事件,那么,P(A)=40/50,P(BA)=(40-1)/(50-1)=39/49,则,,P(AB)=P(A),P(BA)=40/50,39/49=0.637,概率运算定理,水文学中需要知道连续两年超过警戒水位的频率,【,例】每年从某河的某水文站选一个最高水位组成系列,如在,n,年中出现超过警戒水位的资料共有,a,个,求连续两年超过警戒水位的频率是多少,?,【,解,】,设事件,A,为第一次超过警戒水位,事件,B,为第二次超过警戒水位,随机变量的概率分布,对于离散型随机变量,:,随机变,量的取某一可能值的机会有的大有的小,即随机变量取值都有一定的概率与之相对应,可表示为,:,上式中,P,1,P,2,P,n,表示随机变量,X,取值,x,1,x,2,x,n,所对应的概率。,随机变量的概率分布,一般将这种对应关系称作随机变,量的,概率分布规律,,,简称为分布规律以,用以下的分布图形,表示:,x,1,x,2,x,3,x,4,x,n,X,P,离散型随机变量概率分布图,随机变量的概率分布,对于连续型随机变量,:,变量的取值充满整个数值区间,,无法一一列出其每一个可能值,只能以区间的概率来分析其分布规律,。,连续系列按由大到小顺序排列,分成,N,组,组距值,x=x,i,-x,i+1,,,任一组内概率为,p,,组间平均概率为,f=,p/,x,,此值称为,x,区间对应的,概率密度,。,区间足够小时,f(x)-,概率密度函数,随机变量的概率分布,水文学上习惯研究随机变,量的取值等于或大于某个值的概率,表示为,:,它,是,x,的函数,称作随机变量,X,的,分布函数,(Distribution function),,记作,F(x),,,即,表示,随机变量,X,大于或等于值,x,的概率,,其几何曲线称作随机变量的,概率分布曲线,(水文学上通常称,累计频率曲线,,简称,频率曲线,)。,随机变量的概率分布,已知概率密度函数,f(x),,可求出随机变量,X,落在,(,xx,+dx),区间即,dx,上的概率,=f(x)dx,,称之为,概率元素,,即为图,中的阴影面积,已,知,概率密度函数,f(x),,,可求出随机变量,X,概率,分布函数,F(x),,其与密度函数,f(x),有如下的数学关系,:,f,(,x,),f,(,x,i,),F,(,x,),x,i,密度曲线,分布曲线,x,x,dx,F,(,x,i,),随机变量的概率分布,可见,,,随机变量的二个,函数的物理意义:,a.,f,(x,),密度,函数,反映随机变量,X,落入,dx,区间的平均概率,;,b.F,(x),分布,函数,反映随机变量,X,超过某个值,x,的概率,。,这两个函数能完整地描述随机变,量的分布规律。,随机变量的概率分布,【,例,】,某站,有,62,年的降水,资料。,分析年降水量的概率分布规律,。,【,解,】,将,62,年降水量按大小每,隔,x=200mm,划分为一组,统计各组值出现的次数,计算各组值相,应的频,率、频率密度、累积次数、累积频率的值,。,表,3.2,某站某年降水量分组频率计算表,年降水量,h/mm,组内频数,累计频数,组内频率,/%,累计频率,/%,组内平均频率密度,分组组距,h=200mm,组上限值,组下限值,f,i,/,次,m/,次,W,i,=f,i,/s,P,i,W,i,/h,(1),(2),(3),(4),(5),(6),(7),2299.9,2100,1,1,1.6,1.6,0.0081,2099.9,1900,2,3,3.2,4.8,0.0161,1899.9,1700,3,6,4.8,9.7,0.0242,1699.9,1500,7,13,11.3,21.0,0.0565,1499.9,1300,13,26,21.0,41.9,0.1048,1299.9,1100,18,44,29.0,71.0,0.1452,1099.9,900,15,59,24.2,95.2,0.1210,899.9,700,2,61,3.2,98.4,0.0161,699.9,500,1,62,1.6,100.0,0.0081,合计,62,100.0,随机变量的概率分布,以年降水量(各组下限制)为,纵坐标,以频率密度为横坐标,绘成频率密度直方图,,绘成,频率密度直方图,。,整个系列中,出现特别大、特别小降水的机会少,而出现中间值的机会多;每个小矩形的面积代表该组年降水量出现的频率;所有小矩形面积之和等于,1,随机变量的概率分布,以年降水量(各组下限制)为,纵坐标,,以累积频率,P,为,横坐标,绘,成累积频率直方图,,而以累积频率为横坐标,绘成累积频率直方图。,图中折线代表大于或等于各组降水下限的累积频率,反应出大于或等于,x,的频率依随机变量取值而变
展开阅读全文