资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第1章 概率及概率密度分布函数,系统状态宏观量,系统状态微观量,统计方法,最基础的概念,概率,1.1,概率的基本概念,统计规律性,随机现象与随机事件,随机事件发生的可能性 概率的定义,概率的基本性质,概率的简单计算,1.1.1 随机现象与随机事件,确定性事件,:,可以被预言的事情,.,例如,做简谐振动的单摆,只要知道其固有频率及初始条件,我们就能计算出摆球在任何时刻的位置和速度。,随机现象,:,只能确定影响它们演化的一部分因素,还有一部分因素是无法确定,或无法控制的,所以,现象发展的结局不是唯一的,到底如何,事先不能预言。,例如,容器中的气体,尽管我们可以控制容器的容积、气体的压强、乃至其温度,但我们无法控制气体分子在热运动中怎样和其他分子、又怎样和容器壁去碰撞,因而无从预言各个分子每一时刻的空间位置与速度,我们说,气体中一个分子所在的空间位置及其运动状态如何,,,是一种随机现象。,随机事件,:,在一定条件下,一个随机现象可以出现的多种结果中的每一个,就叫做一个随机事件。,对随机现象进行实验观测,在单次实验中所出现的不能再“分解”的事件,叫做,基本随机事件,。,例如掷骰子可能出现不同点数这一,随机现象,,在单次实验中分别出现,1,点、,2,点、,3,点、,4,点、,5,点、,6,点,就是它的六个,基本随机事件,。,一随机现象的所有基本随机事件构成一,基本事件组,.,掷骰子的,基本事件组,就由上述六个,基本事件,而组成。,复杂随机事件,:,某一随机事件,B,是由随机事件,A1,、,A2,、,.,、,Am,所构成,即,:,当且仅当这,m,个事件中有一个发生时,事件,B,才发生。这样的随机事件,B,就属于,复杂随机事件,了。,还以掷骰子为例,我们可以取“掷出的点数等于或大于,5”,为一随机事件,记为,B,。显然,不论掷出的点数是,5,还是,6,,都算做事件,B,发生了。我们称,B,事件是由“掷出的点数为,5”,这一基本随机事件与另一“掷出的点数为,6”,的基本随机事件而构成的,.,这时,随机事件,B,就属于,复杂随机事件,了,.,基本随机事件组,内的事件具有,互不相容性,:,在单次实验中,若上述事件,B,发生了,也就是,A1,、,A2.,、,Am,中的任何,一个,发生了,而,A1,、,A2.,、,Am,中的任两个事件绝不可能在单次实验中同时发生,我们称它们是互不相容的。基本随机事件组内的事件都是互不相容的。,一般地,凡不可能在单次实验中同时发生的两个随机事件,就是互不相容的随机事件。,两个随机事件具有,各自独立性,:,有时,对于,选定,的随机事件,A,与,B,,其中之一是否发生并不受另一个是否发生所影响,则称,A,与,B,是互相独立的。,例如,同时掷两只骰子,其一是否出现,5,点与另一个是否出现,3,点毫无联系,两骰子分别出现,5,点与,3,点这两个随机事件尽管可以同时发生,却互相独立。,即便拿一只骰子来说,“这次投掷是否出现,5,点”与“下次投掷是否出现,3,点”也是不相干的,尽管是两次相继的投掷,这两个随机事件仍是各自独立的。,再以我们在本课程中将特别关注的气体分子的速度为例,一分子速度的,X,分量介于怎样的大小区间与它的,Y,分量介于怎样的大小区间,,Z,分量又介于怎样的大小区间,是互相独立的。,随机现象,基本随机事件,基本事件组,复杂随机事件,A,1,A,2,A,n,A,m-1,A,m,统计规律性,演示实验 对大量随机事件的整体有统计规律可循 .,伽尔顿板实验 :,如图,一个带有玻璃面板的大盒内用竖直隔板分成许多等宽的小格,另有一斜放着的、底板面钉有许多小铁钉的木槽,其开口处与大盒口的一边相接。常叫这种装置为,伽尔顿板,。,伽尔顿板,令小球从钉板上方滚下,它要与板上铁钉进行无规则的碰撞,在下滚途中受力的复杂细节是失去人为控制的,尤其在把不止一个小球乃至大量小球同时或连续沿钉板撒下时,我们不可能一一控制它们落下的初始状态,而且它们除与铁钉碰撞还要彼此碰撞,更使得每个小球的运动呈现随机状态。尽管各个小球的运动都遵从牛顿力学定律,但它们离开钉槽时的速度无论在大小还是方向上都具有偶然性,以致,就单个小球来说,它滚下后究竟会落在大木盒中的哪一个格子里,是不能预知的。,一,.,现保持木槽的倾斜度不变,先把,少量,小球从钉板上撒下,它们将滚落在盒中各格里而有一分布。以尽量相同的方式将同样数量的小球再撒下一次,又一次,,,发现:每次小球在各格中的分布是有明显差异的。,二,.,现改撒,大量,小球,盒中各格里接到小球的数目是不相等的,越靠两边格里的小球数目越少,中间有一格中落入小球数目最多。究竟是哪一格中最多这与木槽的倾斜度有关。用同样多的小球再撒一次,按上面所说单个小球运动轨迹不可控制,以致落入盒中哪一格完全具有偶然性来推想,或许仍会象少量小球撒下时那样,出现明显不同于前次的分布。但事实上,只要木槽倾斜度固定,球的数目足够多,且总数保持不变,撒球的方式也尽量相同,那么多次实验得出的结果彼此都非常接近。,伽尔顿板实验结论,:,大数量小球落在大盒各格中的分布不再具有偶然性,它说明,在一定条件下,对大量随机事件的整体而言,具有较稳定的特性,是有必然规律可循的,这就是,统计规律性,。,统计规律性包容着单个随机事件的,偶然性,:,试将大量小球中的一只染成与众不同的颜色,在多次实验得到各格小球数有稳定分布的同时,这只可被识别的染色小球出现在哪一格中却完全没有一定。,统计规律性一定伴随有所谓,“涨落”现象,。,在伽尔顿板实验中,如果我们每次都逐格清点落入的小球数目,并做下记录,就会发现,每次实验中球数的实际分布与经极多次实验后统计算得的平均分布是有偏差的。这就叫做“涨落”,而且用来投撒的小球总数较少时,这种“涨落”现象就很明显。,大量,随机事件,所必然遵从的,统计规律性,是依存于个别随机事件的,偶然性,的,,涨落现象,与,统计规律性,相伴正表明了偶然性与必然性之间的辩证关系。,随机事件发生的可能性,-,概率的定义,:,概率是统计规律中最基本的概念。,概率,-,给出一随机事件发生的可能性有多大。,在确定的条件下,对随机现象进行足够多次的观测实验,将看到该现象中各种可能的随机事件。设实验的总次数为,N,,其中,事件,A,出现的次数为,N,A,,定义,为事件,A,出现的频数。这频数会依,N,不同有所变化;但随着,N,的增大,由于偶然因素所起的作用相对降低,随机现象本身的固有特性变得明显,以致,v,A,会稳定在某一值附近而只有越来越小的起伏。,当,N,较大时,频数趋于一极限:,P,A,就叫事件,A,出现的概率。显然,概率反映了随机事件出现的可能性,,P,A,越大,事件,A,出现的可能性就越大。,概率的基本性质,1.,任意一事件的概率,P,A,必有,0,P,A, 1,.,P,A,=1,意味着,A,事件在给定的条件下一定发生,是,必然事件,;,P,A,=0,则是,A,事件在给定的条件下根本不可能发生,这是,不可能事件,。,2.,加法定理,设,A,1,、,A,2,为两互不相容事件,若,A,1,或者,A,2,出现时都可认为事件,A,已出现,称,A,为,A,1,与,A,2,的“或”,(,或称为“和”,).,表示为,:A=A,1,+A,2,或,A=A,1,A,2,。,则有,: P,A,= P,A1 +,P,A2,式中,P,A,、,P,A1,和,P,A2,分别为出现,A,、单独出现,A,1,和单独出现,A,2,的概率。,若,A,为若干个互不相容随机事件的“或”,:,A=A,1,A,2,A,n,则,:,3.,基本随机事件组中各事件的概率归一,. (,概率的归一化条件,),若,A,1,至,A,n,构成一随机基本事件组,亦即包含了某随机现象所有可能独立出现的全部基本随机事件,那么,A,便是必然事件,:,4.,乘法定理,设,A,、,B,两事件是相容的,把,A,、,B,都发生的事件称之为,C,,换句话说,,C,是在,A,和,B,都出现时方才实现的事件,简单地称,C,是,A,和,B,的“交”,(,也称为“积”,).,表示为,:C=AB,或,C=A,B,则有,:P,C,=P(A,B)=P,A,P(B|A),其中, P,A,是,A,事件发生的概率,;,P(B|A),是在,A,发生的前提下,B,事件出现的概率,叫,“条件概率”,.,当,A,、,B,两事件是互相独立的,即,B,出现的概率跟是不是附加上,A,出现这一条件无关,反之亦然,则有:,P(B|A)=P,B,; P(A|B)=P,A.,此时,P,C,=P(A,B)=P,A,P,B,两相容的独立事件都出现的概率,等于两独立事件单独出现的概率之乘积,这叫做乘法定理。,推广到计算多个相容的独立事件都出现的概率:,概率的简单计算,一,.,古典式随机现象的概率的简单计算,:,古典式随机现象要满足以下两个条件:,(1),该随机现象的基本随机事件组的事件数目有限;,(2),每一基本随机事件发生的概率相等。,例一,:,掷一只匀质、形状规则的骰子,它有六个对称的面,掷出去究竟出现的点数是几,有六种等概率的可能,这是一个古典式随机现象。,例二,:,容器内有,N,个气体分子,若以一假想截面将容器分为容积相等的,A,、,B,两部分,每个分子都可自由往来于,A,、,B,之间,倘视,N,个分子是可以彼此区分的,但又各自独立地以同样方式热运动着,那么这些气体分子在,A,、,B,两部分中的分布共有种可能,而且每种分布出现的概率都相等。这又是一个古典式随机现象。,设一古典式随机现象的基本随机事件组中含有,n,个基本事件,那么依古典式随机现象应满足的条件,易得每一基本事件发生的概率,:,-(1.1.8),如果该随机现象的某个复杂随机事件,c,是由,m,个基本事件复合而成的,则,c,的概率,:,-(1.1.9),在具体计算中,必须先适当地定义基本事件组,并由,(1.1.8),和,(1.1.9),式可见,关键是计算,n,和,m,,这需要用到数学中有关排列、组合的公式。,1.2,随机变量与概率分布,随机变量,离散型随机变量的概率分布,连续型随机变量的概率密度分布函数,1.2.1 随机变量,为了讨论,随机事件,与相应,概率,之间的关系,首先要把随机事件数值化,于是,引进,随机变量,.,定义,:,把在确定条件下的随机现象中的每一个随机事件,w,都唯一地与一个实数值,X(,w,),相对应,则称实数值变量,X(,w,),为一个随机变量。,例,1-2-1,设盒中有,3,个白球,两个黑球,从中随便摸取,3,个球。考查,:,在摸取的,3,个球中黑球的数目。,现给这,5,个球编号,,(1),、,(2),、,(3),号为白球,,(4),、,(5),号为黑球。则“摸取,3,个球”的可能结果,w,有十种,见表第一列,给出了十种可能里各自摸到的三球的编号。设随机变量,X(,w,),为每种可能情形下摸到黑球的数目,其值也列于表中。,表,1.2.1,随机事件,w,与随机变量,X(w ),w,X(w ),(1) (2) (3),0,(1) (2) (4),1,(1) (2) (5),1,(1) (3) (4),1,(1) (3) (5),1,(2) (3) (4),1,(2) (3) (5),1,(1) (4) (5),2,(2) (4) (5),2,(3) (4) (5),2,这里,我们看到,所选取的随机变量可以取,0,,,1,,,2,三个实数值,区分出了三种不同的复杂随机事件。而的每种可能,是在给定条件下,符合明确要求的一个基本随机事件,它对应着的一个确定值;但的一个确定值却可以对应不止一个基本随机事件,例如,,X=1,就对应着的六个不同的可能情况。,例,1-2-2,硬币的一面刻着国徽,另一面刻着币值。抛掷一枚硬币,它落地时哪一面朝上是随机的。我们可以事先约定,令刻着国徽的一面朝上对应着随机变量,X=1,,而刻有币值的一面朝上对应着随机变量,X=0,。这样,对于并不显现为某某数量如何的随机事件,也照样能用随机变量把它们标识出来。,例,1-2-3,气体分子处于不停的、无规则的热运动之中,任何单个分子所在的空间位置及运动速度都在随机地瞬息万变。可以把单个分子的速率取做随机变量,或者把它的速度分量取做随机变量组,还可以把它的空间位置坐标取做随机变量组。,随机变量分类,:,离散型随机变量,:,随机变量,(,或随机变量组,),所取的值可被一一列举出来;,非离散型随机变量,:,随机变量,(,或随机变量组,),所取的值不能被一一列举出来,:,在例,1-2-3,中,分子位置坐标可以取某一范围内的所有实数值,不尽穷举。分子的速率和速度三个分量取值也是如此。实际遇到的非离散型随机变量大都有很好的数学性质,按数学家定义,有连续型随机变量之称,1.2.2,离散型随机变量的概率分布,为了完全地描述一个随机现象,只知道其随机变量,X,可取哪些值是远远不够的,更重要的是要知道,X,取各个值的概率。,设可能取的值是,相应的概率分别是,P,i,=P(X=x,i,) (i=1,2,n),经适当选定随机变量,还可以把不同随机事件的概率,P,写成各事件相应的随机变量,X,的函数:,P=f(x),概率分布,-,二项式分布,有一些随机现象,在单次试验观测中所出现的结果只可能有两种,就是说,它的基本事件组中只包含两个基本事件,记为,A,和,B,。设它们各自的概率分别为,p,和,q,,根据概率归一化条件有,p+ q=1,(1.2.1),现在,要对这样的一个随机现象的,N,次独立试验结果来做整体的察看。求在这,N,次独立试验序列中有,n,1,次出现事件,A(,自然也就是有,N-n,1,次出现,B),的概率。,由互不相容事件的“或”的概率加法定理,:,(1.2.2),式中因子 是以各种不同次序在,N,次实验中有,n,1,次,A,出现的组合数,通常记为 。,利用二项式定理及,(1-2-1),式,不难证明,(1-2-2),式给出的概率分布函数满足归一化条件:,也正由于概率分布函数,P,N,(n,1,),恰是二项式展开中,P,的第,n,1,次幂的通项,所以这一分布叫做,二项式分布,.,一维“无规行走,(Random walk)”,问题,例,1-2-4,一条笔直的东西走向的狭街上立着一电线杆,杆下有一醉汉沿街踉踉跄跄忽东忽西地走路。假定他每一步的步长都是,l,,但各步朝东还是朝西不受上一步影响,是完全随机的。试求他从电线杆处出发走了,N,步之后,离电线杆距离为,x,的概率。,“无规行走”是有名的概率问题。它可以不限于一维,也可以每步长不相等,那就要涉及更多个随机变量。物理中有许多问题的数学模型就是“无规行走”。例如布朗粒子的运动犹如醉汉行路,用“无规行走”模型来讨论它们的方均位移就很合适。,解,基本随机事件只有两个:或朝东走,或朝西走。设他朝东、朝西走的概率分别是,p,和,q,。,p,可以等于、也可以不等于,q,,例如这条街路面是倾斜的,那么醉汉朝上坡方向走的概率就小于朝下坡方向走的概率;而若街道水平,则可以认为,p=q=1/2,。,先来看在他走过的,N,步中若有,n,1,步是朝东走的这种可能性有多大。取,n,1,为随机变量,这正是要求得一维无规行走问题的概率分布函数,P,N,(n,1,),,而它恰应是二项式分布:,(1-2-4),(N-n,1,),是他向西走的步数,我们视之为,n,2,。取,x,轴平行于街道,原点在电线杆所在处,从原点向东为正轴方向。既然走了,N,步之后距原点,x,远,那么必有:,这里,,N,若为奇数,则,x,必为奇数倍步长;而,N,若为偶数,x,则必为偶数倍步长。,容易解出:,将所得的,n,1,及,n,2,代入分布函数,(1-2-4),,便得到以为随机变量的概率分布函数:,(1-2-5),-,本题所要求的概率。,1.2.3,连续型随机变量的概率密度分布函数,连续型随机变量是在实数轴的某一区间内连续取值,连续型随机变量取某一确定值的概率必然为零,示例:分子按速率分布情况的描述,自拟一组气体分子按速率分布的数据,见表,1-2-2:,思路,A:,先取速率间隔,v=100,米秒,1,,用各速率区间所对应的分子比率,N/N,做图,如图1-2-1中实线所示。,该图中每一小矩形之宽表示所取速率间隔的大小,而矩形之高则表示分布在相应速率区间 内的分子比率。,由于速率大于700 米秒,1,的分子比率大于8,则速率介于0700 米秒,1,之间的分子比率即为92。对图1-2-1中用实线所画的七个矩形之高求和,即得92。,再取,v=50,米秒,1,,仍用各速率区间所对应的分子比率来做图,如图中虚线所示。在0700 米秒,1,的速率范围内所做出的十四个小矩形的高度之和仍应为92,但其上方轮廓线较先前七个矩形的明显地降低了。,本来,速率间隔取得足够小才能细致地描写速率分布的情况,,但,如果照上法,以为纵横坐标画小矩形来做图示,则必定是取得越小,小矩形数目越多,虽然它们的高度之和不变,但它们的上方轮廓线随之缩小发生显著的下移,越来越贴近横轴。,图,1-2-1,分子按速率分布的一种图示,思路,B:,先近似认为分布在某一速率区间 内的 个分子是平均分布在该速率区间内的每单位速率间隔上的,那么分布在,内每单位速率间隔上的分子数比率就是 。下面,改用 为纵坐标来描绘速率介于,0,700,米,秒,1,之间的分子按速率的分布情况,。,先取,v=100,米秒,1,,如图,1-2-2,,每一小矩形之宽仍表示速率间隔之大小,矩形之高则表示分布在相应的区间内、平均每单位速率间隔上的分子数比率。显然相应的矩形面积表示分子在区间内的分子比率,那么图,1-2-2,中用实线画出的七个矩形面积之和应等于,92%,。,再将取为,v=50,米,秒,1,,所画的十四个小矩形的上方轮廓线将围绕以前的那七个小矩形的上方轮廓线上下起伏,如该图虚线所示,且十四个小矩形的面积之和为,92%,。,图,1-2-2,分子按速率的分布,概率密度分布函数,当速率间隔取得足够小时, 、 ,一排细窄矩形的上轮廓线将趋于一条光滑曲线,如图,1-2-3,所示。,这条曲线就代表了分布在 附近、单位速率间隔内的分子数比率 随 的变化情况,称这曲线为速率分布曲线, 其对应的函数记为,:,-,速率分布函数,图,1-2-3,速率分布曲线,分布函数与概率问题之间的关系,:,(1).,气体中任意分子其速率在,区间内的概率应等于,N,个分子中速率介于此区间内的分子数比率,dN/N,,此概率就是,f(v)dv;,(2).,任意分子其速率落在,v,附近的单位速率间隔内的概率则是,所以,f(v),是,概率密度,。,同时它作为速率,v,的函数,又反映出不同,v,附近的概率密度如何随变化,因此速率分布函数,f(v),实为,概率密度分布函数,。,一般地,对于连续型随机变量,X,,存在非负可积函数,p(x)(x,有一定的取值范围,),,使对,x,取值范围内的任意,a,b(ab),都有,式中,P(aXb),是随机变量介于,a-b,所对应的随机事件之概率,称,p(x),为,X,的概率密度分布函数。,(3).,从,f(v),的引入过程不难推知图,1-2-3,中速率分布曲线下的面积应当是,1,,写成积分形式,就是概率密度分布函数的归一化条件:,变量的概率密度分布函数的归一化条件为:,(积分遍及的取值范围),1.3 统计平均值及涨落,统计平均值,围绕统计平均值的涨落,1.3.1 统计平均值,1,、离散型随机变量的统计平均值,普遍适用于计算离散型随机变量的统计平均值,的公式:,加权平均,-,不仅要考虑随机变量的取值,还要考虑到它取的那些值所相应的概率。,例1-3-1,求二项式分布 中随机变量,n,1,的平均值。,2,、连续型随机变量的统计平均值,把这结果在整个速率变化范围内积分,便得到,个分子的速率总和:,接下来,容易得到,分子热运动的方均速率,一般地,已知连续型随机变量的概率密度分布函数,则与该随机现象有关的函数之平均为:,积分遍及的取值范围。,3,、有关统计平均值的简单定理,(1),若和是同一随机变量的两个函数,则,(2),若是随机变量的函数,而与该随机变量无关,则,(3),若两随机变量、彼此独立,与分别是这两随机变量的函数,则,对于离散型随机变量,求统计平均值时,也可证明有与上对应的三个简单定理。,1.3.2 围绕统计平均值的涨落,统计规律必伴随有涨落现象。,随机现象单次试验的观测值与其统计平均值之差或大或小、或正或负,是随机变化的。,各次观测所得数据的波动状况,也是反映客观现象的一个重要方面,于是我们有必要来研究如何表征随机变量取值的分散程度.,涨落散差(或弥散度):,通常还用 来表示的标准误差或涨落,定义为相对涨落或相对误差。,只在相对涨落很小时,统计平均值才有意义,如果研究的对象是由极大数目,N,个相同的独立或近独立部分所组成,例如一定量气体由,N,个分子所组成,属于这对象的一些物理量是它各独立部分相应量之和,例如质量、能量、总磁矩等,就具有这样的可加性,热力学中称之为“广延量”。,这些广延量的相对误差比例于,统计物理可以计算能级落于区间内的粒子数相对涨落,它与该区间内的粒子数之平方根成反比。,对于所含粒子数众多的系统,随机量围绕统计平均值的涨落是非常之小的。,应用统计方法时,粒子数目巨大非但不再成为解决问题的困难或障碍,反而是使统计平均值有实际意义的保证,因为此时相对涨落小到可以忽略不计了,那么统计平均值就足以代表每一瞬时的真实值了。,本章小结,在确定条件下,随机现象的随机事件多次发生时,就表现出统计规律:,每一随机事件的发生都有一定的概率;,概率分布函数(对离散型随机变量)或概率密度分布函数(对连续型随机变量)给出各种随机事件发生概率的分布情况;,随机现象所表现出的各种平均结果,由相应的统计平均给出;,由于统计规律性离不开个别随机事件的偶然性,所以统计规律必然伴随有涨落现象。,第一章结束!,
展开阅读全文