资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Econometrics计 量 经 济 学,祝树金 教 授,经济与贸易学院,二零零七年十月,第二章 根本统计概念的回想,主要内容,2.1 随机实验,2.2 随机变量,2.3 总体的的数字特征,2.4 样本分布的数字特征,2.1 随机实验,随机实验:指至少有两个能够结果,但不确定哪一个结果会出现的过程,总体:随机实验一切能够的集合称为总体population)或样本空间,例子:在一种双回合游戏中,O1表示两个回合全部获胜;O2表示第一个回合获胜,第二个回合失败;O3表示第一个回合失败,第二个回合获胜;O4表示两个回合全部失败。样本空间有4种结果组成:O1,O2,O3,O4,样本点:样本空间或总体的每一元素,即每一种结果成为样本点,2.1 随机实验,随机实验的能够结果组成的集合称为事件,它是样本空间的一个子集,假设两个事件不能同时发生,那么两个事件称为是互斥的,假设一个事件的发生与另一个事件的发生的能够性一样,那么两个事件称为等能够性的。例如抛一枚硬币,正面朝上和正面朝下是等能够出现的,2.2 随机变量,一、概率分布,引入一个随机变量来描画总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和延续型两种类型。,样本就是n个相互独立的与总体具有一样分布的随机变量x1,xn,即n元随机变量。随机实验的能够结果组成的集合称为事件,它是样本空间的一个子集,总体与样本间的联络在于具有一样的分布,2.2 随机变量,一、概率分布,引入一个随机变量来描画总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和延续型两种类型。,样本就是n个相互独立的与总体具有一样分布的随机变量x1,xn,即n元随机变量。随机实验的能够结果组成的集合称为事件,它是样本空间的一个子集,总体与样本间的联络在于具有一样的分布,2.2 随机变量,2、概率分布的含义和性质,随机变量X取各个值的概率称为X的概率分布。对一个离散型随机变量X可以给出如下的概率分布:,P(X=xi)=pi,对于随机变量X无论延续还是离散可以确定实值函数F(x),称为累积分布函数cumulative distribution function,CDF),定义如下,F(x)P(Xx),概率分布性质,1取值范围,2假设A,B,C,为互斥事件,那么有,P(A+B+C+)P(A)P(B)P(C),对于恣意事件A,B那么有P(A+B)P(A)P(B)P(AB),3假设A,B,C,为互斥事件,且为一完备事件组,那么,P(A+B+C+)P(A)P(B)P(C)=1,4事件A,B,C,称为相互独立的事件,假设有,P(ABC)P(A)P(B)P(C),5条件概率P(A|B)=P(AB)/P(B),2.2 随机变量,举例:,国际贸易专业有200名学生,其中男生120人,女生80人,在这些学生中,40名男生和24名女生方案选学计量经济学,假设随机抽取一人,发现这个学生方案选学计量经济学。那么这个学生是男生的概率是多少?,3、延续型随机变量的分布函数及概率密度函数,对于延续型随机变量,取任何特定数值的概率为0。,设F(x)是随机变量X的分布函数,假设对恣意实数x,存在非负函数f(x)0,使,就称f(x)0为X的概率密度函数(PDF),且f(x)具有性质,2.2 随机变量,4、多元随机变量的概率密度函数,结合概率密度函数f(X,Y)=P(X=x,Y=y)。,边缘概率密度函数f(X),f(Y)。,条件概率密度函数,f(X|Y)=P(X=x|Y=y),条件概率密度函数f(X|Y)f(X,Y)/f(Y),独立随机变量,假设f(X,Y)f(X)f(Y),那么称变量X和Y是统计独立的,2.2 随机变量,5、随机变量函数,设f(x)是定义在随机变量X的一切能够取值集合上的函数。假设对于X的每一个能够值x,都有另一个随机变量Y的取值y=f(x)与之相对应,那么称Y为X的函数,记作Y=f(X)。,经常遇到一些随机变量,它们的分布往往难于直接得到例如滚珠体积的丈量值等,但与它们有关系的另一个随机变量的分布却是容易知道的如滚珠直径的丈量值。因此,就要研讨两个随机变量之间的关系,然后经过它们之间的关系,由知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。,2.2 随机变量,2.3 对总体的描画:随机变量的数字特征,数学期望,方差,数学期望与方差的图示,相关系数与协方差,偏度和峰度,一、数学期望集中趋势的度量,1、离散型随机变量数学期望的定义,假定有一个离散型随机变量X有n个不同的能够取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,那么这个随机变量X的数学期望定义如下:,数学期望描画的是随机变量总体的普通程度,2、延续型随机变量数学期望的定义,假设延续型随机变量X有分布密度函数f(x),而积分,绝对收敛,那么称 为X的数学期望。,数学期望是最容易发生的,因此是可以等待的。它反映数据集中的趋势。,一、数学期望集中趋势的度量,求离散型随机变量数学期望举例,例1 甲、乙两射手在一次射击中的得分分别用X、Y表示的分布率如下:,试比较两射手的射击技术程度,并计算假设二人各发一弹,他们得分和的估计值。,解 EX=1 0.4+2 0.1+3 0.5=2.1,EY=1 0.1+2 0.6+3 0.3=2.2,E(X+Y)=2.1+2.2=4.3 由于EXEY,所以乙射手射击程度比较高;二人各发一弹,得分总和最能够在4.3分左右即4分或5分,偏度S是对称性的度量;,样本平均数用来描画样本的平均程度普通程度。,随机实验的能够结果组成的集合称为事件,它是样本空间的一个子集,条件概率密度函数f(X|Y)f(X,Y)/f(Y),检验的显著性程度和p值,3 总体的的数字特征,O3表示第一个回合失败,第二个回合获胜;,方差是度量一个随机变量变异程度的目的,而协方差那么是度量两个随机变量协同变动的目的。,绝对收敛,那么称 为X的数学期望。,样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。,小的p值是回绝虚拟假设的证据。,假设X为延续型随机变量,那么X的方差以下式给出,对于正态分布的峰度为3,称为常峰态的。,1协方差是一个有单位的目的。,随机实验:指至少有两个能够结果,但不确定哪一个结果会出现的过程,例2:,3、数学期望的性质,1假设a、b为常数,那么,E(aX+b)=aE(X)+b,2假设X、Y为两个随机变量,那么,E(X+Y)=E(X)+E(Y),3假设g(x)和f(x)分别为X的两个函数,那么,Eg(X)+f(X)=Eg(X)+Ef(X),4假设X、Y是两个独立的随机变量,那么,E(X.Y)=E(X).E(Y),4、条件期望,条件期望值的定义:,对于延续型随机变量的条件期望只需把加总符号换成积分号即可。,几个重要性质,1,普通地,2,3重期望律:,例:知 ,那么,二、方差:离散程度的度量,1、随机变量方差的定义,假设X为延续型随机变量,那么X的方差以下式给出,随机变量的方差记作Var(x)。方差的算术平方根叫规范差。,2、方差的性质,1Var(c)=0,2Var(c+x)=Var(x),3Var(cx)=c2Var(x),4x,y为相互独立的随机变量,那么,Var(x+y)=Var(x)+Var(y)=Var(x-y),5Var(a+bx)=b2Var(x),6a,b为常数,x,y为两个相互独立的随机变量,那么Var(ax+by)=a2Var(x)+b2Var(y),7Var(x)=E(x2)-(E(x)2,例3 计算本节例1中甲射手的方差,例1 甲、乙两射手在一次射击中的得分分别用X、Y表示的分布率如下:,E(X)=2.1,Var(X)=-1.1 2 0.4+-0.12 0.1+0.92 0.5,=0.89,三、数学期望与方差的图示,数学期望描画随机变量的集中程度,方差描画随机变量的离散程度。,1 方差同、期望变大 2 期望同、方差变小,5,10,5,5,四、相关系数与协方差,协方差和相关系数都是描画两个随机变量相互关联程度的参数或统计量。,方差是度量一个随机变量变异程度的目的,而协方差那么是度量两个随机变量协同变动的目的。要度量两个随机变量之间的关系,自然要调查两个变量同时变化协同变化的情况,于是需求定义协方差。为了弥补协方差的缺乏受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的目的相关系数。,1、协方差,1定义:令随机变量X和Y的期望分别为E(x),E(y),其协方差为:,cov(X,Y)=E(X-E(x)(Y-E(y),=E(XY)-E(X)E(Y),普通而言,两随机变量的协方差可正可负。假设两变量同方向变动,那么协方差为正,反之那么为负。,2 协方差的性质,1假设随机变量X,Y相互独立,那么其协方差为0。,2cov(a+bX,c+dY)=bdcov(X,Y),3cov(X,X)=var(X),3相关变量的方差,假设随机变量不是独立的,对于X+Y或X-Y的方差为:,Var(X+Y)=var(X)+var(Y)+2cov(X,Y),Var(X-Y)=var(X)+var(Y)-2cov(X,Y),4假设E(y|x)=E(y),那么Cov(x,y)=0,证明:利用重期望律,2、相关系数,相关系数用 表示,其计算公式为:,从公式可看出两变量的相关系数等于它们的协方差与其各自的规范差之比。,相关系数介于-1到1之间。,相关系数的典型图形见P31,五、偏度(skewness)与峰度(kurtosis),用于描画概率密度函数外形的数字特征。偏度S是对称性的度量;峰度K是概率密度函数高低或胖瘦的度量,1、偏度S的计算,对于正态分布,S0;假设偏度S的值为正,那么其概率密度为正偏或右偏,分布函数有长的右尾;假设S的值为负,那么其概率密度为负偏或左偏,分布函数有长的左尾。,样本平均数用来描画样本的平均程度普通程度。,假设一个事件的发生与另一个事件的发生的能够性一样,那么两个事件称为等能够性的。,1假设a、b为常数,那么,其中m是产生样本序列时用到的估计系数的个数。,那么这个学生是男生的概率是多少?,相关系数介于-1到1之间。,P(ABC)P(A)P(B)P(C),同一组数据计算出来的协方差,2比1大了10倍。,检验的p值(p-value)是指给定t统计量的观测值,能回绝虚拟假设的最小显著性程度。,证明:利用重期望律,经常遇到一些随机变量,它们的分布往往难于直接得到例如滚珠体积的丈量值等,但与它们有关系的另一个随机变量的分布却是容易知道的如滚珠直径的丈量值。,经常遇到一些随机变量,它们的分布往往难于直接得到例如滚珠体积的丈量值等,但与它们有关系的另一个随机变量的分布却是容易知道的如滚珠直径的丈量值。,小的p值是回绝虚拟假设的证据。,总体
展开阅读全文