(03)第3章 概率、概率分布与抽样分布(袁卫)

上传人:沈*** 文档编号:244126449 上传时间:2024-10-02 格式:PPT 页数:112 大小:707KB
返回 下载 相关 举报
(03)第3章 概率、概率分布与抽样分布(袁卫)_第1页
第1页 / 共112页
(03)第3章 概率、概率分布与抽样分布(袁卫)_第2页
第2页 / 共112页
(03)第3章 概率、概率分布与抽样分布(袁卫)_第3页
第3页 / 共112页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,3,*,统计学,STATISTICS,第,3,章 概率、概率分布与抽样分布,3.1,事件及其概率,3.2,随机变量及其概率分布,3.3,常用的抽样方法,3.4,抽样分布,3.5,中心极限定理的应用,1,学习目标,事件及其概率,随机变量及其概率分布,常用的抽样方法,抽样分布,中心极限定理的应用,2,3.1,事件及其概率,3.1.1,试验、事件和样本空间,3.1.2,事件的概率,3.1.3,概率的性质和运算法则,3.1.4,条件概率与事件的独立性,3.1.5,全概公式与逆概公式,3,3,试验、事件和样本空间,3,4,试 验,(experiment),对试验对象进行一次观察或测量的过程,掷一颗骰子,观察其出现的点数,从一副,52,张扑克牌中抽取一张,并观察其结果,(,纸牌的数字或花色,),试验的特点,可以在相同的条件下重复进行,每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的,在试验结束之前,不能确定该次试验的确切结果,5,事件,(,event,),事件:,试验的每一个可能结果,(,任何样本点集合,),掷一颗骰子出现的点数为,3,用大写字母,A,,,B,,,C,,,表示,随机事件,(,random event,),:,每次试验可能出现也可能不出现的事件,掷一颗骰子可能出现的点数,6,事件,(,event,),简单事件,(,simple event,),:,不能被分解成其他事件组合的基本事件,抛一枚均匀硬币,,“,出现正面,”,和,“,出现反面,”,必然事件,(,certain event,),:,每次试验一定出现的事件,用,表示,掷一颗骰子出现的点数小于,7,不可能事件,(,impossible event,),:,每次试验一定不出现的事件,用,表示,掷一颗骰子出现的点数大于,6,7,样本空间与样本点,样本空间,(sample Space),一个试验中所有结果的集合,用,表示,例如:在,掷一颗骰子的试验中,样本空间表示为:,1,2,3,4,5,6,在投掷硬币的试验中,,正面,反面,样本点,( sample point),样本空间中每一个特定的试验结果,用符号,表示,8,事件的概率,3,9,事件的概率,(,probability,),事件,A,的概率是一个介于,0,和,1,之间的一个值,用以度量试验完成时事件,A,发生的可能性大小, 记为,P,(,A,),当试验的次数很多时,概率,P,(,A,),可以由所观察到的事件,A,发生次数,(,频数,),的比例来逼近,在相同条件下,重复进行,n,次试验,事件,A,发生了,m,次,则事件,A,发生的概率可以写为,10,概率的性质和运算法则,3,11,互斥事件及其概率,(mutually exclusive events),在试验中,两个事件有一个发生时,另一个就不能发生,,则称事件,A,与事件,B,是,互斥事件,(,没有公共样本点,),A,B,互斥事件的文氏图,(Venn diagram),12,互斥事件及其概率,(,例题分析,),【,例,】,在一所城市中随机抽取,600,个家庭,用以确定拥有个人电脑的家庭所占的比例。定义如下事件:,A,:,600,个家庭中恰好有,265,个家庭拥有电脑,B,:,恰好有,100,个家庭拥有电脑,C,:,特定户张三家拥有电脑,说明下列各对事件是否为互斥事件,并说明你的理由,(1),A,与,B,(2),A,与,C,(3),B,与,C,13,互斥事件及其概率,(,例题分析,),解:,(1),事件,A,与,B,是互斥事件。因为你观察,到恰好有,265,个家庭拥有电脑,就,不可能恰好有,100,个家庭拥有电脑,(2),事件,A,与,C,不是互斥事件。因为张三,也许正是这,265,个家庭之一,因而事,件与有可能同时发生,(3),事件,B,与,C,不是互斥事件。理由同,(2),14,互斥事件及其概率,(,例题分析,),【,例,】,同时抛掷两枚硬币,并考察其结果。恰好有一枚,正面朝上的概率是多少?,解,:用,H,表示正面,,T,表示反面,下标,1,和,2,表示硬币,1,和硬币,2,。该项试验会有,4,个互斥事件之一发生,(1),两枚硬币都正面朝上,记为,H,1,H,2,(2) 1,号硬币正面朝上而,2,号硬币反面朝上,记为,H,1,T,2,(3) 1,号硬币反面朝上而,2,号硬币正面朝上,记为,T,1,H,2,(4),两枚硬币都是反面朝上,记为,T,1,T,2,15,互斥事件及其概率,(,例题分析,),解:,由于每一枚硬币出现正面或出现反面的概率都是,1/2,,当抛掷的次数逐渐增大时,上面的,4,个简单事件中每一事件发生的相对频数,(,概率,),将近似等于,1/4,。因为仅当,H,1,T,2,或,T,1,H,2,发生时,才会恰好有一枚硬币朝上的事件发生,而事件,H,1,T,2,或,T,1,H,2,又为互斥事件,两个事件中一个事件发生或者另一个事件发生的概率便是,1/2,(1/4+1/4),。因此,抛掷两枚硬币,恰好有一枚出现正面的概率等于,H,1,T,2,或,T,1,H,2,发生的概率,也就是两种事件中每个事件发生的概率之和,16,互斥事件的加法规则,(,addition law,),加法规则,若,两个事件,A,与,B,互斥,则事件,A,发生或事件,B,发生的概率等于这两个事件各自的概率之和,即,P,(,A,B,) =,P,(,A,)+,P,(,B,),事,件,A,1,,,A,2,,,,,A,n,两两互斥,则有,P,(,A,1,A,2,A,n,),=,P,(,A,1,)+,P,(,A,2,) +,+,P,(,A,n,),17,互斥事件的加法规则,(,例题分析,),解:,掷一颗骰子出现的点数,(,1,,,2,,,3,,,4,,,5,,,6,),共有,6,个互斥事件,而且每个事件出现的概率都为,1/6,根据互斥事件的加法规则,得,【,例,】,抛掷一,颗,骰子,并考察其结果。求出其点 数为,1,点或,2,点或,3,点或,4,点或,5,点或,6,点的概率,18,概率的性质,(,小结,),非,负,性,对任意事件,A,,,有,P,1,规范性,一个事件的概率是一个介于,0,与,1,之间的值,即对于任意事件,A,,,有,0,P, 1,必然事件的概率为,1,;不可能事件的概率为,0,。,即,P,(,)=1,;,P,(,)=0,可加性,若,A,与,B,互斥,则,P,(,A,B,) =,P,(,A,)+,P,(,B,),推广到多个两两互斥事件,A,1,,,A,2,,,,,A,n,,,有,P,(,A,1,A,2,A,n,) =,P,(,A,1,)+,P,(,A,2,)+,+,P,(,A,n,),19,事件的补及其概率,事件的,补,(,complement,),事件,A,不发生的事件,称为补事件,A,的补事件,(,或称逆事件,),,,记为,A,。,它是样本空间中所有不属于事件,A,的样本点的集合,A,A,P,(,A,)=1-,P,(,A,),20,广义加法公式,广义加法公式,对任意两个随机事件,A,和,B,,,它们和的概率为两个事件分别概率的和减去两个事件交的概率,即,P,(,A,B,) =,P,(,A,) +,P,(,B,) -,P,(,A,B,),两个事件的并,两个事件的交,21,广义加法公式,(,事件的并或和,),事件,A,或事件,B,发生的事件,称为事件,A,与事件,B,的并。它是由属于事件,A,或事件,B,的所有样本点的集合,记为,A,B,或,A,+,B,B,A,A,B,22,广义加法公式,(,事件的交或积,),A,B,A,B,事件,A,与事件,B,同时发生的事件,称为事件,A,与事件,B,的交,,,它是由属于事件,A,也属于事件,B,的所有公共样本点所组成的集合,记为,B,A,或,AB,23,广义加法公式,(,例题分析,),解:,设,A,=,员工离职是因为对工资不满意,B,=,员工离职是因为对工作不满意,依题意有:,P,(,A,),=0.40,;,P,(,B,),=0.30,;,P,(,AB,),=0.15,P,(,AB,)=,P,(,A,)+,P,(,B,)+,P,(,AB,),=0.40+0.30-0.15,=,0.55,【,例,】,一,家计算机软件开发公司的人事部门最近做了一项调查,发现在最近两年内离职的公司员工中有,40%,是因为对工资不满意,有,30%,是因为对工作不满意,有,15%,是因为他们对工资和工作都不满意。求两年内离职的员工中,离职原因是因为对工资不满意、或者对工作不满意、或者二者皆有的概率,24,条件概率与事件的独立性,3,25,条件概率,(,conditional probability,),在事件,B,已经发生的条件下事件,A,发生的概率,称为已知事件,B,时事件,A,的条件概率,记为,P,(,A,|,B,),P,(,B,),P,(,AB,),P,(,A,|,B,) =,事件,B,及其概率,P,(,B,),事件,A,B,及其概率,P,(,A,B,),事件,A,事件,B,一旦事件,B,发生,26,条件概率,(,例题分析,),解:,设,A,=,顾客购买食品,,B,=,顾客购买其他商品,依题意有:,P,(,A,),=0.80,;,P,(,B,),=0.60,;,P,(,AB,),=0.35,【,例,】,一家超市所作的一项调查表明,有,80%,的顾客到超市是来购买食品,,60%,的人是来购买其他商品,,35%,的人既购买食品也购买其他商品。求:,(1),已知某顾客购买食品的条件下,也购买其他商品的概率,(2),已知某顾客购买其他的条件下,也购买食品的概率,27,条件概率,(,例题分析,),【,例,】,一家电脑公司从两个供应商处购买了同一种计算机配件,质量状况如下表所示,从这,200,个配件中任取一个进行检查,求,(1),取出的一个为正品的概率,(2),取出的一个为供应商甲的配件的概率,(3),取出一个为供应商甲的正品的概率,(4),已知取出一个为供应商甲的配件,它是正品的概率,甲乙两个供应商提供的配件,正品数,次品数,合计,供应商甲,84,6,90,供应商乙,102,8,110,合计,186,14,200,28,条件概率,(,例题分析,),解:,设,A,=,取出的一个为正品,B,=,取出的一个为供应商甲供应的配件,(1),(2),(3),(4),29,乘法公式,(multiplicative,law,),用来计算两事件交的概率,以条件概率的定义为基础,设,A,,,B,为两个事件,若,P,(,B,)0,,,则,P,(,AB,)=,P,(,B,),P,(,A,|,B,),或,P,(,AB,)=,P,(,A,),P,(,B,|,A,),30,乘法公式,(,例题分析,),【,例,】,一家报纸的发行部已知在某社区有,75%,的住户订阅了该报纸的日报,而且还知道某个订阅日报的住户订阅其晚报的概率为,50%,。求某住户既订阅日报又订阅晚报的概率,解:,设,A,=,某住户订阅了日报,B,=,某个订阅了日报的住户订阅了晚报,依题意有,:,P,(,A,),=0.75,;,P,(,B,|,A,)=0.50,P,(,A,B,),=,P,(,A,),P,(,B,|,A,)=0.750.5=,0.375,31,独立事件与乘法公式,(,例题分析,),【,例,】,从一个装有,3,个红球,2,个白球的盒子里摸球,(,摸出后球不放回,),,求连续两次摸中红球的概率,解:,设,A,=,第,2,次摸到红球,B,=,第,1,次摸到红球,依题意有,:,P,(,B,),=3/5,;,P,(,A,|,B,)=2/4,P,(,A,B,),=,P,(,A,),P,(,B,|,A,)=3/52/4=,0.3,32,独立事件与乘法公式,(independent events),若,P,(,A,|,B,)=,P,(,A,),或,P,(,B,|,A,)=,P,(,B,),,,则称事件,A,与,B,事件独立,或称独立事件,若两个事件相互独立,则这两个事件同时发生的概率等于它们各自发生的概率之积,即,P,(,AB,)=,P,(,A,),P,(,B,),若事件,A,1,A,2,A,n,相互独立,则,P,(,A,1,A,2,A,n,)=,P,(,A,1,),P,(,A,2,),P,(,A,n,),33,独立事件与乘法公式,(,例题分析,),【,例,】,一个旅游经景点的管理员根据以往的经验得知,有,80%,的游客在古建筑前照相留念。求接下来的两个游客都照相留念的概率,解:,设,A,=,第一个游客照相留念,B,=,第二个游客照相留念,两个游客都照相留念是两个事件的交。在没,有其他信息的情况下,我们可以假定事件,A,和事件,B,是相互立的,所以有,P,(,A,B,),=,P,(,A,),P,(,B,)=0.800.80=,0.64,34,独立事件与乘法公式,(,例题分析,),【,例,】,假定我们是从两个同样装有,3,个红球,2,个白球的盒子摸球。每个盒子里摸,1,个。求连续两次摸中红球的概率,解:,设,A,=,从第一个盒子里摸到红球,B,=,从第二个盒子里摸到红球,依题意有,:,P,(,A,),=3/5,;,P,(,B,|,A,)=3/5,P,(,A,B,),=,P,(,A,),P,(,B,|,A,)=3/53/5=,0.36,35,全概,公式与逆概公式,3,36,全概公式,全概公式,B,2,B,5,B,4,B,1,B,3,完备事件组,37,全概公式,(,例题分析,),【,例,】,假设在,n,张彩票中只有一张中奖奖券,那么第二个人摸到奖券的概率是多少?,解:,设,A,=,第二个人摸到奖券,,B,=,第一个人摸到奖券,依题意有,:,P,(,B,),=1/,n,;,P,(,B,)=(,n,-1)/,n,P,(,A,|,B,)=0,P,(,A,|,B,)=1/,n,-1,38,逆概公式,逆概公式,(,贝叶斯公式,),P,(,B,i,),被称为事件,B,i,的先验概率,(,prior probability,),P,(,B,i,|,A,),被称为事件,B,i,的后验概率,(posterior probability),39,逆概公式,(,例题分析,),【,例,】,某考生回答一道四选一的考题,假设他知道正确答案的概率为,1/2,,而他不知道正确答案时猜对的概率应该为,1/4,。考试结束后发现他答对了,那么他知道正确答案的概率是多大呢?,解:,设,A,=,该考生答对了 ,,B,=,该考生知道正确答案,依题意有,:,P,(,B,),=1/2,;,P,(,B,)=1-1/2 = 1/2,P,(,A,|,B,)=1/4,P,(,A,|,B,)=1,40,3.,2,随机变量及其概率分布,3.2.1,随机变量,3.2.2,离散型随机变量的概率分布,3.2.3,离散型随机变量的数学期望和方差,3.2.4,几种常用的离散型概率分布,3.2.5,概率密度函数与连续型随机变量,3.2.6,常见的连续型概率分布,3,41,随机变量,3,42,随机变量,(random variables),一次试验的结果的数值性描述,一般,用,X,,,Y,,,Z,来表示,例如: 投掷两枚硬币出现正面的数量,根据取值情况的不同分为离散型随机变量和连续型随机变量,43,离散型随机变量,随机变量,X,取有限个值或所有取值都可以逐个列举,出来,x,1,x,2,,,以确定的概率取这些不同的值,离散,型随机变量的一些例子,试验,随机变量,可能的取值,抽查,100,个,产品,一家餐馆营业一天,电脑公司一个月的销售,销售一辆汽车,取到次品的个数,顾客数,销售量,顾客性别,0,1,2, ,100,0,1,2, ,0,1, 2,男性为,0,女性为,1,44,连续型随机变量,可以取一个或多个区间中任何值,所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点,连续型随机变量的一些例子,试验,随机变量,可能的取值,抽查一批电子元件,新建一座住宅楼,测量一个产品的,长度,使用寿命,(,小时,),半年后工程完成的百分比,测量误差,(cm),X,0,0,X,100,X,0,45,离散型随机变量的概率分布,3,46,离散型随机变量的概率分布,列出离散型随机变量,X,的所有可能取值,列出随机变量取这些值的概率,通常用下面的表格来表示,X,=,x,i,x,1,,,x,2,,,,,x,n,P,(,X,=,x,i,)=,p,i,p,1,,,p,2,,,,,p,n,P,(,X,=,x,i,)=,p,i,称为离散型随机变量的概率函数,p,i,0,;,47,离散型随机变量的概率分布,(,例题分析,),【,例,】,一部电梯在一周内发生故障的次数,X,及相应的概率如下表,故障次数,X,=,x,i,0,1,2,3,概率,P,(,X,=,x,i,),p,i,0.10,0.25,0.35,一部电梯一周发生故障的次数及概率分布,(1),确定,的值,(2),求正好发生两次故障的概率,(3),求故障次数多于一次的概率,(4),最多发生一次故障的概率,48,离散型随机变量的概率分布,(,例题分析,),解:,(1),由于,0.10+0.25+0.35+,=1,所以,,=0.30,(2),P,(,X,=2)=0.35,(3),P,(,X,2)=0.10+0.25+0.35=0.70,(4),P,(,X,1,)=0.35+0.30=0.65,49,离散型随机变量的数学期望和方差,3,50,离散型随机变量的数学期望,(expected value),离散,型随机变量,X,的所有可能取值,x,i,与其,取相对应的,概率,p,i,乘积之和,描述离散型随机变量取值的集中程度,记为,或,E,(,X,),计算公式为,51,离散型随机变量的方差,(,variance,),随机变量,X,的,每一个取值与期望值的离差平方和的数学,期望,记为,2,或,D,(,X,),描述离散型随机变量取值的分散程度,计算公式为,方差的平方根称为标准差,记为,或,D,(,X,),52,离散型数学期望和方差,(,例题分析,),【,例,】,一家电脑配件供应商声称,他所提供的配件,100,个中拥有次品的个数及概率如下表,次品数,X,=,x,i,0,1,2,3,概率,P,(,X,=,x,i,),p,i,0.75,0.12,0.08,0.05,每,100,个配件中的次品数及概率分布,求该供应商次品数的数学期望和标准差,53,几种常用的离散型概率分布,3,54,常用离散型概率分布,55,两点分布,一个离散型随机变量,X,只取,0,和,1,两个可能的值,它们的概率分布为,或,也称,0-1,分布,56,两点分布,(,例题分析,),【,例,】,已知一批产品的次品率为,p,0.04,,,合格率为,q,=1-,p,=1-0.04=0.96,。,并指定废品用,1,表示,合格品用,0,表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为,X,=,x,i,0 1,P,(,X,=,x,i,)=,p,i,0.05 0.95,0.5,0,1,1,x,P,(,x,),57,二项试验,(,伯努利试验,),二项分布与伯努利试验有关,贝努里试验满足下列条件,一次试验只有两个可能结果,即,“,成功,”,和,“,失败,”,“,成功,”,是指我们感兴趣的某种特征,一次试验“成功”的概率为,p,,,失败的概率为,q,=1-,p,,,且概率,p,对每次试验都是相同的,试验是相互独立的,并,可以重复进行,n,次,在,n,次试验中,,“,成功,”,的次数对应一个离散型随机变量,X,58,二项分布,(Binomial distribution),重复,进行,n,次试验,出现“成功”的次数的概率分布称为二项分布,记为,X,B,(,n,,,p,),设,X,为,n,次重复试验中出现成功的次数,,X,取,x,的概率为,59,二项分布,对,于,P,(,X,=,x,), 0,,,x,=1,2,n,,,有,同,样有,当,n,=,1,时,,二项分布化简为,60,二项分布,(,例题分析,),【,例,】,已知一批产品的次品率为,4%,,,从中任意有放回地抽,取,5,个。求,5,个产品中:,(1),没有次品的概率是多少?,(2),恰好有,1,个次品的概率是多少?,(3),有,3,个以下次品的概率是多少?,61,泊松分布,(Poisson distribution),1837,年法国数学家泊松,(D.Poisson,,,17811840),首次提出,用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布,泊松分布的例子,一定时间段内,某航空公司接到的订票电话数,一定时间内,到车站等候公共汽车的人数,一定路段内,路面出现大损坏的次数,一定时间段内,放射性物质放射的粒子数,一匹布上发现的疵点个数,一定页数的书刊上出现的错别字个数,62,泊松分布,(,概率分布函数,),给定的时间间隔、长度、面,积、体积内“成功”的平均数,e = 2.71828,x,给定的时间间隔、长度、面,积、体积内“成功”的次数,63,泊松分布,(,例题分析,),【,例,】,假定某航空公司预订票处平均每小时接到,42,次订票电话,那么,10,分钟内恰好接到,6,次电话的概率是多少?,解:,设,X,=,10,分钟内航空公司预订票处接到的电话次数,64,泊松分布,(,作为二项分布的近似,),当试验的,次数,n,很大,成功的概率,p,很小时,可用泊松分布来近似地计算二项分布的概率,即,实际应用,中,当,P,0.05,,,n,20,,,np,5,时,近似效果良好,65,超几何分布,采用不重复抽样,各次试验并不独立,成功的概率也互不相等,总体元素的数目,N,很小,或样本量,n,相对于,N,来说较大时,样本中“成功”的次数则服从超几何概率分布,概率分布函数为,66,超几何分布,(,例题分析,),【,例,】,假定有,10,支股票,其中有,3,支购买后可以获利,另外,7,支购买后将会亏损。如果你打算从,10,支股票中选择,4,支购买,但你并不知道哪,3,支是获利的,哪,7,支是亏损的。求:,(1),有,3,支能获利的股票都被你选中的概率有多大?,(2)3,支可获利的股票中有,2,支被你选中的概率有多大?,解:,设,N,=,10,,,M,=3,,,n,=4,67,概率密度函数,3,68,连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值,它取任何一个特定的值的概率都等于,0,不能列出每一个值及其相应的概率,通常研究它取某一区间值的概率,用概率密度函数的形式和分布函数的形式来描述,69,概率密度函数,设,X,为一连续型随机变量,,x,为任意实数,,X,的概率密度函数记为,f,(,x,),,,它满足条件,f,(,x,),不是概率,70,连续型随机变量的期望和方差,连续型随机变量的数学期望,方差,71,正态分布,3,72,正态分布,(normal distribution),由,C.F.,高斯,(,Carl Friedrich Gauss,,,1777,1855,),作为描述误差相对频数分布的模型而提出,描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述,可用于近似离散型随机变量的分布,例如: 二项分布,经典统计推断的基础,73,概率密度函数,f,(,x,) =,随机变量,X,的频数,=,正态随机变量,X,的均值,=,正态随机变量,X,的方差,= 3.1415926,; e =,2.71828,x,=,随机变量的取值,(-,x,),74,正态分布函数的性质,图形是关于,x,=,对称钟形曲线,且峰值在,x,=,处,均值,和标准差,一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”,均值,可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的,“,陡峭,”,或,“,扁平,”,程度,。,越大,正态曲线扁平;,越小,正态曲线越高陡峭,当,X,的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于,1,75,标准正态分布,(standardize the normal distribution),标准正态分布,的概率密度函数,随机变量具有均值为,0,,标准差为,1,的正态分布,任何一个,一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布,的分布函数,76,正态分布,(,例题分析,),【,例,】,定某公司职员每周的加班津贴服从均值为,50,元、标准差为,10,元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过,70,元,又有多少比例的职员每周的加班津贴在,40,元到,60,元之间呢?,解:,设,=5,0,,,=10,,,X,N,(50,10,2,),77,均匀分布,3,78,均匀分布,(uniform distribution),若随机,变量,X,的概率密度函数为,称,X,在,a,b,上,服从均匀分布,记为,X,U,a,b,数学,期望和方差,79,均匀分布,(,概率计算,),随机,变量,X,在某取值范围,a,b,的任一子区间,c,d,上取值的概率为,同样有:,80,均匀分布,(,例题分析,),【,例,】,某公共汽车站从早上,6,时起每隔,15,分钟开出一趟班车,假定某乘客在,6,点以后到达车站的时刻是随机的,所以有理由认为他等候乘车的时间长度,X,服从参数为,a,=0,,,b,=15,的均匀分布。试求该乘客等候乘车的时间长度少于,5,分钟的概率,解:,概率密度函数为,落入区间,0,,,15,的任一子区间,0,,,d,的概率是 ,等候乘车的时间长度少于,5,分钟即有,d,=5,,,因此该事件发生的概率等于,5/15=1/3,81,指数分布,3,82,指数分布,(,exponential distribution,),若随机,变量,X,的概率密度函数为,称,X,服从参数为,的指,数,分布,记为,X,E,(,),数学,期望和方差,83,指数分布,(,概率计算,),随机,变量,X,取小于或等于某一特定值,x,的概率为,随机,变量,X,落入任一区间,(,a,,,b,),的概率为,84,指数分布,(,例题分析,),【,例,】,假定某加油站在一辆汽车到达之后等待下一辆汽车到达所需要的时间,(,单位:分钟,),服从参数为,1/5,的指数分布,如果现在正好有一辆汽车刚刚到站加油,试分别求以下几个事件发生的概率:,(1),一辆汽车到站前需要等待,5,分钟以上,(2),一辆汽车到站前需要等待,5,10,分钟,解:,85,3.,3,常用的抽样方法,3.3.1,简单随机抽样,3.3.2,分层抽样,3.3.3,系统抽样,3.3.4,整群抽样,3,86,简单随机抽样,(,simple random sampling,),从总体,N,个单位中随机地抽取,n,个单位作为样本,,使得每一个容量为样本都有相同的机会,(,概率,),被抽中,抽取元素的具体方法有重复抽样和不重复抽样,特点,简单、直观,在抽样框完整时,可直接从中抽取样本,用样本统计量对目标量进行估计比较方便,局限性,当,N,很大时,不易构造抽样框,抽出的单位很分散,给实施调查增加了困难,没有利用其他辅助信息以提高估计的效率,87,分层抽样,(,stratified sampling,),将,总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,优点,保证样本的结构与总体的结构比较相近,从而提高估计的精度,组织实施调查方便,既可以对总体参数进行估计,也可以对各层的目标量进行估计,88,系统抽样,(,systematic sampling,),将总体中的所有单位,(,抽样单位,),按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,先从数字,1,到,k,之间随机抽取一个数字,r,作为初始单位,以后依次取,r,+,k,,,r,+2,k,等单位,优点:操作简便,可提高估计的精度,缺点:对估计量方差的估计比较困难,89,整群抽样,(,cluster sampling,),将总体中若干个单位合并为组,(,群,),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,特点,抽样时只需群的抽样框,可简化工作量,调查的地点相对集中,节省调查费用,方便调查的实施,缺点是估计的精度较差,90,3.,4,抽样分布,3.4.1,抽样分布的概念,3.4.2,样本均值抽样分布的形式,3.4.3,样本均值抽样分布的特征,3.4.4,中心极限定理,3,91,抽样分布的概念,3,92,样本统计量的概率分布,,是一种理论分布,在重复选取容量为,n,的样本时,由该统计量的所有可能取值形成的相对频数分布,随机变量是,样本统计量,样本均值,样本比例,样本方差等,结果来自,容量相同,的,所有,可能样本,提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布,(,sampling distribution,),93,样本均值的抽样分布,3,94,在重复选取容量为,n,的样本时,由样本均值的所有可能取值形成的相对频数分布,一种理论概率分布,推断总体均值,的理论基础,样本均值的抽样分布,95,样本均值的抽样分布,(,例题分析,),【,例,】,设一个总体,,含有,4,个元素,(,个体,),,即总体单位数,N,=,4,。,4,个个体分别为,x,1,=1,,,x,2,=2,,,x,3,=3,,,x,4,=4,。,总体的均值、方差及分布如下,总体分布,1,4,2,3,0,.1,.2,.3,均值和方差,96,样本均值的抽样分布,(,例题分析,),现从总体中抽取,n,2,的简单随机样本,在重复抽样条件下,共有,4,2,=16,个样本。所有样本的结果为,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个,观察值,所有可能的,n,= 2,的样本(共,16,个),97,样本均值的抽样分布,(,例题分析,),计算出各样本的均值,如下表。并给出样本均值的抽样分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个,观察值,16,个样本的均值(,x,),x,样本均值的抽样分布,1.0,0,0.1,0.2,0.3,P,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,98,样本均值的数学期望,样本均值的方差,重复抽样,不重复抽样,样本均值的抽样分布,(,数学期望与方差,),99,样本均值的抽样分布,(,数学期望与方差,),比较及结论:,1.,样本均值的均值,(,数学期望,),等于总体均值,2.,样本均值的方差等于总体方差的,1/,n,100,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,101,样本比例的抽样分布,3,102,总体,(,或样本,),中具有某种属性的单位与全部单位总数之比,不同性别的人与全部人数之比,合格品,(,或不合格品,),与全部产品总数之比,总体比例可表示为,样本比例可表示为,比例,(proportion),103,在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布,一种理论概率分布,当样本量很大时,样本比例的抽样分布可用正态分布近似,推断总体比例,的理论基础,样本比例的抽样分布,104,样本比例的数学期望,样本比例的方差,重复抽样,不重复抽样,样本比例的抽样分布,(,数学期望与方差,),105,样本方差的抽样分布,3,106,样本方差的分布,在重复选取容量为的样本时,由样本方差的所有可能取值形成的相对频数分布,对于来自正态总体的简单随机样本,则比值,的抽样分布服从自由度为,(,n,-1),的,2,分布,即,107,3.,5,中心极限定理,3,108,中心极限定理,3,109,中心极限定理,(,central limit theorem,),中心极限定理:,设从均值为,,,方差为,2,的一个任意总体中抽取容量为,n,的样本,当,n,充分大时,样本均值的抽样分布近似服从均值为,、,方差为,2,/,n,的正态分布,110,中心极限定理,(,central limit theorem,),x,的分布趋于正态分布的过程,111,本章小结,事件及其概率,随机变量及其概率分布,常用的抽样方法,抽样分布,中心极限定理的应用,112,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!