第三章概率分布与抽样分布

上传人:沈*** 文档编号:244397316 上传时间:2024-10-04 格式:PPT 页数:46 大小:920.50KB
返回 下载 相关 举报
第三章概率分布与抽样分布_第1页
第1页 / 共46页
第三章概率分布与抽样分布_第2页
第2页 / 共46页
第三章概率分布与抽样分布_第3页
第3页 / 共46页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第三章 概率分布与抽样分布,(,Distribution and Sample Distribution,),一、概率与概率分布,(一)概率,通俗地说,概率就是机率。在相同条件下进行,n,次随机试验,事件,A,出现,m,次,则比值,m/n,称为事件,A,发生的频率。随着,n,的增大,该频率围绕某一常数,P,上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件,A,的概率,记为,P,(,A,),=m/n,。,条件概率:,A,、,B,为两个随机事件,,P,(,A,B,)称为事件,B,发生的前提下事件,A,发生的条件概率。,P,(,A,B,),=,,,P,(,B,),0,。,由于增加了新的条件(附加信息),一般说来,,P,(,A,B,),P,(,A,)。,乘法公式:,将条件概率公式变形可得:,P,(,AB,),=P,(,B,),P,(,A,B,),将上式中,A,、,B,的位置对调,可得:,P,(,AB,),=P,(,A,),P,(,B,A,),以上两式统称概率乘法公式。,全概率公式与逆概率公式:,1,、完备事件组,若事件,A,1,、,A,2,、,A,n,互不相容(互斥),且其中之一必然发生,则事件,A,1,、,A,2,、,A,n,组成完备事件组。即,A,1,A,2,A,n,=,,,A,i,A,j,=,(,ij,),2,、全概率公式,若事件,A,1,、,A,2,、,A,n,为完备事件组,则对任一事件,B,,有,一、概率与概率分布,(二)概率分布,概率与随机变量密不可分。,随机变量:离散型、连续型。,概率分布:随机变量取一切可能值的概率的规律称为概率分布,即,P,(,x=everyprobnumber,),=?,概率分布可以用表、图形或公式等多种方式来表示。,二项分布:,只有两种可能结果的试验称为贝努利试验。,n,次独立重复的贝努利试验称为,n,重贝努利试验。在,n,重贝努利试验中,结果,A,(成功)出现,m,次的概率分布为:,其中:,几何分布:,在可列重贝努利试验中,结果,A,(成功)在第,m,次首次出现的概率分布为:,二项分布、几何分布都是贝努利试验导出的分布。,超几何分布:,二项分布与几何分布都是在,n,重或可列重相互,独立,的贝努利试验中形成的。那么,如果这种试验不是相互独立的呢?比如:,假定有一批,500,个产品,而其中有,5,个次品。假定该产品的质量检查采取随机抽取,20,个产品进行检查。如果抽到的,20,个产品中含有,2,个或更多不合格产品,则整个,500,个产品将会被退回。,这时,人们想知道该批产品被退回的概率是多少。该概率满足超几何分布,(hypergeometric distribution),。,这样的抽样一般采取,“,不放回抽样,”,,也就是说,每次抽取之后并不放回。在这种情况下,每次抽取之后,总体之中的合格和不合格品的比例都会发生变化,和以前不一样了,因此,每次试验不再是独立的贝努利试验,在,n,次试验中,结果,A,(成功)出现,m,次的概率分布也就不再服从二项分布,而是服从超几何分布:,其中,N,为产品总数,,n,为试验次数也即抽取出的产品数;,K,为产品中结果,A,的总数也即产品中的总次品数。,一、概率与概率分布,(三)概率密度函数与累积概率分布函数,连续型随机变量不好讲概率分布,所以讲累积概率分布,,P(x,everyprobnumber)=?,而,其累积概率分布也是无穷的,所以用函数来刻画,引入了概率密度函数,(probability density function,,,pdf),和累积概率分布函数,(cumulative distribution function,,,cdf),。,若,X,为连续型随机变量,且存在一个非负函数,f(x),,使得对任意区间(,a,,,b,),有,P,X(a,,,b),=P,a,X,b,=,则称,f(x),为连续型随机变量,X,的概率密度函数。,在平面直角坐标系中画出,f(x),的图形,则对于任何实数,x,1,x,2,,,P(x,1,=30,的条件,样本均值也近似服从正态分布,即:,同理,对于两个相互独立的正态总体,N,(,1,,,1,2,)、,N,(,2,,,2,2,),假设我们从这两个总体中分别抽取一个,n,1,、,n,2,个观察值组成的样本,那么,这两个样本均值的差也服从正态分布,即:,思考:如果这两个总体不是正态总体而,n,1,、,n,2,足够大,样本均值差的分布形态还是这样的吗?,标准正态分布,N(0,,,1),:,标准正态分布的重要性在于,任何一个一般的正态分布都可以化为标准正态分布,即 ,N,(,0,,,1,)。,所以,说一个随机变量服从正态分布,与说它服从标准正态分布没什么太大差别,因为它可以转化为标准正态分布。,数据的标准得分:,我年收入,60,万,多吗?,两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样,(,数据:,grade.txt),。一班的平均分和标准差分别为,78.53,和,9.43,,二班的均值和标准差分别为,70.19,和,7.00,。那么,一班得,90,分的张颖是不是比二班得,82,分的刘疏成绩更好呢?怎么比较才更合理呢?,数据的标准化:,虽然均值和标准差不同的数据不好直接比较,但是可以把它们进行标准化,再比较标准化后的数据。,数据标准化的方法主要有两种;数据标准化后得到的值称为标准得分(,standard score,、,z-score,):,可以看出,原始数据在各自的均值附近,离散程度也不一样。但它们的标准得分则在,0,周围,且离散程度也差不多。数据经过标准化后,均变换成均值为,0,、方差为,1,的样本。标准化后的数据没有量纲;不同样本观测值的比较只有相对意义,没有绝对意义。,100,97,N=,?,?,?,?,110,100,90,80,70,60,50,40,2,1,100,97,N=,?,?,?,?,3,2,1,0,-1,-2,-3,-4,2,1,三、分布,若,X,1,、,X,2,、,X,n,相互独立,且均服从标准正态分布,N,(,0,,,1,)。则随机变量,Y=X,1,2,+X,2,2,+,+X,n,2,的概率分布为自由度为,n,的 分布,简记为,Y,(,n,)。,自由度:变量的自由程度。对于样本方差,S,2,,则:,比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。为了估计某产品能耗的方差,我们随机抽取了,10,件,测得其能耗为(千瓦时,/,小时):,12.5,,,12.12,,,12.01,,,12.28,,,12.09,,,12.03,,,12.01,,,12.11,,,12.06,,,12.14,。,那么,当其能耗,x,服从正态分布时,:,思考:,在上一张片子中,下面的统计量是严格服从卡方分布还是近似服从卡方分布?为什么?,再,比如,为研究家庭食品支出与收入的关系,随机抽取了,10,户家庭作为样本,得到如下数据:,那么,当食品支出,y,服从正态分布时,:,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。思考:,服从卡方分布吗?如果服从,其自由度是多少?如果不服从,那在什么情况或什么条件下服从?,四、,t,分布,若随机变量,X,Z,(,0,,,1,),,Y,(,n,),且,X,、,Y,相互独立,则随机变量,Z=,服从自由度为,n,的,t,分布,简记为,Z,t,(,n,)。,t,分布概率密度曲线图如下:,特点:,1,、,t,分布为对称分布;,2,、,n,充分大时,,t,分布近似,Z,(,0,,,1,)。,考察统计量,其中,分子 ,分母中 。因此,,T,t,(,n-1,)。,五、,F,分布,若随机变量,X,(,n,1,),,Y,(,n,2,),且,X,、,Y,相互独立,则随机变量,Z=,服从自由度为(,n,1,,,n,2,)的,F,分布,简记为,Z,F,(,n,1,,,n,2,)。,F,分布的概率密度曲线如下:,比如,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,比如,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,六、随机变量,X,与,Y,相互独立的充要条件:,1,、离散变量:,P,(,X=x,i,,,Y=y,i,),=P,(,X=x,i,),P,(,Y=y,i,),(边缘概率分布之积等于联合概率分布),2,、连续变量:,f,(,x,,,y,),=f,X,(,x,),f,Y,(,y,),(边缘概率密度之积等于联合概率密度),R,软件中的统计计算:,常用分布:,norm,:正态;,t,:,t,分布;,f,:,F,分布;,chisq,:卡方分布;,unif,:均匀分布;,binom,:二项分布。,每种分布有四个函数:,ddensity,(密度函数);,pprobability(,概率分布函数,),;,qquantile(,分位数函数,),;,rrandom(,随机数函数,),。,如,对于正态分布来说:,dnorm,、,pnorm,、,qnorm,、,rnorm,。,pnorm(0,0,1);rnorm(100,0,1);qnorm(0.975,0,1),#,画正态分布概率密度曲线(,N,(,0,,,1),,,N,(,0,,,22),,,N,(,0,,,32,),x=seq(-6,6,length=2000),plot(x,dnorm(x,0,1),type=l,lwd=3,xaxs=i,yaxs=i,font=3,ylab=Density of Normal,main=,正态分布概率密度曲线,(,=0),col=red,pch=4),points(x,dnorm(x,0,2),type=l,lwd=3,col=red)#,增加,N,(,0,,,22),概率密度曲线,points(x,dnorm(x,0,3),type=l,lwd=3,col=red)#,增加,N,(,0,,,32),概率密度曲线,#,以下两句主要是把,-1,左边的区域加上竖线,x1=seq(-6,-1,length=30),points(x1,dnorm(x1,0,1),type=h,lwd=2,col=dark green)#,把,-1,左边区域加上竖线,text(-1,0.01,labels=if X,z(0,1),,,p(X=-1.0)=?,adj=c(0,0),font=30,col=red)#,在,x=-1,、,y=0.01,处加注,“,X,z(0,1),,,p(Xtext(locator(1),=1,adj=0);text(locator(1),=2,adj=0);text(locator(1),=3,adj=0)#,通过鼠标直接点击给图形加上文字,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!