正态分布和线性回归

上传人:ba****u 文档编号:157562573 上传时间:2022-09-30 格式:DOCX 页数:17 大小:122.16KB
返回 下载 相关 举报
正态分布和线性回归_第1页
第1页 / 共17页
正态分布和线性回归_第2页
第2页 / 共17页
正态分布和线性回归_第3页
第3页 / 共17页
点击查看更多>>
资源描述
专题:正态分布和线性回归基础知识回顾1.正态分布:若总体密度曲线就是或近似地是函数f(x)r= eW厂,X.的图象J2 兀 CT其中:n是圆周率;e是自然对数的底;x是随机变量的取值j为正态分布的平均值;二是正态 分布的标准差这个总体是无限容量的抽样总体,其分布叫做正态分布正态分布由参数二唯 一确定,记作 Naa7E( ,D( )2.2.函数f(x)图象被称为正态曲线.(1) 从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为X= P,并在X=r时取 最大值。从x= P点开始,曲线向正负两个方向递减延伸,不断逼近X轴,但永不与X轴相 交,因此说曲线在正负两个方向都是以x轴为渐近线的,(3)当P的值一定时C越大,曲线越“矮胖”总体分布越分散;c越小,曲线越“高”,总体分布越集中.3.把 N(0,1)即P=0, 0=1称为标准正态分布,这样的正态总体称为标准正态总体,其密度函数12x2为f (x) e2,x (-+ 相应的曲线称为标准正,*X,272兀曲线,4 .利用标准正态分布表可求得标准正态总体在某一区间内取的概率.(1)对于标准正态总体N(0,1),: :,(xo)是总体取值小于X。的概率,即:叮(Xo)=P(X:: X。),其中Xo0,其值可以通过“标准正态分布表”查得,也就是图中阴影部分的面积,它表示 总体取值小于X。的概率.标准正态曲线关于y轴对称。因为当xo0时, (xo) = P(x : : x。);而当Xo0时,根据正态曲线的性质可得:(xo)=1-G(-Xo),并且可以求得在任一区间1,X2)内 取值的概率PA ex vx2) =6(x2)-(xj,显然(0)=0.5.5.对于任一正态总体 N (二 ),都可以2通过使之标准化N (0,1),那么,PC- x) = P( -)A: A(-),求得其在某一区间内取值的概率.CTCT匕_1例如:N(1,4),那么,设= ,则 小(0,1),有 P( 3)=P(1)= F(1)=0.8413.26.(1)=0.8413、=0.9772、=0.9987、例题1. 下面给出三个正态总体的函数表示式,请找出其均值口和标准差c.(1) f(x)=1, (-VXV+-V2n(2) 讣成22(3) f (x)二 2_2(x 1)2(4 XV +X2 二2. 正态总体的函数表示式是f (x) =_2_e2xi)2, (xv + %)( 1)求f (x)的最大值;(2) 利用指数函数性质说明其单调区间,以及曲线的对称轴.3. 利用标准正态分布表(=0.8413、=0.9772、(3)=0.9987)求标准正态总体在下面区 间取值的概率.(1) (0, 1);(2) (1, 3);(3) (-1, 2).4 .利用标准正态分布表(=0.8413、(1.84)=0.9671),求正态总体在下面区间取值的概率.(1) 在 N(1,4)下,求 F(3)(2) 在 NC*2)下,求 P(片 1.84 oX 时 1.84 C5 .对于正态总体N (,匚七.顼.号.卜.;:(1) ( P- c, (+ c):1(2) (片 2 c,p+2 c):(3) ( p-3 c,p+3 c):取值的概率分别为68.3%、95.4%、99.7%。因此我们时常只在区间(p3 c,p+3 c)内研究正 态总体分布情况,而忽略其中很小的一部分,这一部分情况发生为小概率事件。6. 下列关于正态曲线性质的叙述正确的是(1) 曲线关于直线x= 口对称这个曲线只在x轴上方;(曲线关于直线x= c对称这个曲线只有当x (-3 c, 3 c)时才在x轴上方;(3) 曲线关于y轴对称,因为曲线对应的正态密度函数是一个偶函数;曲线在x= p时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低;(5) 曲线的对称轴由口确定,曲线的形状由c确定;(6) c越大,曲线越“矮胖”总体分布越分散;c越小,曲线越“高”总体分布越集中.()(A)只有(】)(4 )( 5 )( 6)(B)只有(2)(4 )( 5)(C)只有(3)( 4 )( 5 )(6 )(D)只有(】)(5 )(6 )7. 把一个正态曲线a沿着横轴方向向右移动2个单位,得到一个新的曲线b,下列说法不正确的是(A)曲线b仍然是正态曲线(B)曲线a和曲线b的最高点的纵坐标相等(C) 以曲线a为概率密度曲线的总体的方差比以曲线b为概率密度曲线的总体的方差大2(D) 以曲线a为概率密度曲线的总体的期望比以曲线b为概率密度曲线的总体的期望小218.在正态总体N (0,-)中,数值落在(-3-1) U(1,+ %)里的概率为9(A) 0.097(B) 0 .046(C)0.03(D)0.0039设随机变量Z7N(2,4),则D()等于2(A)1(B)2(C)0.5(D)410. 设随机变量ZNg/)H p( z毛)=P( Z),则C等于()(A)0(B) P(C)- P(D) c11. 正态总体的概率密度函数为f(X)二 18乂辽、7二,则总体的平均数和标准差分别是(A)0 和 8(B)0 和 4(C)0 和 2(D)0 和.212. 填空题(1) 若随机变量ZN(1,0.25),则2 Z的概率密度函数.(2) 期望为2,方差为2二的正态分布的密度函数是.已知正态总体落在区间(0.2,+g)的概率是0.5,则相应的正态曲线f(x)在x=时,达到最 周点.已知 z J(0,1),P( Z!.96)=(1.96)=0.9750,则(-1.96)=.(5) 某种零件的尺寸服从正态分布N(0,4),则不属于区间(-4,4)这个尺寸范围的零件约占总数的.(6) 某次抽样调查结果表明,考生的成绩(百分制)近似服从正态分布,平均成绩为72分,96分以上的考生占考生总数的2.3%,则考生成绩在60至84分之间的概率 为.(1)=0.8413、(2)=0.977、(3)=0.9987,(2)对称轴为参考答案:1(1)0,1(2)1,2 (3)-1,0.5;2.(1)x=-1 x=-1.3.(1)0.3413(2)0.1574(3)0.81854. (1)F(3)=0.8413(2) P(尖 1.84 oX0, -XVxvx)其中n是圆周率;e是自然对数的底;x是随机变量的取值;为正态分布的均值;c是正态分布的标准差.正态分布一般记为N (d;2) +2正态分布N (;2)是由均值口和标准差c唯一决定的分-2 T0 1; rn虾1一 】A或41 2 3 4 J例1、下面给出三个正态总体的函数表示式,请找出其均值口和标准差c.1(1) f (x)二 1(-XVX V+X w2兀1w(2)f(x) 22 二 e 8, (-x xV +X解:(1)0,1(2)1,23 .正态曲线的性质:正态分布由参数y、c唯一确定,如果随机变量 N (P ,c,根据定 义有:尸E , c=D o正态曲线具有以下性质:(1) 曲线在x轴的上方,与x轴不相交。(2) 曲线关于直线x = 对称。(3) 曲线在x = P时位于最高点。(4) 当x叩时曲线上升;当x叩时曲线下降。并且当曲线向左、右两边无限延伸 时,以x轴为渐近线,向它无限靠近。(5) 当P一定时,曲线的形状由c确定。c越大,曲线越“矮胖”表示总体越分散;c越小,曲线越“瘦高”,表示总体的分布越集中。五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教_QO X c=l时,正态总体称为标准正态总体,其相应的函数表示式是If(x)21 2兀其相应的曲线称为标准正态曲线标准正态总体N (0, 1 )在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题5. 标准正态总体的概率问题:标准正态分布曲线5 f(x)x对于标准正态总体N (0, 1),(X。)是总体取值小于X。的概率,即(X)= P(X :X。),其中Xo0,图中阴影部分的面积表示为概率P (X: :X) +只要有标准正态分布表即可查表解决从图中不难发现:当x0 :0 时:(x0)=1 _G (_x0);而当 x0=0 时(0) =0.5 +例2 设 X N(;且总体密度曲线的函数表达式为:x R。f(x) 1x2 _2x=e 42.7:(1)求yc;(2)分析:根据表示正态曲线函数的结构特征对照已知函数求出和c。禾I用一般正态总体N (; )与标准正态总体N (0, 1)概率间的关系将一般正态总体划归为标准正态总体来 2解决。1x工 X(X)2解:(1)由于 f (x)1 e一一2上常2兀 2根据一般正态分布的函数表达形式可知P=1,卞=J2,故X N (1 , 2)。(2) P (| x_1| : : .2) = P (1 _ .2 : : x : : 1、. 2)耳垄1)2 2-门(1)-门(-1) =2:(1) -1 =2 0.8413-1二 0.6826。点评:在解决数学问题的过程中将未知的不熟悉的问题转化为已知的、熟悉的、已 二 F (1、2) F (V 2 ) 2 一 1解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分 布与标准正态分布间的内在关联。9. 相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为 相关关系+相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系+不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量 与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变i =4量的关系.10. 回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归 分析+通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性+对于线性回归分析,我们要注意以下几个方面:(1) 回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关 系是回归分析的前提。(2) 散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可 先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。(3) 求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。11. 散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律+12. 回归直线A设所求的直线方程为y=bx - a,,其中a、b是待定系数.瓦(人一 X)(y. y)Z Ny. nXynxjX.,yy.区-X)2v X.-r2Xni 4ni 言寸.4i A a = y-bX相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析13. 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,nn(Xi-X)(yi-y) xy nxy2 1itnn、(X.-x)2 (yi -y)2.i盘i妊叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.14. 相关系数的性质:r 1,且| r越接近1,相关程度越大;且r越接近0,相关程度越小.一般的,当r工0.75时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义例3假设关于某设备的使用年限x和所支出的维修费用y (万元),有如下的统计资料: nn(*2 - nx2)C y -ny2)X23456y2.23.85.56.57.0若由资料可知y对x呈线性相关关系。试求:(1) 线性回归方程;(2) 估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了 y与x间呈线性相关关系,目的是训练公式的使用解: (1)列表如下:i12345X iV22.233.845.556.567.04.411.422.032.542.0Xi4916253655-2x = 4, y = 5,Z X =90, L Xy = 112.37id5干曰 Z Xjyj-5xy 112.3-5 4 5于是 b 一 W= 1.23 2 X -5x90 - 5 422 _2 ji =1a 二 ybx = 5 T .23 4 二 0.08。线性回归方程为:y = bx a = 1.23x - 0.08。(2)当 x=10 时,y-1.23 10 0.08=12.38 (万元)即估计使用10年时维修费用是12.38万元。点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身 两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没 有意义的,而且其估计与预测也是不可信的
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!