频率直方图PPT课件

上传人:牛*** 文档编号:94359341 上传时间:2022-05-22 格式:PPTX 页数:31 大小:342.55KB
返回 下载 相关 举报
频率直方图PPT课件_第1页
第1页 / 共31页
频率直方图PPT课件_第2页
第2页 / 共31页
频率直方图PPT课件_第3页
第3页 / 共31页
点击查看更多>>
资源描述
大家知道,随机现象的统计规律性必然在大量的重复试验中呈现出来, 为了推断总体X 的性质,从理论上讲,应该对每个个体逐一进行测试,然而实际上这样做往往是不现实的,例如,要研究灯泡寿命,由于寿命测试是破坏性的,当测试过每只灯炮的寿命后,这批灯泡就报废了 一般来说,恰当的方法是按一定的规则从总体中抽取若干个个体进行测试,为了使测试到的数据能很好地反映总体的情况,当然应该要求总体中每一个个体被抽到的可能性是均等的并且在抽取一个个体后总体的成分不改变这种抽取个体的方法称为简单随机抽样被抽出的部分个体,叫做总体的一个样本 假设我们从总体 X 中抽取 n 个个体进行测试(简单抽样),把测试结果分别记作X1,X2,, Xn由于抽样的随机性,Xi 可以取 X 所有可能的值,是与 X 具有相同分布的随机变量,且 X1,X2,Xn 相互独立这样的 n 个个体称为总体 X 的一个简单随机样本第1页/共31页 定义 设 X 是具有某一概率分布的随机变量(看作一个总体)如果随机变量X1,X2,, Xn 相互独立,且都与 X 具有相同的概率分布, 则称 n 维随机变量 (X1,X2,Xn) 为来自总体 X 的简单随机样本,简称样本,n 称为样本容量 在对总体X进行一次具体的抽样并作观测之后,得到样本(X1,X2,Xn)的确切的数值(x1,x2,xn),称为一个样本观测值(观察值),简称样本值 样本(X1,X2,Xn)所有可能取值的全体称为样本空间,它是n维空间或其中的一个子集样本观察值(x1,x2,xn)是样本空间中的一个点 如果总体 X 的分布函数为F(x),则 X 的样本 X1,X2,Xn 的联合分布函数为 . 如果总体 X 为连续型且概率密度为 f(x),则样本(X1,X2,Xn)的联合概率密度为 niixF1)(niixf1)(第2页/共31页第二节 统计量及其分布 一、统计量 样本是总体的代表,是统计推断的依据在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的函数,来进行统计推断 定义1 设(X1,X2,Xn)是来自总体 X 的一个样本,t = g(t1, t2, tn) 为t1, t2, , tn的一个单值实函数,并且其中不包含任何未知参数,则称 T = g(X1, X2, , Xn)为一个统计量 设 x1, x2, xn 是相应于样本 X1, X2, ,Xn 的样本值,则称 g(x1,x2,, xn)是统计量T = g(X1,X2,Xn)的观察值二、样本矩 下面给出几个常用的统计量设(X1,X2,Xn)是来自总体 X 的一个样本,(x1,x2,xn)是样本观察值,定义: 样本均值 niiXnX11第3页/共31页 样本分差 . 样本标准差(均方差) niiniiXnXnXXnS12212211)(11niiXXnSS122)(11 样本k阶(原点)矩 (k=1,2, ) . 样本k阶中心矩 (k=1,2, ) .nikikXnA11nikikXXnB1)(1显然 , XA 1221SnnB 它们的观察值分别为 , ,niixnx11niiniixnxnxxns12212211)(11第4页/共31页niixxns12)(11nikikxna11nikikxxnb1)(1,. 三、顺序统计量 定义2 (X1,X2,Xn)是总体X的一个样本,(x1,x2,xn)是一个样本观察值,将它由小到大的顺序排列,得到x(1)x(2)x(n) ,取x(i)作为X(i)的观测值,由此得到的统计量X(1),X(2),X(n)称为样本(X1,X2,Xn)的一组顺序统计量,X(i)称为第i个顺序统计量或第i项统计量 Rn = x(n)x(1)分别称为样本中位数和样本极差 样本均值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上的大致位置;样本方差与样本极差描述了样本的分散程度mnXXmnXXmmm2,)(2112,) 1()() 1(当当第5页/共31页第三节 样本分布函数与频率直方图一、样本分布函数 样本能够反映总体X的信息,总体X的分布函数F(x)是否能由样本来“表示”?回答是肯定的,我们用下面介绍的样本函数来近似表示总体X的分布函数 定义 设x(1),x(2),x(n)是总体X的顺序统计量的一组观察值,对于任意的实数x,定义函数 ., 1; 1, 2, 1,;, 0)()()1()()1 (niinxxnixxxnixxxF 称Fn(x)为总体X的样本分布函数(或经验分布函数)第6页/共31页 样本分布函数Fn(x)不仅与样本容量 n 有关, 还与所得到的样本观察值有关,故它是随机变量Fn(x)的图形(图6-1)呈跳跃上升的台阶状, 在x(1),x(2),x(n)中的不重复的值处,跳跃高度为 ;在重复 l 次的值处,跳跃高度为 图6-1中的曲线是总体 X 的理论分布函数 F(x) 的图形nln1图6-1第7页/共31页 样本分布函数Fn(x)具有以下性质: 10Fn(x)1; 2Fn(x)是单调不减函数; 3Fn(x)是处处右连续的 对于样本观察值 (x1,x2,xn),为了求其对应的样本分布函数 Fn(x) 之值,只须将这 n 个值中小于或等 x 的个数除以样本容量 n 即可对于给定的x,Fn(x)是 n 次重复独立试验中事件 Xx 出现的频率,而理论分布函数F(x)是事件Xx发生的概率,由伯努利定理知,对任意给定的正数,有 ,即Fn(x)按概率收敛于F(x)进一步还有如下结论1| )()(|limxFxFPnn 定理 (格利文科(W. Glivenko)定理)定理) 设总体X的分布函数为F(x), 样本分布函数Fn(x),则对于任何实数x,有 证明从略 以上结论是我们用样本去推断总体的依据10| )()(|suplimxFxFPnxn第8页/共31页 二、频率直方图二、频率直方图 如果说样本分布函数是通过随机样本对总体分布函数的反映,那么下面介绍的频率直方图就是样本对总体概率密度函数的反映(假设总体是连续随机变量) 依据总体 X 的一个样本观察值(x1,x2,xn)画直方图的一般步骤如下: 1找出x1,x2,xn中的最小值x(1)与最大值x(n) 2选择常数a、b(ax(1),bx(n),在区间a,b内插入k1个分点;a=t0t1t2tk1100时,取 k 为1015通常取 ti 比样本观察值精度高一位 ,1kabtttii第9页/共31页 3对于每个小区间(ti-1,ti,数出x1,x2,xn落入其中的个数 ni (称为频数),再算出频率 ,i=1, 2, , k 4在 xOy 平面上, 对每个 i, 画出以(ti-1,ti 为底,以 yi=fi /t (i=1,2,k) 为高的矩形这种图称为频率直方图,简称直方图nnfii 直方图中第 i 个小矩形面积 yit=fi (i=1,2,k),k 个小矩形的面积之和为1 由于样本观察值的 n 个数值 x1,x2,xn是从总体X 中独立抽取的,它们落入区间 (ti-1,ti 的频率 fi 近似等于随机变量 X 在该区间内取值的概率,即fiPti-1Xti=pi,i=1,2,k,当 X 是连续随机变量,且概率密度为 f (x) 时,则有 ,i=1,2,k由此可见直方图在一定程度上反映了X 的概率密度情况ittipxxffii1d)(第10页/共31页 例1 某炼钢厂生产一种钢,由于各种偶然因素的影响,各炉钢的含硅量是有差异的,因而应该把含硅量X看成一个随机变量现在记录了120炉正常生产的这种钢的含硅量的数据(百分数):0.860.830.770.810.810.800.790.820.820.810.810.870.820.780.800.810.870.810.770.780.770.780.770.770.770.710.950.780.810.790.800.77 0.760.820.800.820.840.790.900.820.790.820.790.860.760.780.830.750.820.780.730.830.810.810.830.890.810.860.820.820.780.840.840.840.810.810.740.780.780.800.740.780.750.790.850.750.740.710.880.820.760.850.730.780.810.790.770.780.810.870.830.650.640.780.750.820.800.800.770.810.750.830.900.800.850.810.770.780.820.840.850.840.820.850.840.820.850.840.780.78试根据这些数据作出直方图,并根据直方图估计含硅量 X 的分布第11页/共31页 解 1从n=120个数据中找出最小值 x(1)= 0.64及最大值 x(120)= 0.95 2取 a = 0.635, b = 0.955, 分 k = 16 组,组距 3分组及频数如表 6-1所示表中的组中值 (i=1,2,16)将会在第八章第五节用到 4以横轴 x 轴表示含硅量,a= t0= 0.635,t1= 0.655,t15= 0.935, b= t16 = 0.955,t = 0.02,取纵坐标的单位长为 ,则直方图中第 i 个矩形的高度 , 正好是 ni (i=1,2,16)个单位02. 016635. 0955. 0t21iiittt4 . 211 tn4 . 21itiiintnntnntfy第12页/共31页 分组(ti-1,ti) 频 数 组中值 0.6350.655 2 0.645 0.6550.675 0 0.665 0.6750.695 0 0.685 0.6950.715 2 0.705 0.7150.735 2 0.725 0.7350.755 8 0.745 0.7550.775 13 0.765 0.7750.795 23 0.785 0.7950.815 24 0.805 0.8150.835 21 0.825 0.8350.855 14 0.845 0.8550.875 6 0.865 0.8750.895 2 0.885 0.8950.915 2 0.905 0.9150.935 0 0.925 0.9350.955 1 0.945 第13页/共31页1461 有了直方图,就可以大致画出 X 的概率密度曲线从图上看,曲线很象正态分布的概率密度曲线第14页/共31页第四节 几个常用统计量的分布 统计量是样本的函数,它是一个随机变量, 下面介绍来自正态总体的几个常用统计量的分布 一、一、 分布分布2 1定义 设X1,X2,Xn是来自正态总体N(0,1)的样本,则称统计量为服从自由度为 n 的 分布,记作 (n)222212nXXX2220f(x)n=1n=5n=15x 2 (n)分布的概率密度(不证):其中 为 函数 在 处的函数值0, 00,e221)(2122/xxxnxfnnn2n)0(de)(01sxxsxs2ns ) 1) 1 (, !) 1(,21),() 1(nnsss2第15页/共31页nXDDnXEEniinii2)()(,)()(122122 3(n)分布的性质: 性质1:设 (n),则E( )=n,D( )=2n 证:因XiN(0,1),E(Xi2)=1 ,D(Xi)=1 3d21)()(24442xexXEXExi2)()()(2242iiiXEXEXD2222 性质2:设 X (n1),Y (n2),且X与Y相互独立, 则 X+Y (n1+n2) 性质3:设 为X的样本,则 证: ,由定义 性质4:设 (n),则对任意实数x,有 niinX1222)()(1nXXXNX,),(212) 1 , 0( NXininiiinXX122122)()(1txnnPxtnde212lim22222222第16页/共31页 例如 取 ,则查附表4(395)有 25, 1 . 0n382.34)25(21 . 0 4 (n)分布的上 分位点: 设 (n),对于给定的正数 , 称满足条件 的点 为 (n) 分布的上 分位点 ) 10()(222d)()(nxxfnP)(2n22220f(x)x)(2n第17页/共31页 二、二、t t 分布(学生分布)分布(学生分布) 1定义 设XN (0,1),Y (n),且 X 与Y 独立,则称随机变量服从自由度为 n 的 t 分布,记作 t t (n)nYXt/2 2t (n)分布的概率密度(不证): xnxnnnxfn,1221)(212 3性质:t (n) 分布的概率密度关于 y 轴对称,且xxfxn,e21)(lim22第18页/共31页f(x)x0n=10n=4n=1)(1nt)(ntf(x)0 x 4t (n) 分布的上 分位点: 设 t t (n),对于给定正数 ,称满足条件 的点 为 t (n) 分布的上 分位点,且有 ) 10()(nttP)(ntuntntnt)(),()(1第19页/共31页 三、三、F F分布分布22 1定义:设X (m),Y (n),且 X 与 Y 独立,则称随机变量为服从自由度是 m、n 的 F分布,记作 FF (m, n),nYmXF/其中 m 称为第一自由度,n 称为第二自由度 2F(m,n)分布的概率密度为0, 00,1222)(2122xxxnmxnmnmnmxfnmmm第20页/共31页 3F(m, n) 分布的性质: 若FF(m, n),则 ),(1mnFFm=10,n=5m=10,n=25xf(x)xf(x),(nmF 4F (m, n) 分布的上 分位点: 设 FF(m, n),对于给定正数 ,称满足条件 的点 为F(m, n)分布的上 分位点,且有 )10(),(nmFFP),(1),(1mnFnmF),(nmF第21页/共31页第五节 正态总体统计量的分布 本节介绍来自正态总体的样本均值与样本方差的抽样分布这是参数估计与假设检验的基础 定理1 设 为来自总体 X 的样本,则 , nXXXNX,),(212niinNXnX12,1) 1, 0(/NnX 定理2 niinX1222)()(1 定理3 设X1,X2,Xn是正态总体 的一个样本,则样本均值 与样本方差 S 2 相互独立,且有 ),(2NX) 1() 1(222nSn第22页/共31页 定理4 设X1,X2,Xn是正态总体 的样本, 与S 2分别为样本均值与样本方差, 则有 ),(2NX) 1(/ntnSX 证 由 , 则有 ) 1() 1(),1, 0(/222nxSnNnX) 1(1) 1(/22ntnSnnX 定理5 设总体 ,总体 ,且 X 与 Y 独立X1,X2,与Y1,Y2,分别为来自总体 X 与总体 Y 的样本,且这两组样本相互独立 ,则有),(211NX),(222NYnjjmiimjjmiiYYnSXXmSYnYXmX1222122111)(11,)(11,1,1第23页/共31页(i) , .nmNYX222121,) 1, 0()()(222121NnmYXu (ii) 若 ,则 ,其中 22221)2(11)(21nmtnmSYXtw222212,2) 1() 1(wwwSSnmSnSmS),()()(1221212122nmFYXmnFnjjmii (iii) 第24页/共31页 (iv) ) 1, 1(22212122nmFSSF 证 (i) 略 (ii) 由定理 3 得 , , 于是 又由 (i) 及 t 分布定义,有即 ) 1() 1(2221mSm) 1() 1(2222nSn)2() 1() 1(2222221nmSnSm)2()2() 1() 1()(2222212221nmtnmSnSmnmYX)2(112) 1() 1()(222121nmtnmnmSnSmYX,.第25页/共31页 (iv) 由定理 3, ,则 即) 1() 1(),1() 1(2222222121nSnmSm) 1, 1() 1() 1() 1() 1(22222121nmFnSnmSm) 1, 1(22212122nmFSS,.第26页/共31页 解 . 由 , 即 ,得所求概率为) 1, 0 (/NnX3 . 6,52,36n) 1, 0(63 . 652NXu.8293. 018729. 09564. 01)14. 1 ()71. 1 ()14. 1()71. 1 (71. 114. 163 . 6528 .5363 . 65263 . 6528 .508 .538 .50uPXPXP 例1 从总体 N ( 52,6.32 ) 中随机抽取一容量为 36 的样本,求样本均值 落在 50.8 到 53.8 之间的概率X第27页/共31页 例2 设 X1,X2,X10 为总体 N (0,0.09)的一个样本,求 101244. 1iiXP 解 由 , ,则有) 1, 0(3 . 0),1, 0(3 . 0NXNXi101222)10(3 . 01iiX21012210123 . 044. 13 . 0144. 1iiiiXPXP10. 016)10(2P.(查 表394页))(2n第28页/共31页 例3 设总体 , 样本 X1, X2, ,X6,设 Y = ( X1+X2+X3 )2 + ( X4+X5+X6 )2,求C, 使CY 服从 分布,并求自由度 ), 0(2NX2由独立性有 , 取 ,有 ,自由度为2 解 由 , 有 , ), 0(2NXi)3, 0(2321NXXX)3, 0(2654NXXX) 1, 0(33211NXXXY) 1, 0(36542NXXXY)2(22221YY231C)2(22221YYCY,第29页/共31页第30页/共31页感谢您的观看!第31页/共31页
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!