统计量和抽样分布课件

上传人:3626209****147198... 文档编号:243139131 上传时间:2024-09-16 格式:PPT 页数:40 大小:1.53MB
返回 下载 相关 举报
统计量和抽样分布课件_第1页
第1页 / 共40页
统计量和抽样分布课件_第2页
第2页 / 共40页
统计量和抽样分布课件_第3页
第3页 / 共40页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第九章 统计量和抽样分布,第一节 统计量,第二节 常用统计量,第三节 抽样分布,9.1,统计量,完全由样本确定的量,(,可能是向量,),称为,统计量,数学观点,:统计量是样本的函数,(,可能是向量值函数,),定义:,设,(,X,1, ,X,n,),为总体,X,的一个样本,f,(,X,1, ,X,n,),为不,含任何未知参数的连续函数,则称,f,(,X,1, ,X,n,),为样,本,(,X,1, ,X,n,),的一个统计量,.,统计量是随机变量,(,或随机向量,),,统计量是确定的数或向量,其数值称为统计量观察值,.,例: 设,(,X,1,X,2,X,3,),是从正态总体 中抽取的,样本,其中 已知,未知,.,前提:,1.,样本均值,Sample Mean,一组数据,X,1,X,2, ,X,n,是总体,X,的一个样本,9.2,常用统计量,2.,样本标准差或均方差,注意:它们的观测值用相应的小写字母表示,反映总体,X,取值的平均,反映总体,X,取值的离散程度,2.,样本方差,Sample Variance,3.,样本的,K,阶原点矩,4.,样本的,K,阶中心矩,它包括两个方面:,数据的简单处理,研究随机现象,首要的工作是收集原始数据,.,一般通过抽样调查或试验得到的数据往往是,杂乱无章的,需要通过整理后才能显示出它,们的分布状况。,数据的简单处理,:,以一种直观明了方式加工数据,(1),数据整理,(2),计算样本特征数,计算样本特征数:,数据简单处理的具体操作步骤,数据整理:,(1),反映趋势的特征数,(,a,),样本均值,(,b,),中位数:数据按大小顺序排列后,位,置居中的那个数或居中的两,个数的平均数,.,(,c,),众数:样本中出现最多的那个数。,(1),将数据分组,(2),计算各组频数,作频率分布表,作频率直方图,(2),反映分散程度的特征数:极差、四分位差,(,a,),极差:样本数据中最大值与最小值之差,记为,(,b,),四分位数:将样本数据依概率分为四等,份的,3,个数椐,依次称为第一、,第二、第三四分位数。,第一四分位数,Q,1,:,第二四分位数,Q,2,:,第三四分位数,Q,3,:,即,例:为对某小麦杂交组合,F,2,代的株高,X,进行研究,抽取,容量为,100,的样本,测试的原始数据记录如下,(,单位:,厘米,),,试根据以上数据,画出它的频率直方图,,求随机变量,X,的分布状况。,87 88111 91 73 70 92 98105 94,99 91 98110 98 97 90 83 92 88,86 94102 99 89104 94,94,92 96,87 94 92 86102 88 75 90,90,80,84 91 82 94 99102 91 96 94,94,85 88 80 83 81 69 95 80 97 92,96109 91 80,80,94102 80 86 91,90 83 84 91 87 95 76 90 91 77,103 89 88 85 95 92104 92 95 83,86 81 86 91 89 83 96 86 75 92,第一整理原始数据,加工为分组资料,作频率分表,,画直方图,提取样本分布特征的信息,.,1.,找出数据中最小值,m,=69,,,最大值,M,=111,,,极差为:,M,m,=42,,即,R,=42.,2.,数据分组,根据样本容量,n,的大小,决定分组数,k,。,一般规律:,30,n,40 5,k,6,40,n,60 6,k,8,60,n,100 8,k,10,100,n,500 10,k,20,具体步骤如下:,数据分组数参考表,数据数,4060,100,150,200,400,600,分组数,68,79,1015,16,20,24,数据数,800,1000,1500,2000,5000,10000,分组数,27,30,35,39,56,74,(2),一般采取等距分组,(,也可以不等距分组,),,,组距等于极差除以组数略大的测量单位,的整数倍。,(1),本例取,k,= 9,(3),本例测量单位为,1,厘米,组距为,3.,确定组限和组中点值,注意:组的上限与下限应比数据多一位小数。,当取,a,=67.5,,,b,=112.49,(,a,略小于,m,,,b,略大于,M,,,且,a,和,b,都比数据多一位小数),分组如下:,一般根据算式:,各组中点值 组距,=,组的上限或下限,67.5,72.5) 72.5,77.5) 77.5,82.5),82.5,87.5) 87.5,92.5) 92.5,97.5),97.5,102.5) 102.5,107.5) 107.5,112.5),组中点值分别为:,70 75 80 85 90 95 100 105 110,4.,将数据分组,计算出各组频数,作频数、频率分布表,组序,区间范围,频数,f,j,频率,W,j,=,f,j,/,n,累计频率,F,j,1,67.5,,,72.5),2,0.02,0.02,2,72.5,,,77.5,),5,0.05,0.07,3,77.5,,,82.5,),10,0.10,0.17,4,82.5,,,87.5,),18,0.18,0.35,5,87.5,,,92.5,),30,0.3,0.65,6,92.5,,,97.5,),18,0.18,0.83,7,97.5,,,102.5,),10,0.1,0.93,8,102.5,,,107.5,),4,0.04,0.97,9,107.5,,,112.5,),3,0.03,1.00,作频率直方图,5.,作出频率直方图,以样本值为,横坐标,,频率,/,组距为,纵坐标,;,以分组区间为底,以 为高,从频率直方图可看到:,靠近两个极端的数据出现比较少,而中间附近的,数据比较多,即中间大两头小的分布趋势,.,随机变量分布状况的最粗略的信息,在频率直方图中,每个矩形面积恰好等于样本值,落在该矩形对应的分组区间内的频率,即,频率直方图中的小矩形的面积近似地反映了样本,数据落在某个区间内的可能性大小,故它可近似,描述,X,的分布状况。,样本方差 样本标准差,Q,1,Q,3,极差 四分位差,68.6909 8.288 85.25 95 42 4.875,第二计算样本特征数,1.,反映集中趋势的特征数:,样本均值、中位数、众数,等,样本均值,MEAN,中位数,MEDIAN,众数,2.,反映分散程度的特征数:,样本方差、样本标准差、,极差、四分位差,等,注,:上述差异特征统计量的值越小,表示离散程度越小,.,下课了!,今天就到这里吧!,统计量 是样本 的,不含任何未知数,的函数,它是随机变量,.,统计量的分布称为,抽样分布,定理,9.3,抽样分布,一、有限总体的抽样分布,设总体中个体总数为,N,,样本容量为,n,(,N,),且总体有有限均值,,方差,2,,则:,(1),(2),当抽样是有放回时,,当抽样是无放回时,,正态总体样本均值的分布,设总体 , 是,X,的,一个样本,则样本均值服从正态分布,1. U-,分布,二、数理统计的四大重要分布,概率分布的分位数,(,分位点,),P,X,x, =,定义,对总体,X,和给定的,(0,1),,若存在,x,,使:,则称,x,为,X,分布的,上侧,分位数,或,上侧临界值,.,P,X,x, =,概率密度函数,阴影部分的面积为,X,分布的,上侧,分位数,概率分布的分位数,(,分位点,),定义,若存在数,1,、,2,,使:,P,X,1,=,P,X,2,则称,1,、,2,为,X,分布的,双侧,分位数,或,双侧临界值,概率密度函数,X,分布的,双侧,分位数,双侧,分位数或双侧临界值,的特例,当,X,的分布,关于,y,轴对称,时,,则称 为,X,分布的,双侧,分位数,或,双侧临界值,若存在 使,概率密度函数,U,分布的上侧分位数,对标准正态分布变量,U,N,(0, 1),和给定的,,,上侧,分位数,是由:,P,U,u, =,即,P,U,u, =1-,(,u,) =1-,确定的点,u,已知:,=,0.05,u,0.05,=1.645,确定的点,u,P,U,u, = 0.05,=,0.05,U,分布的双侧分位数,的点,u,/2,为标准正态分布的,双侧,分位数,或,双侧临界值,u,/2,可由,P,U,u,/2,=,/2,针对变量,U,N,(0, 1),和给定,的,称满足条件:,P,|,U,|,u,/2, =,即,(,u,/2,) =1-,/2,反查标准正态分布表得到,(,x,),O,u,/2,/2,-u,/2,/2,x,例如,:,求,u,0.05/2,P,U,u,0.05/2,=,0.05 /2,u,0.05/2,=1.96,标准正态分布的分位数,在实际问题中,,常取,0.1,、,0.05,、,0.01,.,常用到下面几个临界值,:,u,0.05,=,1.645,,,u,0.01,=,2.326,u,0.05,/,2,=,1.96,,,u,0.01,/,2,=,2.575,2.,分布,设,X,1,X,2, ,X,n,为独立标准正态变量, 称,随机变量,U,=,X,1,2,+,X,2,2,+ +,X,n,2,的分布为,自由度,n,的 分布,记作,注意:,(1),分布的自由度是指独立随机变量的个数,(2),分布的密度函数为,:,(3),分布的期望和方差为,:,E,(,U,) =,n,D,(,U,) = 2,n,n,=1,n,=4,n,=10,图形随自由度,n,的不同而有所改变,2,分布表,分布的概率密度函数,f,(,y,),的图形,满足 的数,称为,2,分布的,上,分位数,或,上侧临界值,f,(,y,),是,2,分布的概率密度,f,(,y,),x,O,在自由度,n,取定以后, 的值只与,有关,.,例,:,n,= 21, =,0.05,时,,32.67,即,2,分布的上,分位数,查表:,2,分布的双侧,分位数,f,(,x,),x,O,为,2,分布的上 分位数,为,2,分布的上 分位数,例:若,n,=8,=0.05,2.18,17.53,满足 的数,和 称为,2,分布的,双侧,分位数,或,双侧临界值,1.,2,分布的数学期望与方差:,设,2,2,(,n,),,则,E,(,2,) =,n,,,D,(,2,) = 2,n.,2.,2,分布的可加性:,设,且 相互,独立,则:,2,分布的性质,设,(,X,1,X,2, ,X,n,),为取自正态总体,X,N,(,2,),的样本,则,:,设,(,X,1,X,2, ,X,n,),为来自正态总体,X,N,(,2,),的样本,则,(1),样本均值 与样本方差,S,2,相互独立;,(2),下课了!,今天就到这里吧!,3.,t,分布,(1),t,分布的概率密度函数为,设随机变量,X,N,(,0,,,1,),,,Y,2,(,n,),,且,X,与,Y,相互独立,则称统计量 服从自由度,为,n,的,t,分布或学生分布,记作,T,t,(,n,).,(2),当,n,较大时,,t,分布近似于标准正态分布,.,注意:,1.,t,分布的数学期望与方差:,设,T,t,(,n,),,则,E,(,T,)=,0,,,D,(,T,)=,t,分布的性质,2.,设,(,X,1,X,2, ,X,n,),为来自正态总体,X,N,(,2,),的样本,则统计量,3.,设,(,X,1,,,X,2,,,,,X,n,1,),和,(,Y,1,,,Y,2,,,,,Y,n,2,),分别是来自正态总体,N,(,1,2,),和,N,(,2,2,),的,样本,且它们相互独立,则统计量,其中,、,分别为两总体的样本方差,.,t,分布的上,分位数,对于给定的,(0,1,),,称满足条件,的数,t,(,n,),为,t,分布的,上,分位数,或,上侧临界值,t,分布的,上侧,分位数,t,分布的双侧,分位数,由于,t,分布的对称性,称满足条件,的数,t,/2,(,n,),为,t,分布的,双侧,分位数,或,双侧临界值,4.,F,分布,设随机变量,X,2,(,n,1,),、,Y,2,(,n,2,),,且,X,与,Y,相互独立,则称随机变量 服从,第一自由度为,n,1,,第二自由度为,n,2,的,F,分布,,记作,F,F,(,n,1,,,n,2,),.,F,分布的概率密度函数为:,其中,注意:,F,分布的上,分位数,对于给定的,(0,1,),,称满足条件,的数,F,(,n,1,n,2,),为,F,分布的,上,分位数,或,上侧临界值,F,分布的,上侧,分位数,F,分布的双侧,分位数,称满足条件,为,F,分布的,双侧,分位数,的,F,分布的上 分位数,F,分布的上 分位数,F,分布的性质,(2),设 为正态总体 的样本,容量和样本方差; 为正态总体,的样本容量和样本方差;且,两个样本相互独立,则统计量,(1),若,X,F,(,n,1,n,2,),,则,F,(,n,2,n,1,),
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!