资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,李毓秋,心理与教育统计学,E-mail,:,第九讲,参数估计方法与,假设检验的基本原理,一 总体参数估计的基本原理,根据样本统计量对相应总体参数所作的估计叫作总体参数估计。,总体参数估计分为点估计和区间估计。,由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。,1.,良好的点估计量应具备的条件,无偏性,如果一切可能个样本统计量的值与总体参数值偏差的平均值为,0,,这种统计量就是总体参数的无偏估计量。,有效性,当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。,良好的点估计量应具备的条件,一致性,当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。,充分性,一个容量为,n,的样本统计量,应能充分地反映全部,n,个数据所反映的总体的信息。,2.,区间估计,以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的,区间估计,。,对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的,置信区间,的上下限。,要知道与所要估计的参数相对应的样本,统计量,的值,以及样本统计量的理论分布;,要求出该种统计量的,标准误,;,要确定在多大的,可靠度,上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的,临界值,,才能计算出总体参数的,置信区间,的上下限。,置信区间,置信度,即,置信概率,,,是作出某种推断时正确的可能性(概率)。,置信区间,,,也称置信间距(,confidence interval,CI,)是指在某一置信度时,总体参数所在的区域距离或区域长度。,置信区间是带有置信概率的取值区间。,显著性水平,对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平,(,significance level,),就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号,表示。,P,-,.,平均数区间估计的基本原理,通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体,(,或非正态总体中的,n,30,的样本,),,而计算出来的实际平均数是无数容量为,n,的样本平均数中的一个。,根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。,二总体平均数的区间估计,1,总体平均数区间估计的基本步骤,根据样本的数据,计算样本的平均数和标准差;,计算平均数抽样分布的标准误;,确定置信概率或显著性水平;,根据样本平均数的抽样分布确定查何种统计表;,计算置信区间;,解释总体平均数的置信区间。,2,平均数区间估计的计算,总体正态,,已知(不管样本容量大小),,或总体非正态,,已知,大样本,平均数离差的的抽样分布呈正态,平均数的置信区间为:,(,9,1,),例题,1,:某小学,10,岁全体女童身高历年来标准差为,6.25,厘米,现从该校随机抽,27,名,10,岁女童,测得平均身高为,134.2,厘米,试估计该校,10,岁全体女童平均身高的,95,和,99,置信区间。,解:,10,岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标准差为,=6.25,。无论样本容量大小,一切样本平均数的标准分数呈正态分布。于是可用正态分布来估计该校,10,岁女童身高总体平均数,95,和,99,的置信区间。,其标准误为,当,0.95,时,,1.96,因此,该校,10,岁女童平均身高,95,的置信区间为:,当,0.99,时,,2.58,因此,该校,10,岁女童平均身高,99,的置信区间为:,总体正态,,未知(不管样本容量大小),或总体非正态,,未知,大样本,平均数离差的抽样分布为,t,分布,平均数的置信区间为:,(,9,2,),例题,2,:从某小学三年级随机抽取,12,名学生,其阅读能力得分为,28,,,32,,,36,,,22,,,34,,,30,,,33,,,25,,,31,,,33,,,29,,,26,。试估计该校三年级学生阅读能力总体平均数,95,和,99,的置信区间。,解:,12,名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标准差,未知,样本的容量较小(,=1230,),,t,分布接近于正态分布,因此可用正态分布近似处理。,其标准误为,当,0.95,时,,1.96,因此,该年全部考生作文成绩,95,的置信区间为:,当,0.99,时,,2.58,因此,该年全部考生作文成绩,99,的置信区间为:,总体非正态,小样本,不能进行,参数估计,即不能根据样本分布对总体平均数进行估计,。,三、假设检验的基本原理,利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。,1,假设,假设检验一般有两互相对立的假设。,H,0,:零假设,或称原假设、虚无假设(,null hypothesis,)、解消假设;是要检验的对象之间没有差异的假设。,H,1,:备择假设(,alternative hypothesis,),或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。,进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。,2,小概率事件,样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把,出现概率很小的随机事件,称为小概率事件。,当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。,3,显著性水平,统计学中把拒绝零假设的概率称为显著性水平,用,表示。,显著性水平也是进行统计推断时,可能犯错误的概率。,常用的显著性水平有两个:,0.05,和,0.01,。,在抽样分布曲线上,显著性水平既可以放在曲线的,一端,(,单侧检验,),也可以分在曲线的,两端,(,双侧检验,)。,图,9,1,正态抽样分布上,0.05,的三种不同位置,4,假设检验中的两类错误及其控制,对于总体参数的假设检验,有可能犯两种类型的错误,即,错误和,错误。,表,9,1,假设检验中的两类错误,H,0,为真,H,0,为假,拒绝,H,0,错误,正确,接受,H,0,正确,错误,为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对,错误进行控制,如,0.05,或,0.01,。,对,错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使,误差得到控制。,在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,,被分散在概率分布曲线的两端,因此称为双侧检验。,双侧检验的假设形式为:,H,0,:,0,,,H,1,:,0,凡是检验大于或小于某一特定条件的假设检验,,是在概率分布曲线的一端,因此称为单侧检验。,单侧检验的假设形式为:,H,0,:,0,,,H,1,:,0,或者,H,0,:,0,,,H,1,:,0,5,假设检验的基本步骤,一个完整的假设检验过程,一般经过四个主要步骤:,提出假设,选择检验统计量并计算统计量的值,确定显著性水平,做出统计结论,练习与思考,书,222,页第,1,、,3,、,5,、,6,、,7,、,8,题。,怎样由样本平均数对总体平均数进行区间估计?,假设检验是怎样解决问题的?,下次学习内容:,平均数的显著性检验,(第八章 第二节),2005,年,10,月,再见!,
展开阅读全文