资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,温医大公卫学院预防医学系,/,附属眼视光医院临床研究中心,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 参数估计基础,第五章 参数估计基础,目的与要求,掌握:,均数标准误的意义和计算;,总体均数的区间估计;,熟悉:,抽样误差的概念;,t,分布的概念和特征;,了解:,抽样分布,目的与要求掌握:,教学内容,详细讲解:,均数的抽样误差与标准误;,t,分布的概念、图形和特征;,总体均数的估计;,重点讲解:,标准误的意义和计算;,总体均数可信区间的概念和计算;,一般介绍:,可信区间与参考值范围的区别;,教学内容详细讲解:,知识回顾,研究设计,非正态:,M(Q,L,Q,U,),非参数检验,资料收集,统计分析,研究报告,统计推断,统计描述,定量资料,分类资料,正态:,XS,率、构成比,假设检验,参数估计,参数检验,点值估计,区间估计,知识回顾研究设计非正态:M(QLQU)非参数检验资料收集统,第一节均数的抽样误差与标准误,抽样研究的目的,是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数,常用的统计推断方法,参数估计(总体均数和总体,概,率的估计),假设检验,第一节均数的抽样误差与标准误 抽样研究的目的,概率与概率分布,概率,(Probability),随机事件发生的可能性,,是对某一随机事件发生可能性的度量。取值范围在,0,1,之间。,如果某一事件不可能发生,其概率为,0,,称为,不可能事件,;如果某一事件肯定发生,其概率为,1,,称为,肯定事件,。,概率的基本性质,1P(A)0,;,P()=1,;若,AB=,,则,P(AB)=P(A)+P(B),。,推论,1,:不可能事件的概率为,0,,即:,P()=0,。,推论,2,:,P()=1-P(A),表示,A,的对立事件,即它们二者必有一事件发生但又不能同时发生。,概率与概率分布概率(Probability),概率与概率分布,概率的计算方法,古典概率法、,某事件,n,种结果中出现每种结果的概率为,1/n,适用于,各种可能结果的概率相同,试验概率法,(常用且较精确),须借助于大量试验,适用于某事件的可能结果及各种结果的概率均未知,主观概率法,(常用但不精确),凭借人的主观分析或判断得到事件出现某种结果的概率,概率与概率分布概率的计算方法,概率与概率分布,概率分布,(Probability Distribution),某随机变量,所有不同取值发生可能性,的分布现象,中奖数量,x,(张),中奖概率,P(X=x),累积概率,P(X1),0,0.1681,0.1681,1,0.3651,0.5282,2,0.3087,0.8369,3,0.1323,0.9692,4,0.0284,0.9976,5,0.0024,1.0000,表,5.1,5,张彩票中中奖数量的概率分布表,概率与概率分布概率分布(Probability Distri,正态分布,用于描述连续型变量最重要的概率分布;,统计学的理论基础,正态分布用于描述连续型变量最重要的概率分布;,正态分布的特征,=M,e,=M,0,;,偏度系数,=0;,峰度系数,=3,正态分布的特征=Me=M0;偏度系数=0;峰度系数=3,正态分布,当正态分布的参数,=0,,,=1,时,称为标准正态分布,正态分布当正态分布的参数=0,=1时,称为标准正态分布,样本均数的抽样分布与抽样误差,样本均数的抽样分布与抽样误差,ID,均数,标准差,95%CL,ID,均数,标准差,95%CL,1,167.41,2.74,165.45,169.37,51,168.47,3.91,165.67,171.27,2,165.56,6.57,160.86,170.26,52,165.95,3.76,163.26,168.64,3,168.20,5.36,164.37,172.03,53,168.87,5.77,164.74,173.00,4,166.67,4.81,163.24,170.11,54,169.53,2.07,168.05,171.00,5,164.89,5.41,161.02,168.76,55,166.10,5.58,162.11,170.10,6,166.36,4.50,163.14,169.58,56,167.20,4.56,163.94,170.47,7,166.16,4.04,163.27,169.05,57,170.50,7.66,165.02,175.98,8,169.11,5.71,165.02,173.19,58,166.44,4.93,162.91,169.97,9,167.17,8.26,161.27,173.08,59,168.68,4.52,165.45,171.91,10,166.13,5.24,162.38,169.87,60,168.40,6.95,163.43,173.37,50,170.39,4.15,167.42,173.35,100,165.69,5.09,162.06,169.33,表,3-1,N,(167.7,5.3,2,),总体中,100,个随机样本的均数、标准差和,95%CI,如果将这,100,个样本均数看成一个新的变量,则亦构成一个新的分布。,ID均数标准差95%CLID均数标准差95%CL1167.4,100,个身高样本均数的频数分布表,分组,频数,频率,(%),163,1,1.00,164,3,3.00,165,13,13.00,166,19,19.00,167,23,23.00,168,19,19.00,169,14,14.00,170,4,4.00,171,3,3.00,172,173,1,1.00,合计,100,100.00,100个身高样本均数的频数分布表 分组频数频率(%)163,医学统计学-第五讲-参数估计基础-公开课ppt课件,抽样分布与抽样误差,样本均数的抽样分布具有以下特点:,各样本均数未必等于总体均数,;,样本均数之间存在差异;,(,如何产生的?,),样本均数的分布很有规律,围绕着总体均数(,167.7cm,),中间多、两边少,左右基本对称,也服从正态分布。,样本均数的变异较之原变量的变异大大缩小,抽样分布与抽样误差样本均数的抽样分布具有以下特点:,抽样分布与抽样误差,样本均数间差异的产生原因:,抽样所致,抽样误差,抽样误差:,抽样造成的这种,样本均数与样本均数之间、样本均数与总体均数之间的差异,。,标准误:,用于表示均数抽样误差大小的指标,也叫,样本均数的标准差,,它反映了,样本,均数之间的离散程度。,抽样分布与抽样误差 样本均数间差异的产生原因:,抽样分布与抽样误差,标准误的计算公式:,标准误的大小与标准差成正比,则与样本含量,n,的平方根成反比。,在同一总体中随机抽样,样本含量,n,越大,抽样误差越小。所以在实际应用中,可通过增加样本含量,n,来减小样本均数的标准误,从而降低抽样误差。,抽样分布与抽样误差标准误的计算公式:,抽样误差,与样本量的关系,:,S,一定,,n,,标准误,用途,衡量样本均数的可靠性,:均数标准误越少说明样本均数与总体均数的差异程度越小,因此用样本均数估计总体均数越可靠,反之亦然。,结合样本均数和正态分布曲线下的面积分布规律可以用以,估计总体均数的置信区间,。,用于均数的,假设检验,抽样误差与样本量的关系:,标准误与标准差的异同点,共同点,均数标准误与,S,相似,都是说明离散程度的指标,不同点,标准差描述个体间的变异程度,,凡同性质资料,S,大表示个体变异大,,S,小表示个体变异小,标准误,是样本均数的标准差,,描述样本均数的抽样误差,,即样本均数与总体均数接近程度,凡同质资料,,标准误大,说明用样本均数代表总体均数可靠性小,,,标准误小,则说明用样本均数代表总体均数可靠性大,。,标准误与标准差的异同点共同点,非正态总体样本均数的抽样实验,非正态总体样本均数的抽样实验,上图是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为,2,,,10,,,30,和,50,的样本各,1000,次,计算样本均数并绘制,4,个直方图,上图是一个正偏峰的分布,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,不同样本含量相同抽样次数样本均数分布图,相同样本含量不同抽样次数均数的分布,相同样本含量不同抽样次数均数的分布,抽样分布与抽样误差,上述图形显示,相同抽样次数的情况下,样本量,n,较小时,样本均数的分布并非正态分布,样本量足够大(,N50,)时,样本均数的分布趋近于正态分布。,相同样本量的情况下,抽样次数较少时,样本均数的分布并非正态分布,当抽样次数足够多(,N50,)时,样本均数的分布也同样趋近于正态分布。,抽样分布与抽样误差上述图形显示,抽样分布与抽样误差,例,2000,年某研究者随机调查某地健康成年男子,27,人,得到血红蛋白量的均数为,125 g/L,,标准差为,15 g/L,。试估计该样本均数的抽样误差。,=2.89g/L,抽样分布与抽样误差例2000年某研究者随机调查某地健康成年,第二节,t,分布,t,分布的概念,从正态分布,N,(,2,)抽得样本的均数也服从正态分布,记为,N,(,2,)。对正态变量作变换,实际工作中,当 未知时,常用 来代替,此时对正态变量采用的不是,z,变换,而
展开阅读全文