资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,计 量 资 料 统 计 分 析,正态分布,t,分布,1,计 量 资 料 统 计 分 析1,正态分布,t,分布,计量资料的统计推断是以正态分布、标准正态分布、,t,分布为理论基础。,正态分布、标准正态分布、,t,分布的相互关系是参数估计和假设检验的理论基础。,本课件主要学习正态分布、标准正态分布、,t,分布的概念、分布特征、相互关系。,2,正态分布 t分布 计量资料的统计推断是以正态分布,正态分布,t,分布,一、正态分布,(一),正态分布的概念,(二),正态分布曲线下的面积分布规律,(三),正态分布曲线的两个参数,(四),标准正态分布,(五),标准正态分布曲线下的面积分布规律,二、,t,分布,(一),均数的抽样误差,(二),样本均数的正态分布,(中心极限定理),(三),样本均数的标准正态分布,(四),t,值、,t,分布,(五),t,分布特征,3,正态分布 t分布一、正态分布3,一、正态分布,4,一、正态分布4,(一)正态分布的概念,正态分布又称高斯分布,是一种很重要的连续型分布,应用甚广。在医学卫生领域中有许多变量的频数分布资料可绘制成直方图而且频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。,可以设想,如果将观察人数逐渐增多,组段不断分细,图中直条将逐渐变窄,其顶端的中点的连线将逐渐接近于一条光滑的曲线,这条曲线略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布曲线(图,1,),5,(一)正态分布的概念 正态分布又称高斯分布,是一种很重,6,6,正态分布的特征,正态分布曲线以均数为中心,左右对称。,正态分布曲线下的面积分布有一定的规律,正态分布曲线在横轴上方均数处最高。,正态分布曲线有两个参数:均数,为位置参数,标准差,为形状参数。,7,正态分布的特征正态分布曲线以均数为中心,左右对称。7,(,二,),正态分布曲线下的面积分布规律,数理统计证明:正态分布曲线下与横轴之间的整体面积为,1,或,100%,。,以,为总体均数,,为总体标准差,则正态分布曲线下面积的分布规律经积分法计算有如下规律(图,2,),+,1,范围内的面积占正态曲线下总面积的,68.27%,,即有,68.27%,的变量值分布在此范围内;,+,1.96,范围内的面积占正态曲线下总面积的,95.00%,,即有,95.00%,的变量值分布在此范围内;,+,2.58,范围内的面积占正态曲线下总面积,99.00%,,即有,99.00%,的变量值分布在此范围内,8,(二)正态分布曲线下的面积分布规律 数理统计证明:正态,9,9,(三)正态分布曲线的两个参数,均数,决定曲线在横轴上的位置是正态分布曲线的,位置参数,(图,3.1,)。,标准差,决定曲线的形状是正态分布曲线的,形状参数(变异度参数),(图,3.2,)。,10,(三)正态分布曲线的两个参数均数决定曲线在横轴上的位置是正,(,四)标准正态分布,对于任何一个均数为,,,标准差为,的正态分布,都可以通过变换,使之成为,=0,=1,的,标准正态分布,。变换的方法是将变量值,x,变换为,u,,,u=x-,/,,,u,值的分布,就是标准正态分布。,11,(四)标准正态分布 对于任何一个均数为,标准差,u=x-/,12,u=x-/12,(,五,),标准正态分布曲线下的面积分布规律,标准正态分布曲线以,u,值为横轴变量,,位置参数,=0,,,形状参数,=1,,,标准正态分布曲线与横轴之间的整体面积为,1,或,100%,。,标准正态分布曲线下面积的分布规律有如下规律(图,5,),u=-1,u=1,范围内的面积占正态曲线下总面积的,68.27%,,即有,68.27%,的变量值分布在此范围内;,u=-1.96,u=1.96,范围内的面积占正态曲线下总面积的,95.00%,,即有,95.00%,的变量值分布在此范围内;,u=-2.58,u=2.58,范围内的面积占正态曲线下总面积,99.00%,,即有,99.00%,的变量值分布在此范围内。,13,(五)标准正态分布曲线下的面积分布规律标准正态分布曲线以u值,14,14,二、,t,分布,15,二、t 分布15,(,一,),均数的抽样误差 标准误,在总体中随机抽取一部分个体作为样本,进行调查研究以推论总体的方法,称为,抽样研究方法,。,由抽样而引起的样本均数与总体均数之间的差别及样本均数与样本均数之间的差别称为,抽样误差,。,从正态分布的同一总体中随机抽取例数相等的若干个样本,分别计算它们的均数,这些样本均数的标准差称为,标准误,。,16,(一)均数的抽样误差 标准误在总体中随机抽取一部分个体作为,标准误与标准差的区别,标准差描述,个体,变量值间的变异程度。凡同性质的资料,标准差大表示个体变量值变异大,,样本均数对个体,的代表性差。标准差小表示个体变量值变异小,样本均数对个体的代表性好。,标准误是,样本均数,的标准差,即描述样本均数的抽样误差。凡同性质的资料,标准误大说明抽样误差大,用,样本均数估计总体均数,的可靠性小;而标准误小,说明抽样误差小,用样本均数估计总体均数的可靠性大。,17,标准误与标准差的区别标准差描述个体变量值间的变异程度。凡,标准误与标准差的区别,x,1,x,2,x,3,s,18,标准误与标准差的区别x1x2x3s18,(,二,),样本均数的正态分布(中心极限定理),从一个呈正态分布的总体中随机抽取样本含量相等的许多样本,分别计算出它们的样本均数。这些,样本均数的频数分布,仍是以,总体均数,为中心的,正态分布,。,19,(二)样本均数的正态分布(中心极限定理)从一个呈,20,20,21,21,(,三,),样本均数的标准正态分布,对于任何一个横轴变量为 均数为,,,标准误为 的正态分布,都可以通过变换,使之成为,=,0,、,=1,的标准正态分布。变换的方法是将变量值 变换为,u,,,u=,-,/,,,u,值的分布就是,标准正态分布,。,22,(三)样本均数的标准正态分布 对于任何一个横轴变,u,=-/,23,u=-/23,(,四,)t,值,t,分布,对于任何一个横轴变量为 均数为,,,标准误为 的正态分布,都可以通过变换,使之成为,=,0,,,=1,的标准正态分布。变换的方法是将变量值 变换为,u,,,u=,-,/,,,u,值的分布就是标准正态分布。实际工作中 常用 估计,,t,值,就是样本均数 与总体均数,的差数 除以 所得之商,24,(四)t值 t分布 对于任何一个横轴变量为,实际工作中 用 估计,这时对正态变量 采用的不是,u,变换,而是,t,变换,。如果从一个正态总体中,抽取样本含量为,n,的许多样本,分别计算其样本均数和标准误,然后再求出每一个,t,值,这样可有许多,t,值,其频数分布是一种连续型分布,这就是统计学上的,t,分布,。,25,实际工作中 用 估计,这时对正态变量,26,26,(五),t,分布特征,t,值自由度,(),t,分布特征,t,界值,t,值与自由度的关系,t,界值与概率的关系,单侧、双侧,t,界值,27,(五)t 分布特征t 值自由度()27,t,值自由度,(),从一个总体中抽取,200,个样本,每一个样本含量,n=6,则,200,个样本可计算出,200,个样本均数 每一个样本均数可计算出一个,t,值共计算出的,200,个,t,值,,t,值自由度,=6-1=5,28,t 值自由度()从一个总体中抽取200个样,t,分布特征,呈单峰曲线,以,0,为中心,左右两侧对称。,t,分布曲线是一簇,不同自由度有不同,t,分布曲线。越小,,t,分布曲线愈来愈平坦,曲线中间愈低,曲线两侧尾部翘得愈高;越大,,t,分布曲线愈接近标准正态分布曲线,当,t,分布曲线就是标准正态分布曲线。,29,t 分布特征呈单峰曲线,以0为中心,左右两侧对称。29,30,30,t,界值,t,分布曲线和横轴所夹全部面积为,100%,,当 时,t,分布越接近标准正态分布,这时,t,分布曲线中,1.96,范围内占总面积,95%,,,1.96,以外两侧面积为,5%,。,同理,t,分布曲线中,2.58,范围内占总面积,99%,,,2.58,以外两侧面积为,1%,。,把自由度为 的,t,分布曲线下两侧外总面积为,5%,界限的,t,值叫,界值,为,P=0.05,的,t,界值;两侧外总面积为,1%,界限的,t,值叫,界值,为,P=0.01,的,t,界值。,31,t界值t分布曲线和横轴所夹全部面积为100%,当,32,32,t,值与自由度的关系,一般情况下,,t,分布曲线较标准正态分布曲线低平,因此 ,自由度越小,,t,分布曲线越低平则 、界值越大。,33,t值与自由度的关系 一般情况下,t分布曲线较标准正态,34,34,t,界值与概率的关系,设以,t,分布曲线与 横轴所夹总面积为,100%,,则横轴上某一区间和曲线所夹面积与总,面积之比,,,相当于,t,值在该区间内出现的概率(,P,),,从一个正态总体中随机抽样,获得,t,值落于整个横轴的概率,P=1,,获得,l,t,l,的,P,,对应曲线面积 ,,|t|,的,P,,对应的曲线面积 。,35,t界值与概率的关系 设以t 分布曲线与 横轴所夹总面积为,36,36,37,37,单侧、双侧,t,界值,相同自由度的,t,分布曲线下,t,界值对应的概率,P,值有双侧概率和单侧概率之分,双侧概率对应于,双侧尾部面积,占总面积之比;单侧概率对应于,单侧尾部,面积占总面积之比。,38,单侧、双侧t界值 相同自由度的t分布曲线下t界值对,39,39,自我评估测试,40,自我评估测试40,名词解释,正态分布,标准正态分布,抽样误差,u,分布,t,分布,t,值自由度,41,名词解释正态分布41,填 空,1,、,正态分布曲线下,+,1.96,范围内的面积占正态曲线下总面积的,,即有,的变量值分布在此范围内;,2,、,正态分布曲线下,范围内的面积占正态曲线下总面积,99.00%,,即有,99.00%,的变量值分布在此范围内,3,、均数,是正态分布曲线的,参数,标准差,是正态分布曲线的,参数。,42,填 空1、正态分布曲线下+1.96范围内,填 空,4,、对于任何一个均数为,,,标准差为,的正态分布要变换成为,=0,=1,的标准正态分布可用,变换,公式为 。,5,、,对于任何一个横轴变量为 均数为,,,标准误为 的正态分布要变换成为,=,0,=1,的标准正态分布可用 变换。公式 。,43,填 空4、对于任何一个均数为,标准差为的正态分布要变换,单项选择题,1,、,反映了个体变量间差异及 对个体变量值代表性的好坏。,A,、个体变量值,B,、样本均数,C,、总体均数,D,、标准差,44,单项选择题1、反映了个体变量间差异及,单项选择题,2,、,反映了样本均数抽样误差大小,及样本均数对,估计可靠性。,A,、个体变量值,B,、样本均数,C,、总体均数,D,、标准差,45,单项选择题2、反映了样本均数抽样误差大,单项选择题,3,、,当 界值时,概率,A,、,P0.05,B,、,P0.05,D,、,P0.01,46,单项选择题3、当 界值时,概率46,单项选择题,4,、,A,、大于,B,、小于,C,、等于,D,、无关,47,单项选择题47,单项选择题,5,、,A,、大于,B,、小于,C,、等于,D,、无关,48,单项选择题5、,谢谢,49,谢谢49,
展开阅读全文