资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,知识回顾,请说出适用于不同层次变量的集中趋势值和离散趋势值。(定类变量、定序变量和定距变量),什么是相关关系?相关的性质?,下列层次的变量在进行相关分析时,采用的相关测量法有哪些?,定类,-,定类;,定序,-,定序,定距,-,定距,定类,-,定距,第四讲 正态分布及其它常用分布,一、正态分布,正态分布,(normal distribution),在统计学中极其重要。,许多自然现象和社会现象都可以用正态分布来描述,如人们的身高、体重、智商等都比较接近正态分布,事实上大样本的抽样分布都可以看作是正态分布,正态分布是推论统计的基础,由正态分布出发可以导出一系列重要分布:如,t,分布、,F,分布、,X,2,分布等。,(一)、频数分布与正态分布,前述的频数分布可以用直方图来表示(当然是定距变量层次),事实上,当直方图中的矩形数量不断增多并趋于无穷时,原先对应的折线图就近似为一个平滑的曲线图,此种情况又称为极限频数分布。此时,矩形的总面积就接近于平滑曲线下的面积,如图,1,所示,图,1,:直方图与平滑曲线的比较,所谓正态曲线是一种对称平滑的钟形曲线。它是一种非常重要的理论性曲线,可以反映变量的概率分布的情况,许多自然现象和社会现象都可近似看成正态分布,即可以用正态曲线来描述。正态分布,(,又称为常态分布或高斯分布,),最早是由德国数学家高斯在研究误差理论时所发现的,在,概率分布中,概率代表各个变量值出现的可能性大小,类似于频数分布中的百分比或频率。,正态分布的数学表达式,特性,正态分布曲线下的面积,为了利用正态分布解决实际问题,必须熟悉并掌握正态曲线下的面积。显然位于正态曲线和横轴之间的总面积可以表示一个单位的整体,即包含了总体中的全部,(100,),的个案。,正态曲线下包含的每一块面积,可以表示对应的个案数占总数的比例的大小。,(二)标准正态分布,由于不同的变量会用不同的度量单位,(,如身高用米,体重用千克,收入用人民币元,),,即使是同一变量也可能用不同的度量单位,(,如收入可以用一元、一百元或一千元等为单位,),,结果形成了不同大小和不同形状的正态分布。,从正态分布的函数式可以清楚地知道,正态曲线的图形由均值和标淮差所决定,只要标准差有所不同,其正态曲线的扁平或高耸的程度也就各不相同,(,均值则决定图形的位置,),。如果我们要分别计算每一种正态分布内的各部分面积,将会是一桩极其麻烦的事情。,标准值公式,此时的正态分布的图形只受到一个变量,Z,的影响,因而图形是唯一的。,标准值的实际意义,例,1,通过上面两个例子可以看出,,标准值在比较若干数值在各自数据组中的相对位置,方面发挥着重要作用。,由于类似这样的比较在现实生活中经常要遇到,因此,标准值具有非常广泛的运用价值。,二、其他常用的统计学分布,除了正态分布以外,统计学中还有一些概率分布也需要关注,下面仅对其中三个常用的分布做简要的介绍,。,它们在本书后面的章节中将会遇到并有重要的应用。,(一),t,分布,布,数学表达式,特性,(二),特性,x,2,分布是一个正偏态,(,右偏态,),分布。自由度不同,其分布曲线的形状不同:,df,越小,分布越偏斜;,df,越大,分布越接近正态分布。,x,2,值都是正值,这与前面介绍的正态分布和,t,分布不同。,(,三),F,分布,特性,三、运用,SPSS,检验正态分布,(一)直方图,前面曾提到直方图还可以添加拟合的正态曲线,由直方图及这条拟合的正态曲线可以直观地得出研究数据是否符合正态分布,。,依次单击“,GraPhs” -Histogram,,弹出一个对话框,如图,2,所示,将要分析的变量“放置在,variable,框中;,在“,histogram”,对话框中选择,Display normal curve;,单击“,OK”,按钮,提交运行,,SPSS,将输出统计图;,图,2,(二),P-P,图,
展开阅读全文