资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一节 离中趋势与差异量数,一、离中趋势的概念,二、差异量数的作用,三.主要的差异量数分类,第二节 两极差,一、两极差的概念,二、两极差的求法,第三节 四分差,一、四分差的概念,二、四分差的求法,第四节 平均差,一、平均差的概念,二、平均差的求法,第五节 标准差与方差,一、标准差与方差的概念,二、标准差与方差的求法,第六节 标准差的应用数据的标准化,一、考分比较,二、标准化与标准分,三、标准分的应用,四、标准分与正态分布和百分位的关系,第四章 离中趋势与差异量数,第一节 离中趋势与差异量数,一、离中趋势的概念:,离中趋势指的是一组数据的变异或离散程度。对离中趋势进行度量的统计量称作差异量数。离中趋势的度量是描述统计的一个重要方面。,二、差异量数的作用:,1.能从另一个角度了解数据的性质。,2.有助于检验或说明集中量数的代表性,差异量数越大,集中量数的代表性就越小;,差异量数越小,集中量数的代表性就越大;,差异量数为零,那么说明数据中各个数值之间没有任何差异,都等于平均数,平均数的代表性最大,三.主要的差异量数分类:,1.;两极差 2.四分差 3.平均差 4.标注差与方差,举个例子:,我们两组假设的分数来举个例子:,第一组:60 75 78 80 82 85 100,第二组:74 77 80 80 80 83 86,两组分数段饿平均差都是80,然而其离散程度却差异很大,如果每组数据中的最大值与最小值之差来表示离散程度,那么第一组为100-60=40,第二组为86-74=12。两者离散程度的不同说明其分数分布的差异;,第二节 两极差,一、概念,两极差也称全距,用符号R表示。所谓两极差就是一组数据中最高值与最低值之差。,二、两极差的求法,R=最大数值-最小数值,三、小结:,1.两极差是简单而粗略的差异量数,2.不能反映中间数值的差异情况,也受两极,端异常数值的影响。,3.可以作为数据分布的初步统计,在一定程度上反映数据的差异情况前提是分布比较对称、没有极端数值,第三节 四分差,一、概念,四分差指一个分布中,中间50%的次数的全距之半,用符号Q表示。,正如中数把一个次数分布分成两半那样,有一些点把一个次数分布分成四等份,这些点称作四分点或四分位数。第一个四分点或称下25分点用Q1表示,其下有全部数值的1/4或25%,其上那么有全部数值的3/4或75%,其上那么有全部数值的1/4或25%。,二.四分差的求法,要求四分差,首先要求Q1和Q3的值。对于分组数据,用以下公式求之方法同中数的求法,其实中数就是第二个四分点,式中Lb-该四分点所在组的精确下限;,fQ1,fQ3-该四分点所在组的次数;,fb-该四分点所在以下的累积次数;,N-数据中的数值个数;,i-组距,:N=100,i=5;,Q1的位置为N/4=25,即在1014组,该组的精确下限为9.5/,该组以下的累积次数(Fb为8;,我们下面以表,4.1,的分组数据未说明四分差的计算过程:,Q3的位置为3N/4=75,即在2529组,改组的精确下为24.5。该组以下的累积次数Fb)为72;,三、小结,分差不受两极端值的影响,故两极差稳定可靠,不能反映全部数据的差异情况,而且不适于代数运算,适用于两极端数据不清,无法计算其他差异量数;,四分差常与中数结适宜用,第四节 平均差,一、概念,平均差:是指一组数据中各个数值与平均数之差的平均实质上是用数值离开平均数的距离来表示离散程度,一般用符号AD表示。,二、平均差的求法:,平均差是基于算术平均数上的一个差异量数,而根据算术平均数的一个重要性质,一组数据中每个数值与算术平均数的差即离均差之和等于零即(),因此求平均差时,要取离均差的绝对值。,对于未分组数据,首先要计算每个数值的离均差,取其绝对值,然后把所有离均差相加,再除以数值的个数。公式表示如下:,例如10学生在一次完型填空练习中的得分为总分值20分,9,11,12,12,15,15,16,16,17,18,即以每组组中点代表该组各数值。首先计算组中点与平均数之差,取其绝对值,再乘以该组次数,然后把各组的计算结果累加,最后除以总次数,N.,以表,4.2,中的数据为例,.,三、小结,1.,平均差的优点,平均差优于两极差和四分差,用数值离开平均数数的平均距离来表示数据的分散程度,符合人们的常识,易于理解和接受。,它的计算考虑了每一个数值,因而稳定可靠,不易受极端数值的影响也不易受样本变化的影响。,2.,缺点,计算过程中需要取绝对值等原因,它不适合代数方法的运算,因而在进一步的统计分析中很少使用。,第五节 标准差与方差,一、概念,标准差是度量离中趋势的最常用的差异量数。作为样本统计量的标准差一般用符号S或者SD表示,而作为总体参数的标准那么用希腊字母。标准差的平方即为方差,分别用符号S2(样本统计量和2总体参数来表示。,二、标准差与方差的求法,下面就从未分组数据原始数据、次数分布数据和分组次数分布数据三个方面讨论一下标准差和方差的计算方法。,1.未分组数据标准差和方差的求法,第一步:计算个数值与平均数之差离均差,第二步:求离均差的平方,第三步:把平方离均差相加,求平方和“;,第四步:把平方和除以数值的个数,求得方差;,第五步:方差的平方根即为标准差。用公式表示:,显然,由于涉及到平均数,上述公式使用起来很不方便;我们可以在上述的公式的根底上得出一个不涉及平均数的求标准差的公式:,下面我们仍用上例中的数据说明公式的用法,三个公式计算结果一样,但计算过程要简便得多。,2.,次数分布数据标准差和方差的求法:,如果已有次数分布表,那么标准差和方差的计算将更加简便。计算公式为:,3.,分组次数分布数据标准差和方差的求法,从分组次数分布数据标准差和方差的公式如下:,三、小结,标准差与方差的概念易于理解,适于代数运算,能反映所有数据的差异情况,不易受抽样变动的影响。,第六节 标准差的应用,数据的标准化,标准差的重要应用之一是对数值型数据进行标准化。在语言和语言教学研究中,标准化处理的主要用途是便于对考试分数的比较。,一、考分比较,考分在各自分数组中所处的相对位置是可以进行比较的。虽然这同样无法保证百分之百的可比性,但这至少为比较不同考试的分数找到了一个较为可靠的途径。,二、标准化与标准分,我们可以用公式表示这一标准化过程:,该式表示:先从一个分数中减去平均分,求出该分数离开平均分的距离分数低于平均数时,差为负数;反之为正数,然后再除以标准差,即得标准分。,标准分具有以下几个特点:,三、标准分的应用,通过把原始分数转换为标准分,原分数不见了,而代之以一个抽象的相对位置标准分无实际单位,这样就可以用同一把尺子来衡量和比较不同考试因而不同质的分数。,利用标准分,可以把不同质的考试分数合成求和或平均数,然后再加以比较。,四、标准分与正态分布和百分位的关系,百分位是指把一组分数从高到低排列并分为100等分,以百分位等级表示某个分数在全局部数中所在的位置,即在全部考分仲有百分之几的分数是低于该分数的或有百分之几的分数是高于该分数的。,百分位表是在累计次数分布表的根底上编制的,标准分就是通过标准化把一个成呈正态分布的变量转换成标准正态分布。在正态分布的情况下,分布曲线下任意两个标准之间的面积、任一标准以上的买年纪或任一标准差以下的面积在总面积中的百分比都是一样的。,总结,离中趋势指的是一组数据的变异或离散程度。对离中趋势进行度量的统计量称作差异量数。离中趋势的度量是描述统计的一个重要方面。,本章首先介绍了差异量数的作用:1.能从另一个角度了解数据的性质。2.有助于检验或说明集中量数的代表性。,其次重点介绍了差异量数的四种分类以及各种分类的求法,这四种分类分别是:1.两极差;2.四分差;3.平均差;4.标注差与方差。,最后论述了标准差的应用数据的标准化。而数据的标准化主要是指对考试分数的比较。,
展开阅读全文