资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,3-2-,*,统计学概论,单击此处编辑母版标题样式,dd,Dfa,Df,第三级,第四级,第五级,*,*,*,3-,分布的离散程度,一、变异指标概述,1.概念:用来描述总体分布的离中趋势或离散程度的指标。,2.作用:,(1)用于衡量平均指标的代表性程度。,例如:假定两组学生身高资料如下,:(单位:cm),甲组:160,165,170,175,180。乙组:168,169,170,171,172。,乙组各标志值离散程度小,平均数170的代表性更大。,1,3-分布的离散程度 一、变异指标概述例如:假定两组学生,(2)反映社会经济现象变动的均匀性和稳定性。,在产品质量控制中常常应用这类指标。,(3)利用变异指标可研究总体标志值分布偏离正态的情况。,(4)标志变异指标是统计分析的一个基本指标。可用于衡量统计推断效果。,2,(2)反映社会经济现象变动的均匀性和稳定性。在产品质量控制中,3.种类:,(1),标志变异指标,:反映总体中各变量值离散程度的指标。,如,全距、平均差、标准差、平均差系数等。,(2),分布变异指标,:描述分布状态的指标,说明统计分布偏离正态分布的情况。,如,偏度、峰度。,3,3.种类:3,二、全距(R):,又称“极差”。,在分组条件下,,全距的特点:极差的优点是计算简便,直观,容易理解。不足之处是它只以两个极端的标志值计算,而不考虑总体内部的分配状况,不能充分利用数列的全部信息,因此,它无法反映标志值变动的一般程度。,改进方法:计算四分位差(P68和73),例如:假定两组学生身高资料如下,:(单位:cm),甲组:160,165,170,175,180。乙组:168,169,170,171,172。,4,二、全距(R):又称“极差”。在分组条件下,全距的,三、平均差(),:是总体各单位标志值对算术平均数的绝对离差的算术平均数。,1.计算公式:,平均差意义可通过数轴来说明。,平均差反映各标志值对平均数的平均距离,平均差越大,说明总体各标志值越分散;平均差越小,说明各标志值分布越集中。,未分组资料:,分组资料:,5,三、平均差():是总体各单位标志值对算术平均数的绝对,例如:假定某车间两个小组工人的月工资(元)资料如下。甲:800,900,1000,1100,1200。乙:900,950,1000,1050,1100。,6,例如:假定某车间两个小组工人的月工资(元)资料如下。,2.平均差系数,当水平不同或计量单位不同的总体之间比较离散程度时,不能直接用平均差(标准差、极差)等变异指标,而要用变异系数(平均差系数、标准差系数、极差系数等。),又如:丙:1800,1900,2000,2100,2200。,平均差系数:,7,2.平均差系数当水平不同或计量单位不同的总体之间比较离,四、方差()和标准差():,测定标志变异程度最灵敏的指标。,(一)计算公式:,将平均差公式中的绝对值符号换成平方,得到方差的公式,将方差开方根为标准差。,对于分组资料,有加权公式。,8,四、方差()和标准差():测定标志变异,仍用前面车间两小组工人月工资的例子:,(二)标准差系数,9,仍用前面车间两小组工人月工资的例子:(二)标准差系数9,10,10,测定标志变异度的绝对量指标(,与原变量值名数相同,),测定标志变异度的相对量指标(,表现为无名数,),全距,平均差,标准差,全距,系数,平均差,系数,标准差,系数,标志变异指标的种类,11,测定标志变异度的绝对量指标(与原变量值名数相同)测定标志变异,可比,变异系数指标,12,可比变异系数指标12,身高的差异水平:cm,体重的差异水平:kg,用,变异系数,可以相互比较,可比,13,身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比,平均差系数,标准差系数,变异系数指标,用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:,标准差系数小的总体,其平均数的代表性大;反之,亦然。,应用:,14,平均差系数标准差系数变异系数指标用来对比不同水平的同类现象,,(三)方差的数学性质,1.变量的方差等于变量平方的平均数减去变量平均数的平方。,由于,根据这个关系式,可以进行方差或标准差的简化计算。,2.变量对算术平均数的方差小于对任意常数的方差。即,设x,0,为任意常数,S,2,为变量对x,0,的方差,则:,15,(三)方差的数学性质1.变量的方差等于变量平方的平均数减去变,3.n个同性质独立变量代数和的方差等于各变量方差之和。,若两变量:,对于标准差:,4.n个同性质独立变量平均数的方差等于各变量方差方差平均数的。,16,3.n个同性质独立变量代数和的方差等于各变量方差之和。若两变,5.总方差、组间方差和组内方差(P75),例子:某公司下属7个门市部某月营业额(单位:万元)如下:,88,90,96,98,110,140,200,按营业额分两组:,第一组:88,90,96,98,第二组:110,140,200,根据上述资料可以计算,:,总平均营业额:,营业额的总方差:,17,5.总方差、组间方差和组内方差(P75)例子:某公司下属7个,总方差、组间方差和组内方差,第一组:88,90,96,98,第二组:110,140,200,根据上述资料可以计算:,第一组平均营业额:,第一组营业额的组内方差:,第二组平均营业额:,第二组营业额的组内方差:,组内方差的平均数:,18,总方差、组间方差和组内方差第一组:88,90,96,9,总方差、组间方差和组内方差,第一组平均营业额:,第二组平均营业额:,总平均营业额:,组间方差:,总方差609.71795.671405.38,总方差组内方差的平均数组间方差,19,总方差、组间方差和组内方差第一组平均营业额:总方差609.,五、是非标志的标准差(P58和76),1.“是非”标志:将总体分成具有某种性质和不具有某种性质两部分,我们所关心标志表现称为“是”,另一标志表现称为“非”。,例如,产品分为合格品与不合格品;,人口按性别分为男与女两组。,2.成数,(1)定义:总体中,是非标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。,例如,考试及格率、产品合格率、男生比重等。,20,五、是非标志的标准差(P58和76)1.“是非”标志:将总体,(2)设总体的n个单位中,具有 某种特征的单位数是n,1,个,不具有某种特征的单位数是n,0,个,n,1,+n,0,=n 。则有,具有某种特征的单位的成数为:,不具有某种特征的单位的成数为:,例如:设某批电子元件100件产品,经检验有92件合格,8件不和格。则有,21,(2)设总体的n个单位中,具有 某种特征的单位数是n1个,不,3.是非标志数量化,1,(当单位具有某种特征),0,(当单位不具有某种特征),“01分布”,例如,上例中,以“1”代表产品合格,以“0”代表产品不合格。,22,3.是非标志数量化1(当单位具有某种特征)0(当单位不具,4.“01”分布的数值特征,或,23,4.“01”分布的数值特征或23,当p=q=0.5时,01变量分布的方差有最大值,此时成数的标准差最大值等于0.5。,24,当p=q=0.5时,01变量分布的方差有最大值,此时成数的,六、箱线图在统计描述中的运用,25,六、箱线图在统计描述中的运用25,3-3分布的偏态与峰度,一、偏态,(一)概念:偏态分配是指次数分配不对称。所谓偏态是指次数分配的非对称程度。,正态分布,(对称),右偏分布,左偏分布,偏态分配,26,3-3分布的偏态与峰度一、偏态正态分布右偏分布左偏分布偏,(二)偏态的测定方法,1.算术平均数与众数比较法,当SK,p,0时,分配数列属于正偏(右偏);,当SK,p,0时,分配数列属于负偏(左偏)。,27,(二)偏态的测定方法当SKp0时,分配数列属于正偏(右偏),(1)中心动差(中心矩),当分布完全对称时,变量的所有奇数阶中心矩均为0,要判断分布是否对称,可考虑用奇数阶中心矩来测定。由于一阶中心矩恒为0,而五阶以上的中心矩计算较为繁琐,所以偏态可以用三阶中心动差来测定。,2.动差法,28,(1)中心动差(中心矩)当分布完全对称时,变量的所有奇数,(2)偏度:,偏度是用于衡量分布的不对称程度或偏斜程度的指标。,计算公式:,29,(2)偏度:偏度是用于衡量分布的不对称程度或偏斜程度的指标。,正态分布曲线左右完全对称,三阶中心动差m,3,等于0,即,=0。当分布不对称时,则三阶中心动差不为0,其分布的偏斜程度使大于0或小于0。如下图所示,当,=0时为正态分布;当,0时为正偏斜;当,0时,表示分布比正态分布更集中在平均数周围,分布呈尖峰状态;分布为正态分布;,0时,表示分布比正态分布更集中在平均数周围,
展开阅读全文