第四章离散程度

上传人:laiq****ong 文档编号:243703041 上传时间:2024-09-29 格式:PPT 页数:45 大小:7.36MB
返回 下载 相关 举报
第四章离散程度_第1页
第1页 / 共45页
第四章离散程度_第2页
第2页 / 共45页
第四章离散程度_第3页
第3页 / 共45页
点击查看更多>>
资源描述
Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,4 -,44,第四章 离散程度的测度,一,.,定类数据:异众比率,二,.,定序数据:四分位差,三,.,定距和定比数据:方差及标准差,四,.,相对离散程度:离散系数,离中趋势,数据分布的另一个重要特征,离中趋势的各测度值是对数据离散程度所作的描述,反映各变量值远离其中心值的程度,因此也称为离中趋势,从另一个侧面说明了集中趋势测度值的代表程度,不同类型的数据有不同的离散程度测度值,数据的特征和测度,(本节位置),数据的特征和测度,分布的形状,离散程度,集中趋势,众 数,中位数,均 值,离散系数,方差和标准差,峰 度,四分位差,异众比率,偏 态,定类数据:异众比率,异众比率,(,概念要点,),1.,离散程度的测度值之一,2.,非众数组的频数占总频数的比率,3.,计算公式为,4.,用于衡量众数的代表性,异众比率,(,算例,),某城市居民关注广告类型的频数分布,广告类型,人数,(,人,),频率,(%),商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告,112,51,9,16,10,2,56.0,25.5,4.5,8.0,5.0,1.0,合计,200,100,计算异众比率,解:,在所调查的,200,人当中,关注非商品广告的人数占,44%,,异众比率还是比较大。因此,用“商品广告”来反映城市居民对广告关注的一般趋势,其代表性不是很好,V,r,=,200 - 112,200,= 1 -,112,200,= 0.44 = 44%,定序数据:四分位差,四分位差,(,概念要点,),1.,离散程度的测度值之一,2.,也称为内距或四分间距,3.,上四分位数与下四分位数之差,Q,D,=,Q,U,-,Q,L,4.,反映了中间,50%,数据的离散程度,不受极端值的影响,用于衡量中位数的代表性,四分位差,(,定序数据的算例,),计算甲城市家庭对住房满意状况评价的四分位差,解:,设非常不满意为,1,不满意为,2,一般为,3,满意为,4,非常满意为,5,已知,Q,L,=,不满意,=,2,,,Q,U,=,一般,=,3,四分位差:,Q,D,=,Q,U,-,Q,L,=,3 2,=,1,甲城市家庭对住房状况评价的频数分布,回答类别,甲城市,户数,(,户,),累计频数,非常不满意,不满意,一般,满意,非常满意,24,108,93,45,30,24,132,225,270,300,合计,300,定距数据:方差和标准差,全距,(,概念要点及计算公式,),1.,一组数据的最大值与最小值之差,2.,离散程度的最简单测度值,3.,易受极端值影响,4.,未考虑数据的分布,7,8,9,10,7,8,9,10,未分组数据,R,= max(,X,i,) - min(,X,i,),.,=,组距分组数据,R,最高组上限,-,最低组下限,5.,计算公式为,平均离差,(,概念要点及计算公式,),1.,离散程度的测度值之一,2.,各变量值与其均值离差绝对值的平均数,3.,能全面反映一组数据的离散程度,4.,数学性质较差,实际中应用较少,5.,计算公式为,未分组数据,组距分组数据,0750,班同学暑期调查发放问卷数量分组表,按问卷数分组,组中值,(,X,i,),频数,(,F,i,),|,X,i,-,X,|,|,X,i,-,X,|,F,i,105,110,110,115,115,120,120,125,125,130,130,135,135,140,107.5,112.5,117.5,122.5,127.5,132.5,137.5,3,5,8,14,10,6,4,15.7,10.7,5.7,0.7,4.3,9.3,14.3,47.1,53.5,45.6,9.8,43.0,55.8,57.2,合计,50,312,方差和标准差,(,概念要点,),1.,离散程度的测度值之一,2.,最常用的测度值,3.,反映了数据的分布,反映了各变量值与均值的平均差异,根据总体数据计算的,称为,总体,方差或,总体,标准差;根据样本数据计算的,称为,样本方差,或,样本标准差,4 6 8 10 12,X =,8.3,总体,方差和,总体,标准差,(,计算公式,),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,方差或标准差的另一种意义:,用均值做估计或者预测变量值时所犯错误的大小。,0750,班同学暑期调查发放问卷数量分组表,按零件数分组,组中值,(,X,i,),频数,(,F,i,),(,X,i,-,X,),2,(,X,i,-,X,),2,F,i,105,110,110,115,115,120,120,125,125,130,130,135,135,140,107.5,112.5,117.5,122.5,127.5,132.5,137.5,3,5,8,14,10,6,4,246.49,114.49,32.49,0.49,18.49,86.49,204.49,739.47,572.45,259.92,6.86,184.90,518.94,817.96,合计,50,3100.5,样本,方差和,样本,标准差,(,计算公式,),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,样本方差的计算公式,样本标准差的计算公式,样本方差,(,算例,),原始数据,:,10 5 9 13 6 8,方差,(,数学性质,),各变量值对均值的方差小于对任意值的方差,相对离散程度:离散系数,离散系数,(,概念要点和计算公式,),1.,标准差与其相应的均值之比,2.,消除了数据水平高低和计量单位的影响,3.,测度了数据的相对离散程度,4.,用于对不同组别数据离散程度的比较,5.,计算公式为,离散系数,(实例和计算过程),某管理局所属8家企业的产品销售数据,企业编号,产品销售额(万元),X,1,销售利润(万元),X,2,1,2,3,4,5,6,7,8,170,220,390,430,480,650,950,1000,8.1,12.5,18.0,22.0,26.5,40.0,64.0,69.0,例:某管理局抽查了所属的,8,家企业,其产品销售数据表。试比较产品销售额与销售利润的离散程度,离散系数,(,计算结果,),X,1,=,536.25,(万元),S,1,=,309.19,(万元),V,1,=,536.25,309.19,=,0.577,S,2,=,23.09,(万元),V,2,=,32.5215,23.09,=,0.710,X,2,=,32.5215,(万元),结论:,计算结果表明,,V,1,0,为,右偏分布,4.,偏态系数, 0,为,左偏分布,5.,计算公式为,偏态,(,实例,),已知,2006,年我国农村居民家庭按纯收入分组的有关数据如表,4.9,。试计算偏态系数,2006,年,农村居民家庭纯收入数据,按纯收入分组(元),户数比重(,%,),500,以下,5001000,10001500,15002000,20002500,25003000,30003500,35004000,40004500,45005000,5000,以上,2.28,12.45,20.35,19.52,14.93,10.35,6.56,4.13,2.68,1.81,4.94,户数比重,(%),25,20,15,10,5,农村居民家庭村收入数据的直方图,偏态与峰度,(,从直方图上观察,),按纯收入分组,(,元,),1000,500,1500,2000,2500,3000,3500,4000,4500,5000,结论,:,为右偏分布,偏态系数,(计算过程),农村居民家庭纯收入数据偏态及峰度计算表,按纯收入分组,(百元),组中值,X,i,户数比重,(%),F,i,(,X,i,-,X,),F,i,3,(,X,i,-,X,),F,i,4,5,以下,510,1015,1520,2025,2530,3035,3540,4045,4550,50,以上,2.5,7.5,12.5,17.5,22.5,27.5,32.5,37.5,42.5,47.5,52.5,2.28,12.45,20.35,19.52,14.93,10.35,6.56,4.13,2.68,1.81,4.94,-154.64,-336.46,-144.87,-11.84,0.18,23.16,89.02,171.43,250.72,320.74,1481.81,2927.15,4686.51,1293.53,46.52,0.20,140.60,985.49,2755.00,5282.94,8361.98,46041.33,合计,100,1689.25,72521.25,偏态系数,(,计算结果,),根据上表数据计算得,将计算结果代入公式得,结论:,偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,峰 度,峰度,(,概念要点,),1.,数据分布扁平程度的测度,2.,峰度系数,=0,扁平程度适中,3.,偏态系数,0,为,尖峰分布,5.,计算公式为,峰度系数系数,(,实例计算结果,),代入公式得,根据,2006,年,农村居民家庭纯收入数据,,,计算农村居民家庭纯收入分布的峰度系数,结论:,由于,=0.40,,,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重,本章小结,1.,集中趋势各测度值的含义、计算方法、特点和应用场合,2.,离散程度各测度值的含义、计算方法、特点和应用场合,偏态及峰度的测度方法,数据分布的特征和测度,数据的特征和测度,分布的形状,集中趋势,离散程度,众 数,中位数,均 值,离散系数,方差和标准差,峰 度,四分位差,异众比率,偏 态,数据类型与集中趋势测度值,数据类型和所适用的集中趋势测度值,数据类型,定类数据,定序数据,定距数据,适,用,的,测,度,值,众数,中位数,均值,四分位数,加权平均数,众数,几何平均数,中位数,四分位数,众数,数据类型与离散程度测度值,数据类型和所适用的离散程度测度,值,数据类型,定类数据,定序数据,定距数据,适,用,的,测,度,值,异众比率,四分位差,方差或标准差,异众比率,离散系数(比较时用),平均差,极差,四分位差,异众比率,课后练习:,1,、集中趋势的测度方法,2,、离散程度的测度方法,3,、偏态与峰度的测度方法,结 束,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!