资源描述
第 4 章 数据分布特征的测度,4.1 集中趋势的测度 4.2 离散程度的测度 4.3 偏态与峰态的测度,4.1 集中趋势的测度,一. 众数 二. 中位数和分位数 三. 均值 四.众数、中位数和均值的比较,集中趋势(central tendency),一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值,众数(mode),出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数,众数(不唯一性),无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 5 9 8 5 5,多于一个众数原始数据: 25 28 28 36 42 42,1、由单项数列求众数 某 车 间 工 人 日 产 情,2.由组距数列计算,首先确定次数最多的组,即众数组,然后,用公式计算。,下限公式:,上限公式:,中位数(median),排序后处于中间位置上的值,不受极端值的影响,1、由未分组资料计算中位数,设有六个工人的日产量(件)依次排列为10、11、12,13、14、15、则:,中位数位次(n+1)2 6+123.5,(1)由单项数列求中位数,2、由分组资料计算中位数:,例10:某生产车间120名工人生产某种零件的日产量如下表所示,计算该车间工人日产量的中位数。,2.由组距数列求中位数,下限公式:,L为中位数所在组下限,为中位数所在组以前各组的累计次数(较小制),为中位数所在组的次数,上限公式:,U为中位数所在组上限,为中位数所在组以后各组的累计次数(较大制),从某单位抽查800户,取得人均收入资料如下表,计算该单位人均收入的中位数。,中位数位次f28002400,中位数组在700-800这一组中。由下限公式,由上限公式,四分位数(quartile),1.集中趋势的测度值之一 2.排序后处于25%和75%位置上的值,3. 不受极端值的影响,四分位数,未分组数据:,均值(mean),1.集中趋势的最常用的测度值 2.一组数据的均衡点所在 3.易受极端值的影响,简单算术平均数(simple mean),加权算术平均数(weighted mean),设一组数据为: x1 ,x2 , ,xn 相应的频数为: f1 , f2 , ,fk,(例题分析),(权数对均值的影响)P34,甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 1,算术平均数(数学性质),1.各变量值与均值的离差之和等于零,2. 各变量值与均值的离差平方和最小,调和平均数(harmonic mean),1.均值的另一种表现形式,原来只是计算时使用了不同的数据!,调和平均数,【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,几何平均数(geometric mean),1. n 个变量值乘积的 n 次方根 2. 适用于对比率数据的平均 3. 主要用于计算平均增长率,【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.84%-1=3.84%,众数、中位数和均值的比较,众数、中位数和均值的关系,众数、中位数和均值的特点和应用,众数 不受极端值影响 具有不唯一性 数据分布偏斜程度较大时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用,分布离散程度的测度,一、极差 二、方差和标准差 三、离散系数,极差(range),一组数据的最大值与最小值之差 离散程度的最简单测度值,R = max(xi) - min(xi),方差和标准差,方差和标准差(Variance and Standard deviation),离散程度最常用的测度值 反映了各变量值与均值的平均差异,总体方差和标准差 (Population variance and Standard deviation),未分组数据:,组距分组数据:,样本方差和标准差 (simple variance and standard deviation),未分组数据:,组距分组数据:,样本方差自由度(degree of freedom),一组数据中可以自由取值的数据的个数,离散系数,离散系数(coefficient of variation),1.标准差与其相应的均值之比 2.对数据相对离散程度的测度 3.消除了数据水平高低和计量单位的影响 4.用于对不同组别数据离散程度的比较,【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,计算分析题,1.某厂400名职工工资如下,根据上述资料计算该厂职工平均工资和标准差。,解:,2.某县去年年粮食产量资料如下:,根据上表资料计算该县粮食作物平均单位面积产量。,解:,3.某地甲、乙两个农贸市场三种主要蔬菜价格及销售资料如下:,比较该地区哪个农贸市场蔬菜平均价格高?并说明原因。,解:,4.某工厂生产一批零件共10万件,为了解这批产品的质量,采取不重复抽样的方法抽取1000件进行检查,其结果如下,根据质量标准,使用寿命800小时及以上者为合格品。计算平均合格率、标准差及标准差系数。,5、甲、乙两单位工人的生产资料如下:,(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐?,6.甲、乙两班同时对统计学课程进行测试,甲班平均成绩为70分,标准差为9.0分; 乙班的成绩分组资料如下:,计算乙班学生的平均成绩,并比较甲、乙两班哪个班的平均成绩更有代表性?,7.有甲、乙两个品种的粮食作物,经播种实验后 得知甲品种的平均产量为998斤,标准差为 162.7斤;乙品种实验的资料如下:,试研究两个品种的平均亩产量,以确定 哪一品种具有较大稳定性,更有推广价值?,8、下属三个企业销售利润率资料如表,要求计算三个企业的平均利润率。,
展开阅读全文