资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2.2,用样本的数字特征估计总体的数字特征,一、复习,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛,.,平均数,:,一组数据的算术平均数,即,二、在频率分布直方图中读取众数,中位数,平均数,1,、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,例如,在上一节调查的,100,位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是,2.25t.,如图所示:,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5,月平均用水量,(t),图中虚线代表居民月均用水量的中位数的估计值,此数据值为,2.02t.,2,、在样本中,有,50,的个体小于或等于中位数,也有,50,的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,.,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5,月平均用水量,(t),说明,:,2.02,这个中位数的估计值,与样本的中位数值,2.0,不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致,.,3,、,平均数是频率分布直方图的“重心,”,.,是直方图的平衡点,,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,居民月均用水量的平均数,:2.02,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5,月平均用水量,(t),某医院的记录表明,以往到急诊中心就诊的病人需等待的时间的频率分布如下:,等待时间,(min),0,5,),5,10,),10,15,),15,20,),20,25,),频率,0.20,0.40,0.25,0.10,0.05,估计到这个中心就疹的病人平均需要等待的时间是,9.5min,三 三种数字特征的优缺点,1,、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征,.,如上例中众数是,2.25t,它告诉我们,月均用水量为,2.25t,的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少,.,2,、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为,10t,,那么它所占频率为,0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3,、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的,因此,只有平均数还难以概括样本数据的实际状态,如:有两位射击运动员在一次射击测试中各射靶,10,次,每次命中的环数如下:,甲:,乙:,如果你是教练,你应当如何对这次射击作出评价,?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的,.,那么两个人的水平就没有什么差异吗,?,4,5,6,7,8,9,10,环数,频率,0.3,0.1,0.2,0,(,甲,),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,(,乙,),直观上看,还是有差异的,.,如,:,甲成绩比较分散,乙成绩相对集中,因此,我们还需要从另外的角度来考察这两组数据,.,例如,:,在作统计图,表时提到过的极差,.,甲的环数极差,=10-4=6,乙的环数极差,=9-5=4.,考察样本数据的分散程度的大小,最常用的统计量是标准差一般用,s,表示,所谓“平均距离”,其含义可作如下理解:,标准差是样本平均数的一种平均距离,,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,一个样本中的个体与平均数之间的距离关系可用下图表示,:,考虑一个容量为,2,的样本,:,显然,标准差越大,则,a,越大,数据的离散程度越大,;,标准差越小,数据的离散程度越小,.,用计算器可算出甲,乙两人的的成绩的标准差,由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小,.,由此可以估计,乙比甲的射击成绩稳定,.,上面两组数据的离散程度与标准差之间的关系,可用图直观地表示出来,.,4,5,6,7,8,9,10,a,例题,1:,画出下列四组样本数据的直方图,说明它们的异同点,.,(1)5,5,5,5,5,5,5,5,5;,(2)4,4,4,5,5,5,6,6,6;,(3)3,3,4,4,5,6,6,7,7;,(4)2,2,2,2,5,8,8,8,8;,解,:,四组样本数据的直方图是,:,频率,o,1,2,3,4,5,6,7,8,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,S=0.00,(1),0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,(2),频率,o,1,2,3,4,5,6,7,8,S=0.82,频率,o,1,2,3,4,5,6,7,8,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,S=2.83,(,4,),1,2,3,4,5,6,7,8,频率,o,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,S=1.49,(,3,),例,2,甲乙两人同时生产内径为,25.40mm,的一种零件,.,为了对两人的生产质量进行评比,从他们生产的零件中各抽出,20,件,量得其内径尺寸如下,(,单位,:mm),甲,25.46,25.32,25.45,25.39,25.36,25.34,25.42,25.45,25.38,25.42,25.39,25.43,25.39,25.40,25.44,25.40,25.42,25.35,25.41,25.39,乙,25.40,25.43,25.44,25.48,25.48,25.47,25.49,25.49,25.36,25.34,25.33,25.43,25.43,25.32,25.47,25.31,25.32,25.32,25.32,25.48,从生产的零件内径的尺寸看,谁生产的质量较高,?,解,:,用计算器计算可得,:,练习:,1,、若,10,个正整数数据的平方和是,208,,平均数是,4,,,求这组数据的方差;,将这组数据同时减去,3,,求新数据的平均数与方差,.,2,、为了了解某班学生每周做家务劳动的时间,某综合实践活动,小组对该班,50,名学生进行了调查,有关数据如下表:,每周做家务的时间,(小时),0,1,1.5,2,2.5,3,3.5,4,人数(人),2,2,6,8,12,13,4,3,根据上表中的数据,回答下列问题:,(,1,)该班学生每周做家务劳动的平均时间是多少小时?,(,2,)这组数据的中位数、众数分别是多少,?,
展开阅读全文