资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2.2,用样本的数字特征,估计总体的数字特征,在一次射击比赛中,甲、乙两名运动员各射击,10,次,命中环数如下,甲运动员,7,,,8,,,6,,,8,,,6,,,5,,,8,,,10,,,7,,,4,;,乙运动员,9,,,5,,,7,,,8,,,7,,,6,,,8,,,6,,,7,,,7.,观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。,用样本的数字特征估计总体的数字特征。,创设意境,一 、复习众数、中位数、平均数的概念,2、,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,1、,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,众数、中位数、平均数,都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.,3、平均数,:一般地,如果n个数 ,那,么,叫做这n个数的平均数。,1、求下列各组数据的,众数,(1)、1,2,3,3,3,5,5,8,8,8,9,9,众数是:3和8,(2)、1,2,3,3,3,5,5,8,8,9,9,众数是:3,2、求下列各组数据的,中位数,(1)、1,2,3,3,3,4,6,8,8,8,9,9,(2)1,2,3,3,3,4,8,8,8,9,9,中位数是:5,中位数是:4,巩固练习,3.,求下列,10,个数字的平均数,5、5、5、6、6、6、6、7、7、7,解:,也可以说平均数为各个不同,数字乘以相应频率之和。,众数、中位数、平均数的简单应用,例,1,:,某工厂人员及工资构成如下:,人员,经理,管理人员,高级技工,工人,学徒,合计,周工资,2200,250,220,200,100,人数,1,6,5,10,1,23,合计,2200,1500,1100,2000,100,6900,(,1,)指出这个问题中周工资的众数、中位数、平均数,(,2,)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,众数:,200,中位数:,220,平均数:,300,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,二、三种数字特征的优缺点,1、,众数体现了样本数据的最大集中点,但它,对其它数据信息的忽视,使得无法客观地反映总体特征。,2、,中位数是样本数据所占频率的等分线,它,不受,少数几个极端值的影响,这在某些情况下是优点,但它,对极端值的不敏感,有时也会成为缺点。,3、,平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数,受数据中的极端值的影响较大,,使平均数在估计时可靠性降低。,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:,在抽样调查的100位居民的月均用水量的数据中,我们得知这一组样本数据的,,,并画出这组数据的频率分布直方图.,众数 =2.3(t),中位数=2.0(t),平均数=2.0(t),现在,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?,众数、中位数和平均数,三:,众数,.,中位数,.,平均数与频率分布直方图的关系,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,2.25,1.,你能从频率分布直方图里面得出众数吗?,1,众数:,在频率分布直方图中,就是最高矩形的中点的横坐标,思考:,2.,25,这个,众,数的估计值,与样本的,众,数值2.,3,不一样,你能解释其中原因吗?,答:,2.,25,这个,众,数的估计值,与样本的,众,数值2.,3,不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息,。,所以由频率分布直方图得到的,众,数估计值往往与样本的实际,众,数值不一致.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:中位数左边的,数据个数,与右边的,数据个数,是相等的。,2.,你能从直方图里面得出中位数吗?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和=0.49,后四个小矩形的面积和=0.26,2.02,分析总结得:,在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,,因此,,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表50个单位,它们的分界线与x轴交点的横坐标就是中位数,。,中位数,在样本数据的频率分布直方图中,就是,把频率分布直方图划分为左右两个面积相等的分界线与x轴交点的横坐标。,思考讨论以下问题:,2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:,2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息,。,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,思考,:在频率分布直方图中,各个组的平均数如何找?,3.,你能从直方图里面得出平均数吗?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.25,求解过程,:,平均数为,2.02,为什么这样去求?,上,面介绍过平均数为各个不同数字乘以相应频率之和。,在频率分布直方图中,没有原始数据,我们取每个,小矩形底边中点的横坐标代表各组数据的平均数。,总结归纳得:,平均数是频率分布直方图的“重心”,是直方图的平衡点。,先找出每个小长方形的“重心”,即每小组的平均数,再按比例算出直方图的平均数。,平均数,在样本数据的频率分布直方中,等于,频率分布直方图中每个小长方形面积乘以小矩形底边中点的横坐标之和。,方图如图所示,根据直方图求该班学生成绩的众数,.,中位数,.,平均数各是多少。,作业:,样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中,众数,和,中位数,容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,.,平均数,代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大,.,当样本数据质量比较差,时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的,离散程度,.,例:有两位射击运动员在一次射击测试中各射靶,10,次,每次命中的环数如下:,甲:,乙:,如果你是教练,你应当如何对这次射击作出评价,?,如果要选一位运动员去比赛,该选谁?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的,.,那么两个人的水平就没有什么差异吗,?,标准差,思考:,甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?,环数,频率,0.4,0.3,0.2,0.1,4 5 6 7 8 9 10,O,(甲),环数,频率,0.4,0.3,0.2,0.1,4 5 6 7 8 9 10,O,(乙),甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定,.,甲,10,(最大值),4,(最小值),6,乙,9,(最大值),5,(最小值),4,甲:,乙:,极 差:,极差越大,数据越分散,越不稳定,极差越小,数据越集中,越稳定,极差体现了数据的,离散程度,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的,集中程度,差异不大时,就不容易得出结论。,考察样本数据的分散程度的大小,最常用的统计量是,方差和标准差,。,标准差,定义,:,标准差是样本数据到平均数的一种平均距离,常用,s,表示,.,1.,平均距离,假设样本 数据是,表示这组数据的平,均数,到 的距离是,于是,样本数据 到 的,”,平均距离,”,是,:,2.,标准差,练习,:,求数据,1,2,3,4,5,的平均数与标准差,.,标准差的取值范围是什么,?,标准差为,0,的样本数据有什么特点,?,标准差是怎样表现数据的离散程度的,?,标准差的取值范围,:,0,+),标准差为,0,的样本数据都等于样本平均数,.,标准差反映了各个样本数据聚集于样本平均数周围的程度,:,标准差越大,表明数据的离散程度就越大,;,反之,标准差越小,表明各数据的离散程度就越小,.,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。,标准差的作用,:,返回引例,例,2,:,甲乙两人同时生产内径为,25.40mm,的一种零件,.,为了对两人的生产质量进行评比,从他们生产的零件中各抽出,20,件,量得其内径尺寸如下(单位:,mm),甲,乙,从生产的零件内径的尺寸来看,谁生产的质量较高?,X,甲,25.401,X,乙,25.406,s,甲,25.401,S,乙,25.401,解,:,依题意计算可得,x,1,=900 x,2,=900 s,1,23.8 s,2,42.6,甲乙两种水稻,6,年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定,.,练习,课本,P79,练习,解,:,(1),平均重量约为,496.86 g,标准差约为,6.55,(2),重量位于,(,x-s,x+s,),之间有,14,袋白糖,所占,百分比为,66.67%.,解,:,平均数,x19.25,中位数为,15.2,标准差,s12.50.,这些数据表明这些国家男性患该病的平均死亡率约为,19.25,有一半国家的死亡率不超过,15.2,x 15.2,说,明存在大的异常数据,这些异常数据使得标准差增大,.,
展开阅读全文