资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,(一)众数、中位数、平均数,2.2.2,用样本的数字特征估计,总体的数字特征,一 众数、中位数、平均数的概念,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,.,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数,:,一组数据的算术平均数,即,问题,1,:,众数、中位数、平均数这三个数,一般都会来自于同一个总体或样本,它们,能表明总体或样本的什么性质?,平均数,:,反映所有数据的平均水平,众数,:,反映的往往是局部较集中的数据信息,中位数,:,是位置型数,反映处于中间部位的,数据信息,1,、求下列各组数据的众数,(,1,)、,1,,,2,,,3,,,3,,,3,,,5,,,5,,,8,,,8,,,8,,,9,,,9,众数是:,3,和,8,(,2,)、,1,,,2,,,3,,,3,,,3,,,5,,,5,,,8,,,8,,,9,,,9,众数是:,3,2,、求下列各组数据的中位数,(,1,)、,1,,,2,,,3,,,3,,,3,,,4,,,6,,,8,,,8,,,8,,,9,,,9,(,2,),1,,,2,,,3,,,3,,,3,,,4,,,8,,,8,,,8,,,9,,,9,中位数是:,5,中位数是:,4,3,、在一次中学生田径运动会上,参加男子跳高的,17,名运动员的成绩如下表所示:,成绩,(,米,),1,50,1,60,1,65,1,70,1,75,1,80,1,85,1,90,人数,2,3,2,3,4,1,1,1,分别求这些运动员成绩的众数,中位数与平均数。,解:在,17,个数据中,,1.75,出现了,4,次,出现的次数最多,即这组数据的众数是,1.75,上面表里的,17,个数据可看成是按从小到大的顺序排列的,其中第,9,个数据,1.70,是最中间的一个数据,即这组数据的中位数是,1.70,;,答:,17,名运动员成绩的众数、中位数、平均数依次是,1.75,(米)、,1.70,(米)、,1.69,(米)。,这组数据的平均数是,二、众数、中位数、平均数与频率分布直方图的关系,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5,月平均用水量,(t),众数在样本数据的频率分布直方图中,,就是最高矩形的中点的横坐标。,如何在频率分布直方图中估计众数,可将众数看作直方图中面积最大长方形的“中心”,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和,=0.49,后四个小矩形的面积和,=0.26,2.02,如何在频率分布直方图中估计中位数,分组,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,频率,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,1,在样本中,中位数的左右各有,50%,的样本数,,所以反映在频率分布直方图中,中位数左右两边的直方图的面积相等,各为,0.5,。,,,中位数,),可将中位数看作整个直方图面积的“中心”,思考讨论以下问题:,1,、,2.02,这个中位数的估计值,与样本的中位数值,2.0,不一样,你能解释其中原因吗?,答:,2.02,这个中位数的估计值,与样本的中位数值,2.0,不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致,.,如何在频率分布直方图中估计平均数,=2.02,=2.02,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,可将平均数看作整个直方图面积的“重心”,规律方法根据样本频率分布直方图,可以分别估计总体的众数、中位数和平均数,(1),众数:最高矩形下端中点的横坐标;,(2),中位数:直方图面积平分线与横轴交点的横坐标,(3),平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和,思考讨论以下问题:,2,、,样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?,答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。,对极端值不敏感有利的例子,:,例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。,缺点:(,1,)出现错误的数据也不知道;(,2,),对极端值不敏感有弊的例子:,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:,很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。,这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业,.,例,1,、下表是七位评委给某参赛选手的打分,总分为,10,分,,你认为如何计算这位选手的最后得分才较为合理?,评委,1,号,2,号,3,号,4,号,5,号,6,号,7,号,打分,9.6,9.3,9.3,9.6,9.9,9.3,9.4,提问:,1,、电视里评委是怎样给选手打分的?,2,、为什么这么做?直接取中位数和众数的值不好么?,三、,众数、中位数、平均数的简单应用,特征数,众数,中位数,平均数,去掉一个最高分和最低分后的平均分,去掉两个最高分和最低分后的平均分,特征值,9,3,9,4,9,49,9,42,9,44,1,下面是高一,(18),班十位同学的数学测试成绩:,82,,,91,,,73,,,84,,,98,,,99,,,101,,,118,,,98,,,110,,则该组数据的中位数是,(,),A,98 B,99 C,98.5 D,97.5,答案,A,频率分布与数字特征的综合应用,例,2,已知一组数据:,125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126,128,(1),填写下面的频率分布表:,分组,频数,频率,121,123),123,125),125,127),127,129),129,131,合计,(2),作出频率分布直方图;,(3),根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数,解,(1),分组,频数,频率,121,,,123),2,0.1,123,,,125),3,0.15,125,,,127),8,0.4,127,,,129),4,0.2,129,,,131,3,0.15,合计,20,1,(2),规律方法,1.,利用频率分布直方图估计数字特征:,(1),众数是最高的矩形的底边的中点,(2),中位数左右两侧直方图的面积相等,(3),平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和,2,利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致,例,3,某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是,0.30,、,0.40,、,0.15,、,0.10,、,0.05.,求:,(1),高一参赛学生的成绩的众数、中位数,(2),高一参赛学生的平均成绩,解,(1),由图可知众数为,65,,,又第一个小矩形的面积为,0.3,,,设中位数为,60,x,,则,0.3,x,0.04,0.5,,得,x,5,,,中位数为,60,5,65.,(2),依题意,平均成绩为,550.3,650.4,750.15,850.1,950.05,67,,平均成绩约为,67.,课堂练习:,1,、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市,26,条公路项目投资的平均资金数额,其中一条新公路的建设投资为,2 200,万元人民币,另外,25,个项目的投资在,20,万与,100,万中位数是,25,万,平均数是,100,万,众数是,20,万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?,选择平均数更好:因为,此时的众数,20,万比中位数,25,万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征,
展开阅读全文