资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,(一)众数、中位数、平均数,2.2.2 用样本的数字特征估计,总体的数字特征,一 众数、中位数、平均数的概念,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,.,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数,:,一组数据的算术平均数,即,甲在一次射击比赛中的得分如下,:(,单位,:,环,).7,8,6,8,6,5,9,10,7,5,则他命中的平均数是,_,中位数是,众数是,_,2.,某次数学试卷得分抽样中得到,:90,分的有,3,个人,80,分的有,10,人,70,分的有,5,人,60,分的有,2,人,则这次抽样的平均分为,_.,7.1,77,分,练习,7,5,,,6,,,7,,,8,问题,1,:,众数、中位数、平均数这三个数,一般都会来自于同一个总体或样本,它们,能表明总体或样本的什么性质?,平均数,:,反映所有数据的平均水平,众数,:,反映的往往是局部较集中的数据信息,中位数,:,是位置型数,反映处于中间部位的,数据信息,二、,众数、中位数、平均数与频率分布直方图的关系,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5,月平均用水量,(t),众数在样本数据的频率分布直方图中,,就是最高矩形的中点的横坐标。,如何在频率分布直方图中估计众数,可将众数看作直方图中面积最大长方形的“中心”,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率,组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和,=0.49,后四个小矩形的面积和,=0.26,2.02,如何在频率分布直方图中估计中位数,分组,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,频率,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,1,在样本中中位数的左右各有,50%,的样本数,,条形面积各为,0.5,所以反映在直方图中位数,左右的面积相等,.,,,中位数,),可将中位数看作整个直方图面积的“中心”,思考讨论以下问题:,1,、,2.02,这个中位数的估计值,与样本的中位数值,2.0,不一样,你能解释其中原因吗?,答:,2.02,这个中位数的估计值,与样本的中位数值,2.0,不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致,.,如何在频率分布直方图中估计平均数,=2.02,=2.02,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,可将平均数看作整个直方图面积的“重心”,例,1,:从甲、乙、丙三个厂家的同一种产品抽取,8,件,对其使用寿命进行追踪调查,结果如下:,甲:,3,4,5,6,8,,,8,8,10,乙:,4,6,6,6,8,9,12,13,丙:,3,3,4,7,9,10,11,12,三个厂家广告中均称该产品的使用寿命为,8,年,请根据结果判断厂家在广告中分别运用了那些特征数?,若不考虑其他因素,你会选择哪个厂家的产品,说出理由。,思考讨论以下问题:,2,、,样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?,答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。,对极端值不敏感有利的例子,:,例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。,缺点:(,1,)出现错误的数据也不知道;(,2,),对极端值不敏感有弊的例子:,某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:,很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。,这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业,.,例,1,某工厂人员及工资构成如下:,人员,经理,管理人员,高级技工,工人,学徒,合计,周工资,2200,250,220,200,100,人数,1,6,5,10,1,23,合计,2200,1500,1100,2000,100,6900,(,1,)指出这个问题中周工资的众数、中位数、平均数,(,2,)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,分析,:众数为,200,,中位数为,220,,平均数为,300,。,因平均数为,300,,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,三、,众数、中位数、平均数的简单应用,例,2,、下表是七位评委给某参赛选手的打分,总分为,10,分,,你认为如何计算这位选手的最后得分才较为合理?,评委,1,号,2,号,3,号,4,号,5,号,6,号,7,号,打分,9.6,9.3,9.3,9.6,9.9,9.3,9.4,提问:,1,、电视里评委是怎样给选手打分的?,2,、为什么这么做?直接取中位数和众数的值不好么?,特征数,众数,中位数,平均数,去掉一个最高分和最低分后的平均分,去掉两个最高分和最低分后的平均分,特征值,9,3,9,4,9,49,9,42,9,44,课堂练习:,1,、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市,26,条公路项目投资的平均资金数额,其中一条新公路的建设投资为,2 200,万元人民币,另外,25,个项目的投资在,20,万与,100,万中位数是,25,万,平均数是,100,万,众数是,20,万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?,选择平均数更好:因为,此时的众数,20,万比中位数,25,万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征,方差与标准差,(二),情境一,;,甲,.,乙两名射击队员,在进行的十次射击中成绩分别是,:,甲,:10;9;8;10;8;8;10;10;9.5;7.5,乙,:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5,试问二人谁发挥的水平较稳定,?,分析,:,甲的平均成绩是,9,环,.,乙的平均成绩也是,9,环,.,一,.,实例引入,情境二,:,某,农场种植了甲、乙两种玉米苗,从中各抽取了,10,株,分别测得它们的株高如下:,(,单位,cm),甲:,31 32 35 37 33 30 32 31 30 29,乙:,53 16 54 13 66 16 13 11 16 62,问,:,哪种玉米苗长得高?,哪种玉米苗长得齐?,怎么办呢?,甲,37,(最大值),29,(最小值),8,乙,66,(最大值),11,(最小值),55,极 差,甲,:,31 32 35 37 33 30 32 31 30 29,乙,:,53 16 54 13 66 16 13 11 16 62,甲,32,37,29,37,32,11,66,乙,极差:,一组数据的最大值与最小值的差,极差越大,数据越分散,越不稳定,极差越小,数据越集中,越稳定,极差体现了数据的,离散程度,离散程度,为了对两人射击水平的稳定程度,玉米生长的高度差异以及钢筋质量优劣做个合理的评价,这里我们引入了一个新的概念,:,方差和标准差,.,设一组样本数据 ,其平均数为 ,则,称,s,2,为这个样本的,方差,,,称为这个样本的,标准差,,分别称为样本方差、样本标准差,它的算术平方根,x,1,,,x,2,,,,,x,n,样本中各数据与样本平均数的差的平方和的平均数叫做,样本方差;,样本方差的算术平方根叫做,样本标准差,。样本方差和样本标准差都是衡量一个样本,波动大小,的量,样本方差或样本标准差越大,样本数据的波动就越大。,例,1.,计算数据,89,,,93,,,88,,,91,,,94,,,90,,,88,,,87,的方差和标准差。(标准差结果精确到,0.1,),解:,.,所以这组数据的方差为,5.5,,标准差为,2.3.,见课本,76-77,页,练习:若甲、乙两队比赛情况如下,下列说法哪些,说法是不正确的:,甲,乙,平均失球数,平均失球个数的标准差,1.5,2.1,1.1,0.4,1,、平均来说,甲的技术比乙的技术好;,2,、乙比甲技术更稳定;,3,、甲队有时表现差,有时表现好;,4,、乙队很少不失球。,全对,例,2,:甲、乙两种水稻试验品种连续,5,年的平均单位面积产量如下(单位:,t/hm,),,试根据这组数据估计哪一种水稻品种的产量比较稳定,品种,第一年,第二年,第三年,第四年,第,五,年,甲,9,8,9,9,10,1,10,10,2,乙,9,4,10,3,10,8,9,7,9,8,解:,1,、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:,9.4,,,8.4,,,9.4,,,9.9,,,9.6,,,9.4,,,9.7,,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为,_,;,9.5,,,0.016,三,.,当堂反馈,
展开阅读全文