2.2.2用样本的数字特征估计总体的数字特征(一)

上传人:沈*** 文档编号:167552046 上传时间:2022-11-03 格式:PPT 页数:21 大小:433.50KB
返回 下载 相关 举报
2.2.2用样本的数字特征估计总体的数字特征(一)_第1页
第1页 / 共21页
2.2.2用样本的数字特征估计总体的数字特征(一)_第2页
第2页 / 共21页
2.2.2用样本的数字特征估计总体的数字特征(一)_第3页
第3页 / 共21页
点击查看更多>>
资源描述
问题提出问题提出1.1.对一个未知总体,我们已经学过的用样本分布估计总对一个未知总体,我们已经学过的用样本分布估计总体分布的方法有哪些?体分布的方法有哪些?2.2.它们各有什么优缺点?它们各有什么优缺点?频率分布表和频率分布直方图能够很容易表示大量数频率分布表和频率分布直方图能够很容易表示大量数据,据,非常直观非常直观地表明其分布形状,使我们能够看到许多地表明其分布形状,使我们能够看到许多隐藏在数据后的信息,但是,隐藏在数据后的信息,但是,损失了一些样本数据的信损失了一些样本数据的信息,不能保留原有数据。息,不能保留原有数据。茎茎叶叶图由所有样本数据组成,没有损失任何样本信息,图由所有样本数据组成,没有损失任何样本信息,可以在抽样过程中随时记录,但是,只能适用于样本容可以在抽样过程中随时记录,但是,只能适用于样本容量较小时。量较小时。平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中数中数:将一组数据按:将一组数据按大小依次大小依次排列,把排列,把处在最处在最中间位置的一个数据中间位置的一个数据(或(或最中间两个最中间两个数据的平均数数据的平均数)叫做这组数据的)叫做这组数据的中位数中位数 众数众数:在一组数据中,出现次数最多:在一组数据中,出现次数最多的数据叫做这组数据的的数据叫做这组数据的众数众数)xxx(n1n21平均数平均数中位数中位数众数众数探究探究1 1:众数、中位数和平均数:众数、中位数和平均数 思考思考1 1:如何从频率分布直方图中估计众数、中位数、平如何从频率分布直方图中估计众数、中位数、平均数?均数?思考思考2 2:在城市居民月均用水量样本数据的频率分布直方在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?数是什么?月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.50.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数.思考思考4 4:在城市居民月均用水量样本数据的频率分布直方在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是图中,从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计由此估计总体的中位数是什么?总体的中位数是什么?月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,设小矩形的宽为,则:,设小矩形的宽为,则:0.50.50.010.01,得,得0.020.02,所以中位数是,所以中位数是+0.02+0.022.02.2.02.思考思考3:3:在频率分布直方图中在频率分布直方图中,每个小矩形的面积表示什么每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?中位数左右两侧的直方图的面积应有什么关系?思考思考5 5:平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,在下面的,在下面的频率分布直方图中,各个小矩形的重心在哪里?从直方图频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?估计总体在各组数据内的平均数分别为多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.月均月均用水量用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O样本数据的估计平均数就是将频率分布直方图中样本数据的估计平均数就是将频率分布直方图中每个小矩每个小矩形的面积与形的面积与小矩形底边中点的横坐标小矩形底边中点的横坐标之积相加之积相加.由此估计由此估计总体的平均数就是总体的平均数就是0.250.250.040.04+0.750.750.080.08+1.251.250.150.15+1.751.750.220.22+2.252.250.250.25+2.752.750.140.14+3.253.250.060.06+3.753.750.040.04+4.254.250.00.02 2=2.02=2.02(t t).思考思考6 6:从居民月均用水量样本数据可知,该样本的众数从居民月均用水量样本数据可知,该样本的众数是是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.973,1.973,这与我们从样本频这与我们从样本频率分布直方图得出的结论有偏差率分布直方图得出的结论有偏差,你能解释一下原因吗?你能解释一下原因吗?在制作频率分布直方图在制作频率分布直方图“丢失丢失”了一些样本数据,了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关得到的是一个估计值,且所得估计值与数据分组有关.注注:在只有样本频率分布直方图的情况下,才可按上述方在只有样本频率分布直方图的情况下,才可按上述方法估计众数、中位数和平均数法估计众数、中位数和平均数,并由此估计总体特征并由此估计总体特征.平均数大于(或小于)中位数,说明样本数据中存在平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值许多较大(或较小)的极端值.这句话具有模糊性甚至蒙骗性,其中收入水平是员工这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数工资的某个中心点,它可以是众数、中位数或平均数.样本数据的样本数据的平均数大于(或小平均数大于(或小于)中位数于)中位数说明什么问题?说明什么问题?思考思考7 7:一组数据的中位数一般不受少数几个极端值的影一组数据的中位数一般不受少数几个极端值的影响,在某些情况下是一个优点,但它对极端值的不敏感有响,在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点时也会成为缺点,你能理解下例中你能理解下例中“我们单位的收入水平我们单位的收入水平比别的单位高比别的单位高”这句话的含义?这句话的含义?1 1、众数体现了样本数据的最、众数体现了样本数据的最大集中点,但它对其它数据信息的大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。忽视使得无法客观地反映总体特征。如上例中众数是如上例中众数是2.25t,2.25t,它告诉它告诉我们,月均用水量为我们,月均用水量为2.25t2.25t的居民数的居民数比月均用水量为其它数值的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少。多,但它并没有告诉我们多多少。二、三种数字特征的优缺点:二、三种数字特征的优缺点:2 2、中位数是样本数据所占频率的、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水如上例中假设有某一用户月均用水量为量为1000t1000t,那么它所占频率为,那么它所占频率为0.01,0.01,几乎不影响中位数几乎不影响中位数,但显然这一极端值但显然这一极端值是不能忽视的。是不能忽视的。3 3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。数、中位数都不具有的性质。与众数、中位数比较起来,平均数可与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。使平均数在估计时可靠性降低。三种数字特征的优缺点三种数字特征的优缺点练习(课本第练习(课本第7474页)页)答:应该采用平均数来表示每一个国家项目答:应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据平均数会受到极端数据22002200万元的影响,所以大万元的影响,所以大多数项目投资金额都和平均数相差比较大。多数项目投资金额都和平均数相差比较大。三三、众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例1 某工厂人员及工资构成如下:某工厂人员及工资构成如下:(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么?分析分析:众数为:众数为200,中位数为,中位数为220,平均数为平均数为300。因平均数为因平均数为300,由表格中所列出的数据,由表格中所列出的数据可见,只有经理在平均数以上,其余的人可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。实地反映该工厂的工资水平。.,:均均睡睡眠眠时时间间试试估估计计该该校校学学生生的的日日平平单单位位表表时时间间的的抽抽样样频频率率分分布布下下面面是是某某校校学学生生日日睡睡眠眠例例h2110002029580606588370377.5,833033577170177560505566计计合合率率频频数数人人睡眠时间睡眠时间.,.,.,.,.,.,.,值近似地表示可以用各组区间的组中是一个范围时间只由于每组中的个体睡眠计算其总睡眠时间必须就时间眠名学生的平均睡要确这分析100.h397睡眠时间约为估计该校学生的日平均答.h397故平均睡眠时间约为.h3970207580602583707573302571707560502562积的和求组中值与对应频率之解法 16.25 5 6.75 17 7.25 33 7.75 37 8.25 68.75 2739.h 解法总睡眠时间约为.%,%,%,%,%均年收入均年收入试估计该单位职工的平试估计该单位职工的平和和别为别为间的职工所占的比例分间的职工所占的比例分元之元之到到及及到到、到到、到到、到到、到到、到到某单位年收入在某单位年收入在例例510152520151050000400004000035000350003000030000250002500020000200000001500015000103.%元年收入为估计该单位职工的平均解26125545000103750015325002527500202250015175001012500.元约为估计该单位人均年收入答26125练习练习:”八八.一一”前夕前夕,某中学举行国防知识竞赛某中学举行国防知识竞赛:满分为满分为100分分,80分以上为优秀分以上为优秀,现将高一的两个班参赛学生的现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直成绩进行整理后分成五组绘制成如图所示的频率分布直方图方图,已知图中从左到右的第一、第二、第三、第四、已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是第五小组的频率分别是0.3,0.4,0.15,0.1,0.05 求:求:(1)成绩的众数、)成绩的众数、中位数;中位数;(2)平均成绩)平均成绩50 60 70809010000.0050.0100.0150.030.04(1)65,65(2)67
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!