用样本的频率分布估计总体分布课件

上传人:仙*** 文档编号:241563994 上传时间:2024-07-04 格式:PPT 页数:44 大小:3.44MB
返回 下载 相关 举报
用样本的频率分布估计总体分布课件_第1页
第1页 / 共44页
用样本的频率分布估计总体分布课件_第2页
第2页 / 共44页
用样本的频率分布估计总体分布课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布我国是世界上严重缺水的国家之一,城市缺水问题较我国是世界上严重缺水的国家之一,城市缺水问题较为突出为突出.为了节约生活用水,某市政府计划在本市试行为了节约生活用水,某市政府计划在本市试行居民生活用水定额管理,即确定一个居民月用水量居民生活用水定额管理,即确定一个居民月用水量标准标准a,a,用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按议价收费的部分按议价收费.(1)(1)如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那么标准么标准a a定为多少比较合理呢?定为多少比较合理呢?(2)(2)为了较合理地确定这个标准,你认为需要做哪为了较合理地确定这个标准,你认为需要做哪些工作?些工作?3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 这些数字告诉我们什么信息?这些数字告诉我们什么信息?假设通过抽样,我们获得了假设通过抽样,我们获得了100100位居民某年的月平均位居民某年的月平均用水量用水量(单位:单位:t)t),如下表:,如下表:很容易发现的是一个居民月均用水量的最小值是很容易发现的是一个居民月均用水量的最小值是0.2t0.2t,最大值是,最大值是4.3t4.3t,其他在,其他在0.2t0.2t4.3t4.3t之间之间.分析数据的一种基本方法是用图将它们画出来,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式或者用紧凑的表格改变数据的排列方式.初中我们曾经初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数知道数据分布在各个小组的个数.下面将要学习的频率分布表和频率分布图,则是下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律来表示数据分布的规律.它可以使我们看到整个样本数据的它可以使我们看到整个样本数据的频率分布频率分布情况情况.频率分布表和频率分布直方图频率分布表和频率分布直方图(1 1)求极差(一组数据中的最大值与最小值的差)求极差(一组数据中的最大值与最小值的差).例如,例如,4.3-0.2=4.14.3-0.2=4.1,说明样本数据的变化范围是,说明样本数据的变化范围是4.1 t.4.1 t.(2 2)决定组距与组数)决定组距与组数.设设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数,否则,组数=k+1.=k+1.1 1为方便起见,组距的选择应力求为方便起见,组距的选择应力求“取整取整”.在本问在本问题中,如果取组距为题中,如果取组距为0.50.5(t)t),那么,那么组数组数=极差极差组距组距=4.1 0.5=8.2=4.1 0.5=8.2,因此可以将数据分为因此可以将数据分为9 9组,这个组数是比较合适的,组,这个组数是比较合适的,于是取组距为于是取组距为0.50.5,组数为,组数为9.9.(4 4)列频率分布表)列频率分布表.计算各小组的频率,作出下面的计算各小组的频率,作出下面的频率分布表频率分布表.(频数(频数=样本数据落在各小组内的个数样本数据落在各小组内的个数,频率频率=频频数数样本容量)样本容量)(3 3)将数据分组)将数据分组.以组距为以组距为0.50.5将数据分组时,可以分成以下将数据分组时,可以分成以下9 9组:组:0,0.5),0.5,1),0,0.5),0.5,1),4,4.5.,4,4.5.列频率分布表列频率分布表:48152225146420.040.080.150.220.250.140.060.041001.00频率频率=样本容量样本容量频数频数注意注意:频数的合计应是样本容量,频率合计应是频数的合计应是样本容量,频率合计应是1.1.0.02频率频率/组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04频率分布表一般分频率分布表一般分“分组分组”,“频数频数累计累计”(可省),(可省),“频数频数”,“频率频率”,“,“频率频率/组距组距”五列,最后一五列,最后一行是合计行是合计(5)(5)画频率分布直方图画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图根据频率分布表可以得到如图所示的频率分布直方图:月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234注意横坐标注意横坐标与纵坐标与纵坐标注意注意(2)纵坐标为纵坐标为频率分布是指一个样本数据在各个小范围内所占频率分布是指一个样本数据在各个小范围内所占比例的大小比例的大小.一般用频率分布直方图来反映样本的一般用频率分布直方图来反映样本的频率分布频率分布.【总结提升总结提升】频率分布直方图画法:频率分布直方图画法:第一步:第一步:画平面直角坐标系画平面直角坐标系.第二步:第二步:在横轴上均匀标出各组分点,在纵轴上标在横轴上均匀标出各组分点,在纵轴上标出单位长度出单位长度.第三步:第三步:以组距为宽,各组的频率与组距的商为高,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形分别画出各组对应的小长方形.宽度:组距宽度:组距高度:高度:频率频率组距组距月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234 你能根据上你能根据上述频率分布直方述频率分布直方图指出居民月均图指出居民月均用水量的一些数用水量的一些数据特点吗?据特点吗?各小长方形的面积之和是否为定值?各小长方形的面积之和是否为定值?各组的频率在图中哪里显示出来?各组的频率在图中哪里显示出来?频率频率组距组距各小长方形的面积各小长方形的面积=组距组距 =频率频率.各小长方形的面积之和为各小长方形的面积之和为1.1.考点一频率分布直方图 1 宽度:组距宽度:组距高度:高度:频率频率组距组距月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234 你能根据上你能根据上述频率分布直方述频率分布直方图指出居民月均图指出居民月均用水量的一些数用水量的一些数据特点吗?据特点吗?各小长方形的面积之和是否为定值?各小长方形的面积之和是否为定值?各组的频率在图中哪里显示出来?各组的频率在图中哪里显示出来?频率频率组距组距各小长方形的面积各小长方形的面积=组距组距 =频率频率.各小长方形的面积之和为各小长方形的面积之和为1.1.(2 2)大部分居民的月均用水量集中在一个中间值附)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性)居民月均用水量的分布有一定的对称性.频率分布直方图非常直观地表明了样本数据的分布频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来数据模式,但原始数据不能在图中表示出来.(1 1)居民月均用水量的分布是呈)居民月均用水量的分布是呈“山峰山峰”状的,状的,而且是而且是“单峰单峰”的;的;【即时练习即时练习】考点一 如果市政府希望如果市政府希望85%85%以上的居民每月的用水量不以上的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月超过标准,根据上述频率分布表,你对制定居民月用水量标准(即用水量标准(即a a的取值)有何建议?的取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t3t以下,标准可定为以下,标准可定为3t.3t.在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上的居民用水不以上的居民用水不超标吗?超标吗?在实际中,对统计结论是需要进行评价的在实际中,对统计结论是需要进行评价的.2 2 统计评价统计评价有一个容量为有一个容量为5050的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.512.5,15.5)3 315.5,18.515.5,18.5)8 818.5,21.518.5,21.5)9 921.5,24.521.5,24.5)11 1124.5,27.524.5,27.5)10 1027.5,30.527.5,30.5)5 530.5,33.530.5,33.5)4 4(1)(1)列出样本的频率分布表列出样本的频率分布表;(2)(2)画出频率分布直方图画出频率分布直方图;(3)(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.515.5,24.5)的百分比是多少的百分比是多少?【即时训练即时训练】【解析解析】(1 1)组距为)组距为3 3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070(2)18.5 21.5 24.5 27.5 30.5 33.5(3)56%频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t/t0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中各连接频率分布直方图中各小长方形上端的中点小长方形上端的中点,得到得到频率分布折线图频率分布折线图.o频率频率/组距组距利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计:(1 1)上例的样本容量为)上例的样本容量为100100,如果增至,如果增至1 0001 000,其,其频率分布直方图的情况会有什么变化?假如增至频率分布直方图的情况会有什么变化?假如增至10 00010 000呢?呢?(2 2)样本容量越大,这种估计越精确)样本容量越大,这种估计越精确.(3 3)当样本容量无限增大,组距无限缩小,那么)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线频率折线图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线.总体密度曲线总体密度曲线月均用水量月均用水量/t/tab(图中阴影部分的面积,表示总体在某个区间(图中阴影部分的面积,表示总体在某个区间 (a,b)a,b)内取值的百分比)内取值的百分比).o频率频率/组距组距总体密度曲线总体密度曲线总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律,是研究总体精确地反映了总体的分布规律,是研究总体分布的工具分布的工具.用样本频率分布直方图去估计相应的总体分布用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的规律,即越精确地反映了总体在各个范围内取值的百分比百分比.茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:记录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.49,24,12,31,50,31,44,36,15,37,25,36,39.茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 83 8 9 1叶就是从茎叶就是从茎的旁边生长的旁边生长出来的数,出来的数,表示得分的表示得分的个位数字个位数字茎是指茎是指中间的中间的一列数,一列数,表示得表示得分的十分的十位数字位数字 从运动员的成绩的分布来看,乙运动员的成绩从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定分更集中于峰值附近,说明乙运动员的发挥更稳定.茎叶图的优、缺点:茎叶图的优、缺点:在样本数据较少时,用茎叶图表示数据的效果在样本数据较少时,用茎叶图表示数据的效果较好较好.它不但可以保留所有信息,而且可以随时记录,它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便这对数据的记录和表示都能带来方便.但当样本数据较多时,茎叶图就显得不太方便但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在茎叶图中占据一个空间,如因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长果数据很多,枝叶就会很长.某班的全体学生参加英语测试,成绩的频率分布直方某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为图如图,数据的分组依次为若低于若低于6060分的人数是分的人数是1515,则该班的学生人数是则该班的学生人数是()()A.45 B.50 C.55 D.60A.45 B.50 C.55 D.60成绩成绩/分分【即时训练即时训练】【解析解析】选选B.B.由由频率分布直方图,计算出低于频率分布直方图,计算出低于6060分的人数的频率(前两个小矩形的面积)分的人数的频率(前两个小矩形的面积)P=200.005+200.01=0.3P=200.005+200.01=0.3,则总人数为则总人数为150.3=50150.3=50,故选故选B.B.1.1.将样本容量为将样本容量为100100的数据按从大到小的顺序分为的数据按从大到小的顺序分为8 8组组如下表:如下表:9 91212131315151414141413131010频数频数8 87 76 65 54 43 32 21 1组号组号则第三组的频率为(则第三组的频率为()A.0.14 B.1/14 C.0.03 D.3/14A.0.14 B.1/14 C.0.03 D.3/14B BD D5.5.甲、乙两个班级各随机选出甲、乙两个班级各随机选出1515名同学进行测验,成名同学进行测验,成绩的茎叶图如图所示绩的茎叶图如图所示.则甲、乙两班的最高成绩分别则甲、乙两班的最高成绩分别是是 _,_._,_.从图中看从图中看 _班的平均成绩班的平均成绩较高较高.96969292乙乙6.6.某地区为了了解知识分子的年龄结构,随机抽样某地区为了了解知识分子的年龄结构,随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3838,2929,3636,4141,4343,5454,4343,3434,4444,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表列出样本频率分布表.(2)(2)画出频率分布直方图画出频率分布直方图.(3)(3)估计年龄在估计年龄在3232岁岁5252岁的知识分子所占的比例约岁的知识分子所占的比例约是多少是多少.【解析解析】(1)1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)9 0.189 0.18 42 42,4747)16 0.3216 0.32 47 47,5252)7 0.147 0.14 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 62 62,67 3 0.0667 3 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67O O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在,故年龄在3232岁岁5252岁的知识分子约占岁的知识分子约占70%.70%.频率频率/组距组距总总体体分分布布数据较多时数据较多时数据较少时数据较少时样样本本的的频频率率分分布布估计估计频率分布表频率分布表频率分布直方图频率分布直方图茎叶图茎叶图 即使一次次的跌倒,我们依然成长.跌倒只是我们成长道路上的一个小小的插曲.
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!