资源描述
,用样本的,频率分布,估计总体分布,(,一,),(1),统计的核心问题,:,如何根据样本的情况对总体的情况作出推断,复习引入,:,简单随机抽样 系统抽样 分层抽样,(,3,)通过抽样方法收集数据的目的是什么?,从中寻找所包含的信息,用样本去估计总体,(2),随机抽样的几种常用方法,:,知识探究(一):频率分布表,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,,用水量不超过,a,的部分按平价收费,超出,a,的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准,a,定为多少比较合理呢?,探究,:,你认为,为了了较为合理地确定出这个标准,需要做哪些工作?,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,,用水量不超过,a,的部分按平价收费,超出,a,的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准,a,定为多少比较合理呢?,探究,:,采用抽样调查的方式获得样本数据,分析样本数据来估计全市居民用水量的分布情况,下表给出,100,位居民的月均用水量表,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式,讨论:如何分析数据?,根据这些数据你能得出用水量其他信息吗,?,为此我们要对这些数据进行整理与分析,一频率分布的概念:,频率分布,是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布,二画,频率分布直方图,其,一般步骤,为,(,1,)计算一组数据中最大值与最小值的差,即求极差,(,2,)决定组距与组数,(,3,)将数据分组,(,4,)列频率分布表,(,5,)画频率分布直方图,第一步,:,求极差,:,(,数据组中最大值与最小值的差距,),最大值,=4.3,最小值,=0.2,所以极差,=4.3-0.2=4.1,第二步,:,决定组距与组数,:,(强调取整),当样本容量不超过,100,时,按照数据的多少,常分成,512,组,.,为方便组距的选择应力求,”,取整,”,.,本题如果组距为,0.5(t).,则,第三步,:,将数据分组:,(,给出组的界限,),所以将数据分成,9,组较合适,.,0,0.5),0.5,1),1,1.5),4,4.5),共,9,组,.,分 组 频数累计 频数 频率,0,,,0.5,),4 0.04,0.5,,,1,),正,8 0.08,1,,,1.5,),正 正 正,15 0.15,1.5,,,2,),正 正 正 正,22 0.22,2,,,2.5,),正 正 正 正 正,25 0.25,2.5,,,3,),正 正,14 0.14,3,,,3.5,),正 一,6 0.06,3.5,,,4,),4 0.04,4,,,4.5 2 0.02,合计,100 1.00,第四步,:,列频率分布表,.,第四步,:,列频率分布表,.,分组,频数,频率,频率,/,组距,0-0.5),4,0.5-1),8,1-1.5),15,1.5-2),22,2-2.5),25,2.5-3),15,3-3.5),5,3.5-4),4,4-4.5),2,合计,100,组距,=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.3,0.15,0.05,想一想,知识探究(二):频率分布直方图,0,0.1,0.2,0.3,0.4,0.5,0.6,0.5 1 1.5 2 2.5 3 3.5 4 4.5,第五步,:,画出频率分布直方图,.,频率,/,组距,月均用水量,/t,(,组距,=0.5),0.08,0.16,0.3,0.44,0.5,0.3,0.1,0.08,0.04,小长方形的面积,=?,小长方形的面积总和,=?,月均用水量最多的在哪个区间,?,请大家阅读第,68,页,直方图有哪些优点和缺点,?,注:小长方形的面积组距,频率,/,组距频率,各长方形的面积总和等于,1,。,频率分布直方图的特征:,从频率分布直方图可以清楚的看出数据分布的总体趋势。,从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况,.,数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多,.,当样本容量不超过,100,时,按照数据的多少,常分成,5,12,组,.,(,1,)居民月均用水量的分布是,“,山峰,”,状的,而且是,“,单峰,”,的;,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,(,2,)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(,3,)居民月均用水量的分布有一定的对称性等,.,居民月均用水量的一些数据特点,思考,:,1.,频率分布表与频率分布直方图的区别?,频率分布表,列出的是在各个不同区间内取值的频率。,频率分布直方图,是用小长方形面积的大小来表示在各个区间内取值的频率,。,2.,如果当地政府希望使,85%,以上的居民每月的用水量不,超出标准,根据频率分布表,2-2,和频率分布直方图,2.2-1,,,你能对制定月用水量标准提出建议吗?,与分组数(或组距)及坐标系的单位长度有关,.,月均用水量,/t,频率,组距,0.4,0.3,0.2,0.1,1 2 3 4 5,O,3.,将组距确定为,1,,作出教材,P66,页 居民月均用水量的频率分布直方图,4.,谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?,(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断 ),理论迁移,例 某地区为了了解知识分子的年龄结构,,随机抽样,50,名,其年龄分别如下:,42,,,38,,,29,,,36,,,41,,,43,,,54,,,43,,,34,,,44,,,40,,,59,,,39,,,42,,,44,,,50,,,37,,,44,,,45,,,29,,,48,,,45,,,53,,,48,,,37,,,28,,,46,,,50,,,37,,,44,,,42,,,39,,,51,,,52,,,62,,,47,,,59,,,46,,,45,,,67,,,53,,,49,,,65,,,47,,,54,,,63,,,57,,,43,,,46,,,58.,(1),列出样本频率分布表;,(2),画出频率分布直方图;,(3),估计年龄在,32,52,岁的知识分子所占的比例约是多少,.,(1),极差为,67-28=39,,取组距为,5,,分为,8,组,.,分 组 频数 频率,27,,,32,),3 0.06,32,,,37,),3 0.06,37,,,42,),9 0.18,42,,,47,),16 0.32,47,,,52,),7 0.14,52,,,57,),5 0.10,57,,,62,),4 0.08,62,,,67,】,3 0.06,合 计,50 1.00,样本频率分布表:,(,2,)样本频率分布直方图:,年龄,0.06,0.05,0.04,0.03,0.02,0.01,27 32 37 42 47 52 57 62 67,频率,组距,O,(,3,)因为,0.06+0.18+0.32+0.14=0.7,,故年龄在,32,52,岁的知识分子约占,70%.,练 习,:,1.,有一个容量为,50,的样本数据的分组的频数如下:,12.5,15.5,),3,15.5,18.5,),8,18.5,21.5,),9,21.5,24.5,),11,24.5,27.5,),10,27.5,30.5,),5,30.5,33.5,),4,(1),列出样本的频率分布表,;,(2),画出频率分布直方图,;,(3),根据频率分布直方图估计,数据落在,15.5,24.5,)的百分比是多少,?,解,:,组距为,3,分组 频数 频率 频率,/,组距,12.5,15.5,),3,15.5,18.5,),8,18.5,21.5,),9,21.5,24.5,),11,24.5,27.5,),10,27.5,30.5,),5,30.5,33.5,),4,0.06,0.16,0.18,0.22,0.20,0.10,0.08,0.020,0.053,0.060,0.073,0.067,0.033,0.027,频率分布直方图如下:,频率,组距,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,练习,:,2.,投掷一枚均匀骰子,44,次的记录是,:,3,2,4,1,5,1,3,4,5,6,5,4,2,5,3,1,3,4,1,4,5,1,6,3,3,1,2,4,2,6,3,4,6,6,1,6,2,2,5,2,6,5,4,3,现对这些数据进行整理,试画出频数分布直方图,第一步:写出样本可能出现的一切数值,即:,1,2,3,4,5,6,共,6,个数,(,数据分组,),第二步:列出频率分布表:,样本,频数,7,7,8,8,7,7,频率,0.16,0.16,0.18,0.18,0.16,0.16,组距,=1,第三步,:,画频率分布直方图,小结,:,画频率分布直方图的步骤,:,第一步,:,求极差,:,(,数据组中最大值与最小值的差距,),第二步,:,决定组距与组数,:,(强调取整),第三步,:,将数据分组,(,给出组的界限,),第四步,:,列频率分布表,.,(包括分组、频数、频率,、频率,/,组距,),第五步,:,画频率分布直方图,(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率,/,组距,.,),组距,:,指每个小组的两个端点的距离,组距,组数,:,将数据分组,当数据在,100,个以内时,,按数据多少常分,5-12,组。,注意,(2),纵坐标为,:,作业,:P71,第一题 习题,2.2,:,2,
展开阅读全文