资源描述
频率分布表和,频率分布直方图,知识探究,(,一,):,频率分布表,【,问题,】,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民 生活用水定额管理,即确定一个居民月用水量标准,a,,用水量不超过,a,的部分按平价收费,超出,a,的部分按议价收费,.,通过抽样调查,获得,100,位居民,2007,年的月均用水量如下表(单位:,t,)。,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6,3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4,3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8,3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1,3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3,3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0,2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3,2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4,2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4,2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,知识探究,(,一,):,频率分布表,思考,1,:,上述,100,个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?,思考,2,:,样本数据中的最大值和最小值的差称为,极差,.,如果将上述,100,个数据按组距为,0.5,进行分组,那么这些数据共分为多少组?,0.2,4.3,(4.3,0.2)0.5=8.2,思考,3,:,以组距为,0.5,进行分组,上述,100,个数据共分为,9,组,各组数据的取值范围可以如何设定?,0,,,0.5),,,0.5,,,1),,,1,,,1.5),,,,,4,,,4.5.,知识探究,(,一,):,频率分布表,思考,4,:,如何统计上述,100,个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,分 组,频数,频数,频率,0,,,0.5),0.5,,,1),1,,,1.5),1.5,,,2),2,,,2.5),2.5,,,3),3,,,3.5),3.5,,,4),4,,,4.5,合计,分 组,频数,频数,频率,0,,,0.5),4,0.04,0.5,,,1),8,0.08,1,,,1.5),15,0.15,1.5,,,2),22,0.22,2,,,2.5),25,0.25,2.5,,,3),14,0.14,3,,,3.5),6,0.06,3.5,,,4),4,0.04,4,,,4.5,2,0.02,合计,100,1.00,思考,5,:,上表称为样本数据的,频率分布表,,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?,用样本的频率分布估计总体分布,.,思考,6,:,如果市政府希望,85%,左右的居民月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即,a,的,取值)有何建议?,88%,的居民月用水量在,3t,以下,可建议取,a=3.,思考,7,:,在实际中,取,a=3t,一定能保证,85%,以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?,分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的,.,思考,8,:,对样本数据进行分组,其组数是由,哪些因素确定的?,思考,9,:,对样本数据进行分组,组距的确定,没有固定的标准,组数太多或太少,都会,影响我们了解数据的分布情况,.,数据分组的,组数与样本容量有关,一般样本容量越大,,所分组数越多,.,思考,10,:,一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?,第一步,求极差,.,第二步,决定组距与组数,.,第三步,确定分点,将数据分组,.,第四步,列频率分布表,.,知识探究,(,二,):,频率分布直方图,思考,1,:,为了直观反映样本数据在各组中的,分布情况,我们将上述频率分布表中的有,关信息用下面的图形表示:,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,思考,2,:,频率分布直方图中,小长方形的面积表示什么?,所有小长方形的面积和?,小长方形的高,=,频率,组距,小长方形的面积表示该组的频率,所有小长方形的面积和,1,思考,3,:,频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来,.,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,(1),居民月均用水量的分布是“山峰”状的,而且,是“单峰”的;,(2),大部分居民的月均用水量集中在一个中间值,附近,只有少数居民的月均用水量很多或很少;,(3),居民月均用水量的分布有一定的对称性等,.,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,思考,4,:,样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?,第一步,画平面直角坐标系,.,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度,.,第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形,.,课堂练习,1,有一个容量为,50,的样本数据的分组,及各组的频数如下:,12.5,15.5)3 24.5,27.5)10,15.5,18.5)8 27.5,30.5)5,18.5,21.5)9 30.5,33.5)4,21.5,24.5)11,列出样本的频率分布表和画出频率,分布直方图;,根据样本的频率分布估计,小于,30.5,的数据约占多少?,2,一个社会调查机构就某地居民的月收入调查了,10 000,人,并根据所得数据画了样本的频率分布直方图,(,如下图,).,为了分析居民的收入与年龄、学历、职业等方面的关系,要从这,10 000,人中再用分层抽样方法抽出,100,人作进一步调查,则在,2500,,,3000(,元,),月收入段应抽出,_,人,.,0.0001,0.0002,0.0003,0.0004,0.0005,月收入,(,元,),频率,/,组距,25,1000 1500 2000 2500 3000 3500 4000,3,某班,50,名学生在一次百米测试中,成绩全部介于,13,秒与,19,秒之间,将测试结果按如下方式分成六组:第,一组,成绩大于等于,13,秒且小于,14,秒;第二组,成绩,大于等于,14,秒且小于,15,秒;,第六组,成绩大于等于,18,秒且小,于等于,19,秒右图是按上述分组,方法得到的频率分布直方图设,成绩小于,17,秒的学生人数占全班,总人数的百分比为,x,,成绩大于等,于,15,秒且小于,17,秒的学生人数为,y,,,则从频率分布直方图中可分析出,x,和,y,分别为,(),A,0.9,,,35 B,0.9,,,45,C,0.1,,,35 D,0.1,,,45,O,13,14,15,16,17,18,19,秒,频率,/,组距,0.36,0.34,0.18,0.06,0.04,0.02,A,4,为了了解某地区高三学生的身体发育情况,抽查了该地区,100,名年龄为,17.5,岁,18,岁的男生体重,(kg),得到频率分布直方图如下:,根据上图可得这,100,名学生中体重在,56.5,64.5,的学生人数是,(),A.20 B.30 C.40 D.50,C,0.03,0.05,0.07,体重,(kg),频率,/,组距,54.5,58.5,62.5,66.5,70.5,74.5,5,下面左图是某县参加,2007,年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为,A,1,、,A,2,、,、,A,10,(,如,A,2,表示身高,(,单位,:cm)(150,,,155),内的学生人数,).,右图是统计左图中身高在一定范围内学生人数的一个算法流程图,.,现要统计身高在,160180cm(,含,160cm,不含,180cm),的学生人数,那么在流程图中的判断框内应填写的条件是,(),A.i9 B.i8 C.i7 D.i6,B,身高,/cm,人数,/,人,145,155,165,175,185,50,150,250,350,450,550,195,输入,A,1,A,2,A,n,a,0,i,4,输出,s,是,否,开始,结束,6,为了解某校高三学生的视力情况,随机地抽,查了该校,100,名高三学生的视力情况,得到频率,分布直方图,如右,由于不慎将部分数据丢失,,但知道前,4,组的频数成等比数列,后,6,组的频数成,等差数列,设最大频率为,a,,视力在,4.6,到,5.0,之间,的学生数为,b,,则,a,b,的值分别为,(),0.3,0.1,4.3,4.5,4.7,4.9,5.1,视力,频率,/,组距,A.0.27,,,78,B.0.27,,,83,C.2.7,,,78,D.2.7,,,83,A,
展开阅读全文