资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,用样本的,频率分布,估计总体分布,(二),画频率分布直方图的步骤,:,第一步,:,求极差,:,(,数据组中最大值与最小值的差距,),第二步,:,决定组距与组数,:,(强调取整),第三步,:,将数据分组,(,给出组的界限,),第四步,:,列频率分布表,.,(包括分组、频数、频率,、频率,/,组距,),第五步,:,画频率分布直方图,(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率,/,组距,.,),组距,:,指每个小组的两个端点的距离,组距,组数,:,将数据分组,当数据在,100,个以内时,,按数据多少常分,5-12,组。,回忆,:,绘制频率分布直方图有哪几个步骤呢?,(一),频率分布折线图,:,画好频率分布图后,我们把频率分布直方图中各小长,方形上端连接起来,得到的图形,.,0,0.1,0.2,0.3,0.4,0.5,0.6,0.5 1 1.5 2 2.5 3 3.5 4 4.5,画出频率分布折线图,.,频率,/,组距,月均用水量,/t,(,取组距中点,并连线,),0.08,0.16,0.3,0.44,0.5,0.3,0.1,0.08,0.04,在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为,总体密度曲线,.,它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,.,总体密度曲线,:,月均用水量,/t,频率,组距,0,a,b,月均用水量,/t,频率,组距,0,a,b,1.,对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?,思考,2.,图中阴影部分的面积表示什么?,2.,总体在范围(,a,b,)内取值的百分比,月均用水量,/t,频率,组距,0,a,b,1.,实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确,思考:,当总体中的个体数比较少或样,本数据不密集时,是否存在总体密度曲线?为什么?,不存在,因为,组距不能任意缩小,.,(二),茎叶图,当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图,例,:,甲乙两人比赛得分记录如下:,甲:,13,51,23,8,26,38,16,33,14,28,39,乙:,49,24,12,31,50,31,44,36,15,37,25,36,39,用茎叶图表示两人成绩,说明哪一个成绩好,甲乙,0,1,2,3,4,5,2,5,5,4,1,6,1,6,7,9,4,9,0,8,4,6,3,3,6,8,3,8,9,1,叶 茎 叶,(二),.,茎叶图,(,一种被用来表示数据的图,),画茎叶图的步骤,:,1.,将每个数据分为茎,(,高位,),和叶,(,低位,),两部分,在此例中,茎为十,位上的数字,叶为个位上的数字,;,2.,将最小茎和最大茎之间的数按大小次序排成一列,写在左,(,右,),侧,;,3.,将各个数据的叶按大小次序,写在其茎右,(,左,),侧,.,茎,叶,0,8,1,3 4 5,2,3 6 8,3,3 8 9,4,5,1,()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。,()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。,茎叶图的特征,:,思考:,对任意一组样本数据,是否都适合用茎叶图表示?为什么?,不适合样本容量很大或茎、叶不分明的样本数据,.,频数茎叶,2107,8,1111 2,7,6,3,6,8,6,7,2,2,0,13126,8,4,2,7,8,6,1,0,4,3,2,0,4134,2,3,0,下表一组数据是某车间,30,名工人加工零件的个数,设计一个,茎叶图表示这组数据,并说明这一车间的生产情况,.,134,112,117,126,128,124,122,116,113,107,116,132,127,128,126,121,120,118,108,110,133,130,124,116,117,123,122,120,112,112,练习:,练习:,右面是甲、,乙两名运动员,某赛季一些场,次得分的茎叶,图,据图可知,(),甲,0,1,2,3,4,5,乙,8,247,199,36,2,50,32,875421,944,1,A,A,甲运动员的成绩好于乙运动员,B,乙运动员的成绩好于甲运动员,C,甲、乙两名运动员的成绩没有明显的差异,D,甲运动员的最低得分为,0,分,2.,2002-2003,赛季,一球员在,NBA,某些场次的比赛所得篮板球数分别为,:,16,6,3,5,12,8,13,6,10,3,19,14,9,7,10,10,9,11,6,11,12,14,8,6,10,5,10,11,13,9,10,10,7,6,11,12,17,4,12,8,10,12,9,15,15,12,13,18,8,16,请制作这些数据的茎叶图,.,0,1,3 3 4 5 5 6 6 6 6 6 7 7 8 8 8 8 9 9 9 9,0 0 0 0 0 0 0 0 1 1 1 1 2 2 2 2 2 2 3 3 3 4 4 5 5 6 6 7 8 9,3.,下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,:,甲,乙,0,1,4,2,3,5,50,32,875421,944,1,8,247,199,36,2,(1),甲乙两名队员的最高得分各是多少,?,(2),哪名运动员的成绩好一些,?,(1),甲运动员的最高得分为,51,分,乙运动员的最高分为,52,分,;,(2),甲运动员的成绩好于乙运动员,.,小结:,1.,不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确,.,2.,目前有:频率分布表、直方图、茎叶图,.,3.,当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。,小结,图形 优点 缺点,频率分布,1,)易表示大量数据 丢失一些,直方图,2,)直观地表明分布地 情况 信息,1,)无信息损失 只能处理样本,茎页图,2,)随时记录方便记录和表示 容量较小数据,布置作业,:,习题,2.2,第,1,题,
展开阅读全文