资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2用样本估计总体,复习:,1.,对一个未知总体,我们常用样本的频率分布估计总体的分布,表示样本数据频率分布的基本方法有哪几种?,频率分布表,频率分布直方图,,频率分布折线图,茎叶图。,引例1:,甲、乙两名篮球运动员在随机抽取的10,场比赛中的得分情况如下:,甲:12,15,20,25,31,31,36,36,37,39,乙:8,13,14,16,23,26,28,38,39,51,试根据上面的数据,比较甲,乙两名运动员哪一位发挥得比较更好。,是否能将样本数据汇总成一个数值?,2.2.2 用样本的数字特征,估计总体的数字特征,甲:12,15,20,25,31,31,36,36,37,39,乙:8,13,14,16,23,26,28,38,39,51,问题1:,初中学过众数、中位数和平均数的概念.这些数据都能反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?,在一组数据中,出现次数最多的数据叫做这组数据的众数。,将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。,即,众数:,中位数:,平均数:,甲:12,15,20,25,31,31,36,36,37,39,众数是:,中位数是:,平均数是:,31和36,31,28.2,月均用水量/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,取最高矩形的中点横坐标2.25t作为众数.,问题2:,频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?,问题3,:在频率分布直方图中,每个小矩形的面积表示什么?中位数应在哪个位置?,月均用水量/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,问题4:,频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.估计总体的中位数是多少?,0.5-0.04-0.08-0.15-0.22=0.01,0.010.5=0.02,中位数是2.02t.,月均用水量/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,问题5:,平均数是频率分布直方图的“重心”,频率分布直方图中,怎样估计总体的平均数呢?,月均用水量/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,各组频数分别为4,8,15,22,25,14,6,4,2,平均值估计为每个小矩形面积乘以各自底边中点横坐标之积的和,引例2:,一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:,甲:7 8 7 9 5 4 9 10 7 4,乙:9 5 7 8 7 6 8 6 7 7,若你是教练,对这次成绩情况做何评价,会做出怎样的选择?,问题2,:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,能说明其水平差异在那里吗?,环数,频率,0.4,0.3,0.2,0.1,4 5 6 7 8 9 10,O,(甲),环数,频率,0.4,0.3,0.2,0.1,4 5 6 7 8 9 10,O,(乙),甲的成绩比较分散,乙的成绩相对集中,比较稳定.,问题3:,怎样来反映样本数据的分散程度?,方差s,2,标准差s,甲:7 8 7 9 5 4 9 10 7 4,乙:9 5 7 8 7 6 8 6 7 7,计算甲、乙两名运动员的射击成绩的方差(或)标准差,比较其射击水平的稳定性.,s,甲,2,=2,s,乙,2,=1.095 s,甲,=2,s,乙,=1.095,由s,甲,s,乙,可知乙比甲的射击成绩稳定,可以选乙。,小结,1.众数估计为最高矩形的中点横坐标.,3.平,均值估计为每个小矩形面积乘以各,自底边中点横坐标之积的和.,2.中位数为由左至右面积累计和为0.5时,的横坐标.,4.方差和标准差都反映数据的离散程,度,越小表示数据越集中,越稳定。,问题6.平均数与中位数相等,是必然还是巧合?,思考7:,从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图估计出的结论有偏差怎么解释一下原因呢?,频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.,思考8:,一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会额成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?,知,识探究(二):标准差,样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.,如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.,平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.,这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.,
展开阅读全文