资源描述
2021/6/3012.2.2 茎叶图与众数、中位数、平均数茎叶图与众数、中位数、平均数2021/6/302画画频率分布直方图频率分布直方图的的操作步骤操作步骤(一表一图的制作方法)(一表一图的制作方法)1.求极差求极差.即数据中最大值与最小值的差即数据中最大值与最小值的差2.决定组距与组数决定组距与组数 :组数:组数=极差极差/组距组距3.将数据分组将数据分组.通常对组内数值所在区间,取左闭右通常对组内数值所在区间,取左闭右开区间开区间 , 最后一组取闭区间最后一组取闭区间4.列出频率分布表列出频率分布表.计算频数和频率,计算频数和频率, 列出频率分布表列出频率分布表5.画出频率分布直方图画出频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)复习:复习:2021/6/303茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 请同学们阅读教材请同学们阅读教材70页,了解并掌握页,了解并掌握茎叶图的制作及其优缺点。茎叶图的制作及其优缺点。2021/6/304茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 36 83 8 9 1叶就是从茎的旁边生叶就是从茎的旁边生长出来的数,表示得长出来的数,表示得分的个位数。分的个位数。 茎是指中间的一列数,茎是指中间的一列数,表示得分的十位数表示得分的十位数2021/6/305一般地,画出一组样本数据的茎叶图的步骤一般地,画出一组样本数据的茎叶图的步骤如下:如下:第一步第一步,将每个数据分为,将每个数据分为“茎茎”和和“叶叶”两两部分;部分;第二步第二步,将各个数据的茎按大小次序(由小,将各个数据的茎按大小次序(由小到大)排成一列;到大)排成一列;第三步第三步,将各个数据的叶按大小次序写在茎,将各个数据的叶按大小次序写在茎左(右)侧。左(右)侧。2021/6/306第一课时第一课时 众数、中位数、平均数众数、中位数、平均数2.2.2 用样本的数字特征估计总用样本的数字特征估计总体的数字特征体的数字特征2021/6/307一一 、复习众数、中位数、平均数的概念、复习众数、中位数、平均数的概念 2、中位数中位数:将一组数据:将一组数据按大小依次排列按大小依次排列,把处,把处在在最中间位置最中间位置的一个数据(或最中间两个数据的平均的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数数)叫做这组数据的中位数 1、众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数(众数可能不只一个)做这组数据的众数(众数可能不只一个) 众数、中位数、平均数众数、中位数、平均数都是描述一组数都是描述一组数据的集中趋势的特征数,只是描述的角度不据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛同,其中以平均数的应用最为广泛. 3、平均数、平均数: 一般地,如果一般地,如果n个数个数 ,那,那么,么, 叫做这叫做这n个数的平均数。个数的平均数。12,.,nx xx121(.)nxxxxn2021/6/3081、求下列各组数据的、求下列各组数据的众数众数(1)、)、1 ,2,3,3,3,5,5,8,8,8,9,9众数是:众数是:3和和8(2)、)、1 ,2,3,3,3,5,5,8,8,9,9众数是:众数是:32、求下列各组数据的、求下列各组数据的中位数中位数(1)1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位数是:中位数是:5中位数是:中位数是:42021/6/309频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系100位居民月用水量的频率分布直方图位居民月用水量的频率分布直方图2021/6/3010频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系2.25众数与频率分布直方图的关系:众数与频率分布直方图的关系: 因为在频率分布直方图中,各小长因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间大小,所以从图中可以看到,在区间2,2.5)的小长方形的面积最大,即)的小长方形的面积最大,即这组的频率是最大的,也就是说月均这组的频率是最大的,也就是说月均用水量在区间用水量在区间2,2.5)内的居民最多,)内的居民最多,即众数就是在区间即众数就是在区间2,2.5)内。)内。众数在样本数据的频率分布直方图中,就是众数在样本数据的频率分布直方图中,就是最高矩形的最高矩形的中点中点的横坐标。的横坐标。2021/6/3011频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系2.25众数在样本数据的频率分布直方图中,就是众数在样本数据的频率分布直方图中,就是最高矩形的最高矩形的中点中点的横坐标。的横坐标。众数的优缺点:众数的优缺点: 众数体现了样本数据的最大集中点,众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法但它对其它数据信息的忽视使得无法客观地反映总体特征客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的居民数比月均用水量为其它数值的的居民数比月均用水量为其它数值的居民数多居民数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.2021/6/3012频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系中位数与频率分布直方图的关系:中位数与频率分布直方图的关系: 在样本中,有在样本中,有50的个体小于或的个体小于或等于中位数,也有等于中位数,也有50的个体大于的个体大于或等于中位数,因此,在频率分布或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表个单位,右边的直方图也是代表50个单位,它们的分界线与个单位,它们的分界线与x轴交点轴交点的横坐标就是中位数。的横坐标就是中位数。 中位数在样本数据的频率分布直方图中,就是中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标。轴交点的横坐标。2.022021/6/3013频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系 中位数在样本数据的频率分布直方图中,就是中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标。轴交点的横坐标。2.02中位数的优缺点:中位数的优缺点: 中位数是样本数据所占频率的等中位数是样本数据所占频率的等分线,它不受少数几个极端值的影分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺对极端值的不敏感有时也会成为缺点。如假设有某一用户月均用水量点。如假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几几乎不影响中位数乎不影响中位数,但显然这一极端值但显然这一极端值是不能忽视的。是不能忽视的。2021/6/3014频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)平均数与频率分布直方图的关系:平均数与频率分布直方图的关系: 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,是直方图的平衡点是直方图的平衡点. 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系 平均数在样本数据的频率分布直方图中,平均数在样本数据的频率分布直方图中,等于频率分布直方图中每个小矩形等于频率分布直方图中每个小矩形面积乘以小矩形底边中点的横坐标之和。面积乘以小矩形底边中点的横坐标之和。2.02t2021/6/3015频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 二二 .众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系2.02t平均数的优缺点:平均数的优缺点: 由于平均数与每一个样本的数据由于平均数与每一个样本的数据有关,所以任何一个样本数据的改有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正数、中位数都不具有的性质。也正因如此因如此 ,与众数、中位数比较起来,与众数、中位数比较起来,平均数可以反映出更多的关于样本平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数中的极端值的影响较大,使平均数在估计时可靠性降低。在估计时可靠性降低。 平均数在样本数据的频率分布直方图中,平均数在样本数据的频率分布直方图中,等于频率分布直方图中每个小矩形等于频率分布直方图中每个小矩形面积乘以小矩形底边中点的横坐标之和。面积乘以小矩形底边中点的横坐标之和。2021/6/3016 应该采用平均数来表示每一个国家项目的平均金额,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数因为它能反映所有项目的信息。但平均数会受到极端数据据2200万元的影响,所以大多数项目投资金额都和平均万元的影响,所以大多数项目投资金额都和平均数相差比较大。数相差比较大。2021/6/3017小结小结众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系众数在样本数据的频率分布直方图中,就是众数在样本数据的频率分布直方图中,就是最高矩形的最高矩形的中点中点的横坐标。的横坐标。 中位数在样本数据的频率分布直方图中,就是中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标。轴交点的横坐标。 平均数在样本数据的频率分布直方图中,平均数在样本数据的频率分布直方图中,等于频率分布图中每个小矩形等于频率分布图中每个小矩形面积乘以小矩形底边中点的横坐标之和。面积乘以小矩形底边中点的横坐标之和。 若有不当之处,请指正,谢谢!若有不当之处,请指正,谢谢!
展开阅读全文