数据的离散程度综述课件

上传人:无*** 文档编号:241432004 上传时间:2024-06-25 格式:PPT 页数:44 大小:1.67MB
返回 下载 相关 举报
数据的离散程度综述课件_第1页
第1页 / 共44页
数据的离散程度综述课件_第2页
第2页 / 共44页
数据的离散程度综述课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
数据的离散程度数据的离散程度情景导入情景导入乒乓球的标准乒乓球的标准 直径为直径为40mm,质检部门对,质检部门对甲乙两厂生产的乒乓球的直径进行检测。甲乙两厂生产的乒乓球的直径进行检测。从甲乙两厂生产的乒乓球中各抽样调查了从甲乙两厂生产的乒乓球中各抽样调查了10个,测量的结果如下:个,测量的结果如下:乒乓球的标准乒乓球的标准 直径为直径为40mm,质检部门对,质检部门对甲乙两厂生产的乒乓球的直径进行检测。甲乙两厂生产的乒乓球的直径进行检测。甲厂:甲厂:40.0,40.1,39.9,40.0,39.8,40.2,40.0,40.1,40.0,39.9 乙厂:乙厂:40.1,39.8,39.9,40.3,39.8,40.2,40.1,40.2,39.7,39.9 你认为哪个厂生产的乒乓球的直径与标你认为哪个厂生产的乒乓球的直径与标准直径的误差更小呢?准直径的误差更小呢?第一组数据变化范围第一组数据变化范围 40.2-39.8=0.4(mm)第二组数据变化范围第二组数据变化范围 40.3-39.7=0.6(mm)在在在在生生生生活活活活中中中中,我我我我们们们们常常常常常常常常会会会会和和和和极极极极差差差差打打打打交交交交道道道道篮篮篮篮球球球球队队队队里里里里个个个个子子子子最最最最高高高高的的的的队队队队员员员员比比比比个个个个子子子子最最最最矮矮矮矮的的的的队队队队员员员员高高高高多多多多少少少少?家家家家庭庭庭庭中中中中年年年年纪纪纪纪最最最最大大大大的的的的长长长长辈辈辈辈比比比比年年年年纪纪纪纪最最最最小小小小的的的的孩孩孩孩子子子子大大大大多多多多少少少少?一一一一家家家家公公公公司司司司成成成成员员员员中中中中最高收入与最低收入相比。这些都是求极差的例子最高收入与最低收入相比。这些都是求极差的例子最高收入与最低收入相比。这些都是求极差的例子最高收入与最低收入相比。这些都是求极差的例子什么样的指标可以反映一组数据变化范围的大小?什么样的指标可以反映一组数据变化范围的大小?极差最大值最小值极差最大值最小值思考:思考:极差极差:一组数据中的最大数据与最小数据的差一组数据中的最大数据与最小数据的差极差能够反映数据的变化范围极差能够反映数据的变化范围极差能够反映数据的变化范围极差能够反映数据的变化范围.极差是最简单的一种度极差是最简单的一种度极差是最简单的一种度极差是最简单的一种度量数据波动情况的量量数据波动情况的量量数据波动情况的量量数据波动情况的量,但它受极端值的影响较大但它受极端值的影响较大但它受极端值的影响较大但它受极端值的影响较大.你能举一些关于极差的例子吗你能举一些关于极差的例子吗?(1)(1)分别求出两地的平均气温分别求出两地的平均气温分别求出两地的平均气温分别求出两地的平均气温;(2)(2)乌鲁木齐的气温极差(即温差)是多少?厦门呢?乌鲁木齐的气温极差(即温差)是多少?厦门呢?乌鲁木齐的气温极差(即温差)是多少?厦门呢?乌鲁木齐的气温极差(即温差)是多少?厦门呢?(3)(3)你认为哪个两地区的气温情况怎样?你认为哪个两地区的气温情况怎样?你认为哪个两地区的气温情况怎样?你认为哪个两地区的气温情况怎样?约约约约17c;22c;17c;22c;乌鲁木齐的气温变化幅度较大乌鲁木齐的气温变化幅度较大乌鲁木齐的气温变化幅度较大乌鲁木齐的气温变化幅度较大,厦门的气温变化幅度较小厦门的气温变化幅度较小厦门的气温变化幅度较小厦门的气温变化幅度较小.某日在不同时段测得乌鲁木齐和厦门的某日在不同时段测得乌鲁木齐和厦门的气温情况如下气温情况如下:0:000:004:004:008:008:0012:0012:0016:0016:0020:0020:00乌鲁木齐乌鲁木齐乌鲁木齐乌鲁木齐10c10c12c12c20c20c24c24c18c18c16c16c厦门厦门厦门厦门18c18c22c22c23c23c25c25c23c23c21c21c乌鲁木齐乌鲁木齐乌鲁木齐乌鲁木齐 24-10=14c 24-10=14c厦厦厦厦 门门门门 26-18=8c 26-18=8c 小明初一时对数学不感兴趣,遇到问题不小明初一时对数学不感兴趣,遇到问题不爱动脑筋,作业能做就做,不会做就不做,因此爱动脑筋,作业能做就做,不会做就不做,因此他的数学成绩不太好,初一的一学年中四次考试他的数学成绩不太好,初一的一学年中四次考试的数学成绩分别是的数学成绩分别是7575、7878、7777、7676初一暑假时,初一暑假时,小明参加了科技活动小组,在活动中,小明体会小明参加了科技活动小组,在活动中,小明体会到学好数学的重要性,逐渐对数学产生了兴趣,到学好数学的重要性,逐渐对数学产生了兴趣,遇到问题时从多方面去思考,深入钻研因此小遇到问题时从多方面去思考,深入钻研因此小明的数学成绩进步很快,初二的一学年中,小明明的数学成绩进步很快,初二的一学年中,小明在四次考试的数学成绩是在四次考试的数学成绩是8080、8585、9292、9595 看完这则小通讯,请谈谈你的看法你以为看完这则小通讯,请谈谈你的看法你以为在这些数据中最能反映学习态度重要性的是哪一在这些数据中最能反映学习态度重要性的是哪一对数据对数据?两者相差多少两者相差多少?问题情景问题情景观察下图,分别说出两段时间内气温的极差观察下图,分别说出两段时间内气温的极差解:由图可知,图解:由图可知,图(a)(a)中最高气温与最低气温之间差距很中最高气温与最低气温之间差距很大,相差大,相差1616,也就是极差为,也就是极差为1616;图;图(b)(b)中所有气温中所有气温的极差为的极差为77,所以从图中看,整段时间内气温变化的,所以从图中看,整段时间内气温变化的范围不太大范围不太大 1 1、3 3,4 4,2 2,1 1,5 5的平均数为的平均数为 ;中位数为中位数为 ;极差为;极差为 ;2 2、a+3a+3,a+4a+4,a+2a+2,a+1a+1,a+5a+5的的 平均数为平均数为 ,中位数为,中位数为 ;极差为极差为 。0:00 4:00 8:00 12:0016:0020:00乌鲁木齐乌鲁木齐-2。C-1。C8。C10。C9。C2。C广广 州州20。C22。C23。C25。C23。C21。C1.某日在不同时段测得乌鲁木齐和广州的某日在不同时段测得乌鲁木齐和广州的气温情况如下:气温情况如下:根据上表回答:根据上表回答:乌鲁木齐当天的温度极差是多少?乌鲁木齐当天的温度极差是多少?广州当天的温度极差是多少?广州当天的温度极差是多少?如果你有两个好朋友分别要去这两个地方如果你有两个好朋友分别要去这两个地方旅游你将给他们分别提出什么建议?旅游你将给他们分别提出什么建议?10-(-2)=1225-20=5(1)机床甲的平均数是)机床甲的平均数是 ,机床甲的平均数是机床甲的平均数是 。2 2、自动化生产线上,两台数控机床同时生产直径为自动化生产线上,两台数控机床同时生产直径为40.0040.00毫米的零件,为了检验产品质量毫米的零件,为了检验产品质量,从产品中各抽从产品中各抽出出1010件进行测量,结果如下件进行测量,结果如下(单位:毫米单位:毫米)40毫米毫米40毫米毫米(2)(2)就所生产的就所生产的1010个零件的直径变化范围个零件的直径变化范围,你认为哪你认为哪个机床生产的质量好个机床生产的质量好?答:因为甲的极差为答:因为甲的极差为0.120.12,乙的极差为,乙的极差为0.220.22,所以,所以甲机床生产的质量较好甲机床生产的质量较好 1.1.了解极差的意义了解极差的意义2.2.知道极差的计算方法知道极差的计算方法 极差是最简单的一种度量数据波极差是最简单的一种度量数据波动情况的量动情况的量,但只能反映数据的波动范围但只能反映数据的波动范围,不能衡量每个数据的变化情况不能衡量每个数据的变化情况,而且受极而且受极端值的影响较大端值的影响较大.极差最大值最小值极差最大值最小值 方差与标准差方差与标准差 乒乓球的标准直径为乒乓球的标准直径为40mm,质检部门从,质检部门从 A、B两厂生产的乒乓球中各抽取了两厂生产的乒乓球中各抽取了10只,只,对这些乒乓球的直径了进行检测。对这些乒乓球的直径了进行检测。结果如下(单位:结果如下(单位:mm):):A厂厂:40.0,39.9,40.0,40.1,40.2,39.8,40.0,39.9,40.0,40.1;B厂厂:39.8,40.2,39.8,40.2,39.9,40.1,39.8,40.2,39.8,40.2.你认为哪个厂生产的乒乓球的直径与标准的误你认为哪个厂生产的乒乓球的直径与标准的误差更小呢?差更小呢?今天我们一起来探索这个问题。今天我们一起来探索这个问题。1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 1040.3 40.2 40.1 40.0 39.9 39.8 39.7 .在一组数据中,各数据与它们平均数的差的在一组数据中,各数据与它们平均数的差的平方的平均数叫平方的平均数叫方差方差。请你归纳一下方差概念,并说说公请你归纳一下方差概念,并说说公式中每一个元素的意义。式中每一个元素的意义。1、在统计中,样本的方差和标准差、在统计中,样本的方差和标准差可以近似的反映总体的()可以近似的反映总体的()、平均状态、平均状态、离散程度、离散程度、分布规律、分布规律、最大值和最小值、最大值和最小值谈谈方差的作用?谈谈方差的作用?衡量这组数据的波动大小,并把它叫衡量这组数据的波动大小,并把它叫做这组数据的方差一组数据方差越做这组数据的方差一组数据方差越大,说明这组数据波动越大大,说明这组数据波动越大 说说你的疑问:说说你的疑问:(1)为什么要这样定义方差?)为什么要这样定义方差?在表示各数据与其平均数的偏离程度时,在表示各数据与其平均数的偏离程度时,为了为了防止防止正偏差与负偏差的正偏差与负偏差的相互抵消相互抵消.(2)为什么对各数据与其平均数的差)为什么对各数据与其平均数的差不取其绝对值,而要将它们平方?不取其绝对值,而要将它们平方?这这主要是因为在很多问题里,含有绝主要是因为在很多问题里,含有绝对值的式子不便于运算,且在衡量一对值的式子不便于运算,且在衡量一组数据波动大小的组数据波动大小的“功能功能”上,方差上,方差更强些更强些(3)为什么要除以数据个数)为什么要除以数据个数n?是为了消除数据个数的影响是为了消除数据个数的影响 方差的单位与原数据的单位相同方差的单位与原数据的单位相同吗?应该如何办?吗?应该如何办?在有些情况下,需要用到方差在有些情况下,需要用到方差的算的算术平方根,即平方根,即 并把它叫做这组数据的并把它叫做这组数据的标准差标准差.它它也是一个用来衡量一组数据的波动大小也是一个用来衡量一组数据的波动大小的重要的量的重要的量.分析方差与标准差的区别与联系:分析方差与标准差的区别与联系:计算标准差要比计算方差多开计算标准差要比计算方差多开一次平方,但它的度量单位与原数一次平方,但它的度量单位与原数据一致,有时用它比较方便据一致,有时用它比较方便2、国家统计局发布的统计公报显示:国家统计局发布的统计公报显示:2001到到2005年,我国年,我国GDP增长率分别增长率分别为为8.3,9.1,10.0,10.1,9.9。经济学家评论说:这五年的年度。经济学家评论说:这五年的年度GDP增长率之间相当平稳。从统计学的增长率之间相当平稳。从统计学的角度看,角度看,“增长率之间相当平稳增长率之间相当平稳”说明说明这组数据的(这组数据的()较小。)较小。A、标准差、标准差 B、中位数、中位数 C、平均数、平均数 D、众数、众数3、刘翔刘翔为了备战为了备战2008年奥运会,年奥运会,刻苦进行刻苦进行110米跨栏训练,为判断米跨栏训练,为判断他的成绩是否稳定,教练对他他的成绩是否稳定,教练对他10次训练的成绩进行统计分析,则教次训练的成绩进行统计分析,则教练需了解刘翔这练需了解刘翔这10次成绩的(次成绩的()A、众数、众数 B、方差、方差 C、平均数、平均数 D、频数、频数4、对于数据、对于数据3、2、1、0、-1求:它的极差是求:它的极差是 方差是方差是 标准差是标准差是 说说你是怎说说你是怎样思考,并口样思考,并口述求解过程?述求解过程?5、在某旅游景区上山的一条小路上,、在某旅游景区上山的一条小路上,有一些断断续续的台阶。如图是其有一些断断续续的台阶。如图是其中的中的甲甲、乙乙段台阶路的示意图。请段台阶路的示意图。请你用所学过的有关统计知识(平均你用所学过的有关统计知识(平均数、中位数、方差和极差)回答下数、中位数、方差和极差)回答下列问题:列问题:(1)哪段台阶路走起来更舒)哪段台阶路走起来更舒服?为什么?服?为什么?(2)为方便游客行走,需要)为方便游客行走,需要重新整修上山的小路重新整修上山的小路.对于这对于这两段台阶路,在台阶数不变的两段台阶路,在台阶数不变的情况下,请你提出合理的整修情况下,请你提出合理的整修建议建议。151616141415111518171019解:(1)从小到大排列出台阶的高度值:甲的,14,14,15,15,16,16,乙的,10,11,15,17,18,19,甲的中位数、方差和极差分别为,15;2 3;16-14=2,乙的中位数、方差和极差分别为,(15+17)2=16,35 3,19-10=9平均数:.x甲=1 6(15+16+16+14+14+15)=15;.x乙=1 6(11+15+18+17+10+19)=15相同点:两段台阶路高度的平均数相同不同点:两段台阶路高度的中位数、方差和极差均不相同(2)甲路段走起来更舒服一些,因为它的台阶高度的方差小(3)每个台阶高度均为15cm(原平均数),使得方差为0已知一组数据已知一组数据1,2,n的方差的方差是是a。则数据。则数据1-4,2-4,n4的方差是的方差是 ;数据数据 31,32,3n的方差是的方差是 。数据数据31,32,3n方差是方差是?1.本章学习的刻画数据波动的统计量本章学习的刻画数据波动的统计量有哪些?有哪些?2.什么叫极差?它刻画了一组数据的什什么叫极差?它刻画了一组数据的什么特性?么特性?3.什么叫方差与标准差?它又刻画了一什么叫方差与标准差?它又刻画了一组数据的什么特性?组数据的什么特性?4.怎样用计算器求一组数据的方差与怎样用计算器求一组数据的方差与标准差?标准差?回顾与思考回顾与思考 刻画数据波动的统计量有极差、方差、标准差刻画数据波动的统计量有极差、方差、标准差.它它们是用来描述一组数据的稳定性的们是用来描述一组数据的稳定性的.一般而言,一组数一般而言,一组数据的极差、方差或标准差越小,这组数据就越稳定。据的极差、方差或标准差越小,这组数据就越稳定。数据的离散程度数据的离散程度极差极差方差方差用计算器求方差与标准差用计算器求方差与标准差标准差标准差(1)要想知道一锅汤的味道怎么办?(2)要想知道一座矿山(铁矿)的含铁量怎么办?(3)要想知道一批炮弹的杀伤力该怎么办?(4)上海市10年的中考,要想估计这届学生的整体水平,应该怎样做?2002年农民收入增长年农民收入增长4.8%农调总队2003-2-9根据国家统计局对全国各省,自治区、直辖市6.8万个农户的抽样调查,2002年农民人均纯收入为2476元,比上年同期增加109元,扣除价格因素的影响,实际增长4.8%。(5)“三农数据网三农数据网”的网页展示的网页展示.从上述网页可见,国家统计局对从上述网页可见,国家统计局对2002年农民收入增年农民收入增长情况的调查采用的是什么调查方式?从中你能估计出长情况的调查采用的是什么调查方式?从中你能估计出全国各省、自治区、直辖市农民人均纯收入吗?全国各省、自治区、直辖市农民人均纯收入吗?统计的基本思想:统计的基本思想:从总体中抽取样本,通过对样本的整从总体中抽取样本,通过对样本的整理、分析去估计总体的情况理、分析去估计总体的情况.问题问题1 1 某园艺场采摘苹果,边采摘、边装箱,共装某园艺场采摘苹果,边采摘、边装箱,共装了了20002000箱。苹果的市场收购价为箱。苹果的市场收购价为1.501.50元元/kg/kg。现在要估。现在要估计出今年的销售收入,我们可以怎么去做?计出今年的销售收入,我们可以怎么去做?(2)(2)采用抽样的方法采用抽样的方法.该园艺场从中任意抽取了该园艺场从中任意抽取了1010箱苹果,箱苹果,称出它们的质量,得到如下数据(单位:称出它们的质量,得到如下数据(单位:kgkg):):1616,1515,16.516.5,16.516.5,15.515.5,14.514.5,1414,1414,14.514.5,15.15.算出它们的平均数算出它们的平均数把把 作为每箱苹果的平均质量,由此估计今年的销售收入作为每箱苹果的平均质量,由此估计今年的销售收入约为约为1.51.515.152000=45450(元)(元).(1)全面调查,就是一箱箱的称,再根据苹果的总质量全面调查,就是一箱箱的称,再根据苹果的总质量估计今年的销售收入估计今年的销售收入.例例1 1 某某单位共有位共有280280位位员工参加了社会公益捐款活工参加了社会公益捐款活动,从中任意抽取了从中任意抽取了1212位位员工的捐款数工的捐款数额,记录如下:如下:捐款数捐款数额/元元303050508080100100员工数工数/人人2 25 53 32 2估估计该单位的捐款位的捐款总额.解:这解:这12为员工的军款数额的平均数为为员工的军款数额的平均数为问题问题2 2 某班某班4545名学生的体重(单位:名学生的体重(单位:kgkg)数据如下:)数据如下:47 48 42 61 50 45 44 46 5147 48 42 61 50 45 44 46 5146 45 51 48 53 55 42 47 5146 45 51 48 53 55 42 47 5149 49 4949 52 46 52 57 49 48 57 52 46 52 57 49 48 5749 51 41 52 58 50 54 55 4849 51 41 52 58 50 54 55 4856 54 60 44 53 61 54 50 6256 54 60 44 53 61 54 50 62选第选第9 9列的数据作为样本,计算它的平均数;再选取列的数据作为样本,计算它的平均数;再选取第第3 3、6 6、9 9列的数据作为样本,计算它的平均数。与列的数据作为样本,计算它的平均数。与4545名这个总体平均数相比较,你有什么发现?名这个总体平均数相比较,你有什么发现?用样本的平均数估计总体的平均数,如果样本容用样本的平均数估计总体的平均数,如果样本容量太大,往往差异较大量太大,往往差异较大.例例2 2 某同学统计了市经济开发区某同学统计了市经济开发区1010位企业管理位企业管理人员的住房面积(单位:平方米),数据如下:人员的住房面积(单位:平方米),数据如下:6060,9595,9595,8080,120120,105105,128128,7575,110110,130.130.这组数据的平均数为这组数据的平均数为99.899.8,于是他得出结论:本,于是他得出结论:本市每户的平均住房面积为市每户的平均住房面积为99.899.8平方米平方米.你认为他的估计你认为他的估计合理吗?为什么?合理吗?为什么?解:他的估计不合理,原因是他只统计了经济状况解:他的估计不合理,原因是他只统计了经济状况较好的较好的1010个家庭的住房面积,这些数据不能反映出社会个家庭的住房面积,这些数据不能反映出社会上各种不同人群的居住情况,即不具有上各种不同人群的居住情况,即不具有“代表性代表性”.要想要想比较可靠地了解全市情况,应当从全市居民中比较可靠地了解全市情况,应当从全市居民中“任意任意”抽取一部分人来进行统计抽取一部分人来进行统计.用样本估计总体,选取的样本应具有代表性用样本估计总体,选取的样本应具有代表性.例例3 3 为比较甲、乙两种新品种水稻的产品质量,收割时为比较甲、乙两种新品种水稻的产品质量,收割时抽取了五块具有完全相同条件的实验田地,称得它们各抽取了五块具有完全相同条件的实验田地,称得它们各自质量,得其每公顷产量如下表(单位:自质量,得其每公顷产量如下表(单位:g g):):12345甲12.61212.311.712.9乙12.312.312.311.413.2(1)哪一种品种平均每公顷的产量较高?)哪一种品种平均每公顷的产量较高?(2)哪个品种产量较稳定?)哪个品种产量较稳定?分析:现在要通过比较甲、乙两个新品种分析:现在要通过比较甲、乙两个新品种在试验田中的产量和产量的稳定性,来估在试验田中的产量和产量的稳定性,来估计甲、乙两个新品种在这一地区的产量和计甲、乙两个新品种在这一地区的产量和产量的稳定性,这实际上就是用样本的平产量的稳定性,这实际上就是用样本的平均数和方差来估计总体的平均数和方差均数和方差来估计总体的平均数和方差.1、判断下面这几个抽样调查选取样本的方法是否合适,并说、判断下面这几个抽样调查选取样本的方法是否合适,并说明理由:明理由:(1)一食品厂为了解其产品质量情况,在其生产流水线上每隔一食品厂为了解其产品质量情况,在其生产流水线上每隔100包选取一包检查其质量;包选取一包检查其质量;(2)一手表厂欲了解一手表厂欲了解611岁少年儿童戴手表的比例,周末来到岁少年儿童戴手表的比例,周末来到一家业余艺术学校调查一家业余艺术学校调查200名在那里学习的学生名在那里学习的学生.试一试试一试以上的几个问题由学生分组讨论,而后请代表来回答。以上的几个问题由学生分组讨论,而后请代表来回答。合适合适,因为具有代表性因为具有代表性.这是一种随机抽样方法这是一种随机抽样方法.不合适不合适,因为不具有代表性因为不具有代表性.周末去业余艺术学校学习的周末去业余艺术学校学习的学生往往家庭的经济条件比较好,所以不具有代表性学生往往家庭的经济条件比较好,所以不具有代表性.2、某养鱼专业户为了估计湖里有多少条鱼,先捕某养鱼专业户为了估计湖里有多少条鱼,先捕上上100条做上标记,然后放回到湖里,过一段时间待条做上标记,然后放回到湖里,过一段时间待带标记的鱼完全混合于鱼群后,再捕上带标记的鱼完全混合于鱼群后,再捕上200条鱼,发条鱼,发现其中带标记的鱼有现其中带标记的鱼有20条,湖里大约有多少条鱼条,湖里大约有多少条鱼?解:解:则则 20200 100 1000.答:湖里大约有答:湖里大约有1000条鱼条鱼
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!