资源描述
第四节第四节变量间的相关关系、统计案例变量间的相关关系、统计案例 1.变变量间的相关关系量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线称两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归方程为回归方程为ybxa,其中,其中bi1nxiyin x yi1nx2in x2i1n xi x yi y i1n xi x 2, a y bx . (3)通过求通过求Qi1n yibxia 2的最小值而得到回归直线的方法, 即使得样本数据的点到回的最小值而得到回归直线的方法, 即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法归直线的距离的平方和最小,这一方法叫做最小二乘法. (4)相关系数:相关系数: 当当 r0 时,表明两个变量正相关;当时,表明两个变量正相关;当 r0 时,表明两个变量负相关时,表明两个变量负相关. r 的绝对值越接近于的绝对值越接近于 1,表明两个变量的线性相关性越强,表明两个变量的线性相关性越强.r 的绝对值越接近于的绝对值越接近于 0 时,表明时,表明两个变量之间几乎不存在线性相关两个变量之间几乎不存在线性相关关系关系.通常通常|r|大于大于 0.75 时,认为两个变量有很强的线性相关时,认为两个变量有很强的线性相关性性. 3.独立性检验独立性检验 假设有两个分类变量假设有两个分类变量 X 和和 Y,它们的取值分别为,它们的取值分别为x1,x2和和y1,y2,其样本频数列联表,其样本频数列联表 称为称为 22列联表列联表 为为 K2n adbc 2 ab ac bd cd (其中其中 nabcd 为样本容量为样本容量). 相关关系与函数关系异同点相关关系与函数关系异同点 共同点:二者都是指两个变量间的关系共同点:二者都是指两个变量间的关系. 不同点:函数关不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性 y1 y2 总计总计 x1 a b ab x2 c d cd 总计总计 ac bd abcd 关系,体现的不一定是因果关系,可能是伴随关系关系,体现的不一定是因果关系,可能是伴随关系. 回归直线回归直线ybxa必过样本点的中心必过样本点的中心( x , y ),这个结论既是检验所求回归直线方程,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据是否准确的依据,也是求参数的一个依据. r 的符号表明两个变量是正相关还是负相关;的符号表明两个变量是正相关还是负相关;|r|的大小表示线性相关性的强弱的大小表示线性相关性的强弱. 独立性检验独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. 小题查验基础小题查验基础 一、一、判断题判断题(对的打对的打“”,错的打,错的打“”“”) (1)散点图是判断两个变量是否相关的一种重要方法和手段散点图是判断两个变量是否相关的一种重要方法和手段.( ) (2)回归直线方程回归直线方程ybxa至少经过点至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点中的一个点.( ) (3)若事件若事件 X,Y 关系越密切,则由观测数据计算得到的关系越密切,则由观测数据计算得到的 K2的观测值越小的观测值越小.( ) (4)两个变量的相关系数的绝对值越接近于两个变量的相关系数的绝对值越接近于 1,它们的相关性越强,它们的相关性越强.( ) 答案:答案:(1) (2) (3) (4) 二、选填题二、选填题 1.已知变量已知变量 x,y 之间具有线性相关关系,其散点图如图所示,之间具有线性相关关系,其散点图如图所示,回归直线回归直线 l 的方程为的方程为ybxa,则下列说法正确的是,则下列说法正确的是( ) A.a0,b0 B.a0,b0 C.a0,b0 D.a0,b0 解析:解析:选选 D 由题图可知,回归直线的斜率是正数,即由题图可知,回归直线的斜率是正数,即b0;回归直线在;回归直线在 y 轴上的截距轴上的截距是负数,即是负数,即a0,故选,故选 D. 2.为了考察两个变量为了考察两个变量 x 和和 y 之间的线性相关性,甲、乙两位同学各自独立地做之间的线性相关性,甲、乙两位同学各自独立地做 10 次和次和 15次试验,并且利用线性回归方法,求得回归直线分别为次试验,并且利用线性回归方法,求得回归直线分别为 l1和和 l2,已知两个人在试验中发现,已知两个人在试验中发现对对变量变量 x 的观测数据的平均值都是的观测数据的平均值都是 s,对变量,对变量 y 的观测数据的平均值都是的观测数据的平均值都是 t,那么下列说法正确,那么下列说法正确的是的是( ) A.l1和和 l2必定平行必定平行 B.l1与与 l2必定重合必定重合 C.l1和和 l2一定有公共点一定有公共点(s,t) D.l1与与 l2相交,但交点不一定是相交,但交点不一定是(s,t) 解析:解析:选选 C 注意到回归直线必经过样本中心点注意到回归直线必经过样本中心点. 3.下面是下面是 22 列联表:列联表: y1 y2 总计总计 x1 a 21 73 x2 22 25 47 总计总计 b 46 120 则表中则表中 a,b 的值分别为的值分别为_,_. 解析:解析:a2173,a52,又,又 a22b,b74. 答案:答案:52 74 4.已知已知 x,y 的取值如下表,从散点图可以看出的取值如下表,从散点图可以看出 y 与与 x 具有线性相关关系,且回归方程为具有线性相关关系,且回归方程为y0.95xa,则,则a_. x 0 1 3 4 y 2.2 4.3 4.8 6.7 解析:解析:回归直线必过样本点的中心回归直线必过样本点的中心( x , y ),又,又 x 2, y 4.5,代,代入回归方程,得入回归方程,得a2.6. 答案:答案:2.6 考点一考点一 相关关系的判断相关关系的判断基础自学过关基础自学过关 题组练透题组练透 1.两个变量的相关关系有两个变量的相关关系有正相关,正相关,负相关,负相关,不相关,则下列散点图从左到右分别反不相关,则下列散点图从左到右分别反映的映的变量间的相关关系是变量间的相关关系是( ) A. B. C. D. 解析:解析:选选 D 第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是中的点的分布没有什么规律,则是不相关,所以应该是. 2.已知变量已知变量 x 和和 y 满足关系满足关系 y0.1x1,变量,变量 y 与与 z 正相关正相关.下列结论中正确的是下列结论中正确的是( ) A.x 与与 y 正相关,正相关,x 与与 z 负相关负相关 B.x 与与 y 正相关,正相关,x 与与 z 正相关正相关 C.x 与与 y 负相关,负相关,x 与与 z 负相关负相关 D.x 与与 y 负相关,负相关,x 与与 z 正相关正相关 解析:解析:选选 C 因为因为 y0.1x1 的斜率小于的斜率小于 0, 故故 x 与与 y 负相关负相关.因为因为 y 与与 z 正相关,可设正相关,可设 zbya,b0,则,则 zbya0.1bxba,故故 x 与与 z 负相关负相关. 3.在一组样本数据在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等不全相等)的散的散点图中,若所有样本点点图中,若所有样本点(xi,yi)(i1,2,n)都在直线都在直线 y12x1 上,则这组样本数据的样本上,则这组样本数据的样本相关系数为相关系数为( ) A.1 B.0 C.12 D.1 解析:解析:选选 D 所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为 1,故选故选 D. 4.变量变量 X 与与 Y 相应的一组数据为相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量;变量 U 与与 V相对应的一组数据为相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量表示变量 Y 与与 X 之间的线性之间的线性相关系数,相关系数,r2表示变量表示变量 V 与与 U 之间的线性相关系数,则之间的线性相关系数,则( ) A.r2r10 B.0r2r1 C.r20r1 D.r2r1 解析:解析:选选 C 对于变量对于变量 Y 与与 X 而言,而言,Y 随随 X 的增大而增大,故的增大而增大,故 Y 与与 X 正相关,即正相关,即 r10;对于变量对于变量 V 与与 U 而言,而言,V 随随 U 的增大而减小,故的增大而减小,故 V 与与 U 负相关,即负相关,即 r20,故选,故选 C. 名师微点名师微点 判断相关关系的判断相关关系的 2 种方法种方法 (1)散点图法:散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. (2)相关系数法:相关系数法:利用相关系数判定,当利用相关系数判定,当|r|越趋近于越趋近于 1 相关性越强相关性越强. 考点二考点二 回归分析回归分析师生共研师生共研过关过关 典例精析典例精析 下图是我国下图是我国 2011 年至年至 2017 年生活垃圾无害化处理量年生活垃圾无害化处理量(单位:亿吨单位:亿吨)的折线图的折线图. (1)由折线图看出,可用线性回归模型拟合由折线图看出,可用线性回归模型拟合 y 与与 t 的关系,请用相关系数加以说明;的关系,请用相关系数加以说明; (2)建立建立 y 关于关于 t 的回归方程的回归方程(系数精确到系数精确到 0.01),预测,预测 2019 年我国生活垃圾无害化处年我国生活垃圾无害化处理量理量. 参考数据:参考数据:i17yi9.32,i17tiyi40.17, i17 yi y 20.55, 72.646. 参考公式:相关系数参考公式:相关系数 ri1n ti t yi y i1n ti t 2i1n yi y 2,回归方,回归方程程yabt 中斜率和截距中斜率和截距的最小二乘估计公式分别为的最小二乘估计公式分别为bi1n ti t yi y i1n ti t 2,a y b t . 解解 (1)由折线图中的数据和附注中的参考数据得由折线图中的数据和附注中的参考数据得 t 4,i17 (ti t )228, i17 yi y 20.55, i17 (ti t )(yi y )i17tiyi ti17yi40.1749.322.89, r2.890.5522.6460.99. 因为因为 y 与与 t 的相关系数近似为的相关系数近似为 0.99,说明,说明 y 与与 t 的线性相关程度相当大,从而可以用线性的线性相关程度相当大,从而可以用线性回归模型拟合回归模型拟合 y 与与 t 的关系的关系. (2)由由 y 9.3271.331 及及(1)得得 bi17 ti t yi y i17 ti t 22.89280.103. a y b t 1.3310.10340.92. 所以所以 y 关于关于 t 的回归方程为的回归方程为y0.920.10t. 将将 2019 年对应的年对应的 t9 代入回归方程得代入回归方程得y0.920.1091.82. 所以,预测所以,预测 2019 年我国生活垃圾无害化处理量约为年我国生活垃圾无害化处理量约为 1.82 亿吨亿吨. 解题技法解题技法 1.线性回归分析问题的类型及解题方法线性回归分析问题的类型及解题方法 (1)求线性回归方程求线性回归方程 利用公式,求出回归系数利用公式,求出回归系数b,a. 待定系数法:利用回归直线过样本点的中心求系数待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数利用回归直线判断正、负相关,决定正相关还是负相关的是系数b. (4)回归方程的拟合效果,可以利用相关系数判断,当回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于越趋近于 1 时,两变量的线性相时,两变量的线性相关关性越强性越强. 2.模型拟合效果的判断模型拟合效果的判断 (1)残差平方和越小,模型的拟合效果越好残差平方和越小,模型的拟合效果越好. (2)相关指数相关指数 R2越大,模型的拟合效果越好越大,模型的拟合效果越好. (3)回归方程的拟合效果,可以利用相关系数判断,当回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于越趋近于 1 时,两变量的线性相时,两变量的线性相关性越强关性越强. 过关训练过关训练 1.(2019 广州调研广州调研)某基地蔬菜大棚采用无土栽培方式种植各类某基地蔬菜大棚采用无土栽培方式种植各类蔬菜蔬菜.过去过去 50 周的资料显示,该地周光照量周的资料显示,该地周光照量 X(单位:小时单位:小时)都在都在 30小时以上,其中不足小时以上,其中不足 50 小时的有小时的有 5 周,不低于周,不低于 50 小时且不超过小时且不超过 70小时的有小时的有 35 周,超过周,超过 70 小时的有小时的有 10 周周.根据统计,该基地的西红根据统计,该基地的西红柿增加量柿增加量 y(千克千克)与使与使用某种液体肥料的质量用某种液体肥料的质量 x(千克千克)之间的对应数据为如图所示的折线图之间的对应数据为如图所示的折线图. (1)依据折线图计算相关系数依据折线图计算相关系数 r(精确到精确到 0.01),并据此判断是否可用线性回归模型拟合,并据此判断是否可用线性回归模型拟合 y 与与x 的关系的关系.(若若|r|0.75,则线性相关程度很高,可用线性回归模型拟合,则线性相关程度很高,可用线性回归模型拟合) (2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量周光照控制仪运行台数受周光照量 X 限制,并有如下关系:限制,并有如下关系: 周光照量周光照量 X/小时小时 30X50 50X70 X70 光照控制仪运行台数光照控制仪运行台数 3 2 1 对商家来说,若某台光照控制仪运行,则该台光照控制仪对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为产生的周利润为 3 000 元;若某元;若某台光照控制仪未运行,则该台光照控制仪周亏损台光照控制仪未运行,则该台光照控制仪周亏损 1 000 元元.若商家安装了若商家安装了 3 台光照控制仪,求台光照控制仪,求商家在过去商家在过去 50 周的周总利润的平均值周的周总利润的平均值. 参考数据:参考数据: 0.30.55, 0.90.95. 解:解:(1)由已知数据可得由已知数据可得 x 2456855, y 3444554. 因为因为i15 (xi x )(yi y )(3)(1)000316, i15 xi x 2 3 2 1 20212322 5, i15 yi y 2 1 202020212 2, 所以相关系数所以相关系数 ri15 xi x yi y i15 xi x 2 i15 yi y 262 5 2 9100.95. 因为因为|r|0.75,所以可用线性回归模型拟合,所以可用线性回归模型拟合 y 与与 x 的关系的关系. (2)由条件可得在过去由条件可得在过去 50 周里,周里, 当当 X70 时,共有时,共有 10 周,此时只有周,此时只有 1 台光照控制仪运行,台光照控制仪运行, 每周的周总利润为每周的周总利润为 13 00021 0001 000(元元). 当当 50X70 时,共有时,共有 35 周,此时有周,此时有 2 台光照控制仪运行,台光照控制仪运行, 每周的周总利润为每周的周总利润为 23 00011 0005 000(元元). 当当 30X50 时,共有时,共有 5 周,此时周,此时 3 台光照控制仪都运行,台光照控制仪都运行, 每周的周总利润为每周的周总利润为 33 0009 000(元元). 所以过去所以过去 50 周的周总利润的平均值为周的周总利润的平均值为 1 000105 000359 0005504 600(元元), 所以商家在过去所以商家在过去 50 周的周总利润的平均值为周的周总利润的平均值为 4 600 元元. 2.某机构为研究某种图书每册的成本费某机构为研究某种图书每册的成本费 y(单位:元单位:元)与印刷数量与印刷数量 x(单位:千册单位:千册)的关系,收的关系,收集了一些数据并进行了初步处理,得到了下集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值面的散点图及一些统计量的值. x y u i18 (xi x )2 i18 (xi x )(yi y ) i18 (ui u )2 i18 (ui u )(yi y ) 15.25 3.63 0.269 2 085.5 230.3 0.787 7.049 表中表中 ui1xi, u 18i18ui. (1)根据散点图判断:根据散点图判断: yabx与与 ycdx哪一个模型更适合作为该图书每册的成本费哪一个模型更适合作为该图书每册的成本费 y(单单位:元位:元)与印刷数量与印刷数量 x(单位:千册单位:千册)的回归方程?的回归方程?(只要求给出判断,不必说明理由只要求给出判断,不必说明理由) (2)根据根据(1)的判断结果及表中数据, 建立的判断结果及表中数据, 建立y关于关于x的回归方程的回归方程(回归系数的结果精确到回归系数的结果精确到0.01). (3)若该图书每册的定价为若该图书每册的定价为 10 元,则至少应该印刷多少册才能使销售利润不低于元,则至少应该印刷多少册才能使销售利润不低于 78 840元?元?(假设能够全部售出假设能够全部售出.结果精确到结果精确到 1) 附:对于一组数据附:对于一组数据(1,1),(2,2),(n,n),其回归直线,其回归直线 的斜率和截的斜率和截距的最小二乘估计分别为距的最小二乘估计分别为i1n i i i1n i 2, . 解:解:(1)由散点图判断,由散点图判断,ycdx更适合作为该图书每册的成本费更适合作为该图书每册的成本费 y(单位:元单位:元)与印刷数量与印刷数量x(单位:千册单位:千册)的回归方程的回归方程. (2)令令 u1x,先建立,先建立 y 关于关于 u 的线性回归方程,的线性回归方程, 由于由于di18 ui u yi y i18 ui u 27.0490.7878.9578.96, c y du 3.638.9570.2691.22, y 关于关于 u 的线性回归方程为的线性回归方程为y1.228.96u, y 关于关于 x 的回归方程为的回归方程为y1.228.96x. (3)假设印刷假设印刷 x 千册,千册, 依题意得依题意得 10 x 1.228.96xx78.840, 解得解得 x10, 至少印刷至少印刷 10 000 册才能使销售利润不低于册才能使销售利润不低于 78 840 元元. 考点三考点三 独立性检验独立性检验师生共研过关师生共研过关 典例精析典例精析 (2019 河北名校联考河北名校联考)某企业有两个分厂生产某种零件,按规定内径尺寸某企业有两个分厂生产某种零件,按规定内径尺寸(单位:单位:mm)的值的值落在落在29.94,30.06)的零件为优质品的零件为优质品.从两个分厂生产的零件中各抽出了从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,件,量其内径尺寸, 得结果如下表:得结果如下表: 甲厂:甲厂: 分组分组 29.86,29.90) 29.90,29.94) 29.94,29.98) 29.98,30.02) 频数频数 12 63 86 182 分组分组 30.02,30.06) 30.06,30.10) 30.10,30.14 频数频数 92 61 4 乙厂:乙厂: 分组分组 29.86,29.90) 29.90,29.94) 29.94,29.98) 29.98,30.02) 频数频数 29 71 85 159 分组分组 30.02,30.06) 30.06,30.10) 30.10,30.14 频数频数 76 62 18 (1)试分别估计两个分厂生产的零件的优质品率;试分别估计两个分厂生产的零件的优质品率; (2)由以上统由以上统计数据完成下面计数据完成下面 22 列联表,并判断是否有列联表,并判断是否有 99%的把握认为的把握认为“两个分厂生两个分厂生产的零件的质量有差异产的零件的质量有差异”. 甲厂甲厂 乙厂乙厂 总计总计 优质品优质品 非优质品非优质品 总计总计 解解 (1)甲厂抽查的甲厂抽查的 500 件产品中有件产品中有 360 件优质品, 从而估计甲厂生产的零件的优质品率件优质品, 从而估计甲厂生产的零件的优质品率为为360500100%72%; 乙厂抽查的乙厂抽查的 500 件产品中有件产品中有 320 件优质品,从而估计乙厂生产的零件的优质品率为件优质品,从而估计乙厂生产的零件的优质品率为320500100%64%. (2)完成的完成的 22 列联表如下:列联表如下: 甲厂甲厂 乙厂乙厂 总计总计 优质品优质品 360 320 680 非优质品非优质品 140 180 320 总计总计 500 500 1 000 由表中数据计算得,由表中数据计算得, K21 000 360180320140 25005006803207.3536.635, 所以有所以有 99%的把握认为的把握认为“两个分厂生产的零件的质量有差异两个分厂生产的零件的质量有差异”. 解题技法解题技法 独立性检验的一般步骤独立性检验的一般步骤 (1)根据样本数据列出根据样本数据列出 22 列联表列联表. (2)计算随机变量计算随机变量 K2的观测值的观测值 k,查下表确定临界值,查下表确定临界值 k0: P(K2k0) 0.50 0.40 0.25 0.15 0.10 k0 0.455 0.708 1.323 2.072 2.706 P(K2k0) 0.05 0.025 0.010 0.005 0.001 k0 3.841 5.024 6.635 7.879 10.828 (3)如果如果 kk0,就推断,就推断“X 与与 Y 有关系有关系”,这种推断犯错误的概率不超过,这种推断犯错误的概率不超过 P(K2k0);否;否则,就认为在犯错误的概率不超过则,就认为在犯错误的概率不超过 P(K2k0)的前提下不能推断的前提下不能推断“X 与与 Y 有关有关”. 过关训练过关训练 (2018 全国卷全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式的两种新的生产方式.为比较两种生产为比较两种生产方式的效率,选取方式的效率,选取 40 名工人,将他们随机分成两组,每名工人,将他们随机分成两组,每组组 20 人人.第一组工人用第一种生产方式,第二组工人用第二种生产方式第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任根据工人完成生产任务的工作时间务的工作时间(单位:单位:min)绘制了如下茎叶图:绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由根据茎叶图判断哪种生产方式的效率更高?并说明理由. (2)求求 40 名工人完成生产任务所需时间的中位数名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过,并将完成生产任务所需时间超过 m和不超过和不超过 m 的工人数填入下面的列联表:的工人数填入下面的列联表: 超过超过 m 不超过不超过 m 第一种生产方式第一种生产方式 第二种生产方式第二种生产方式 (3)根据根据(2)中的列联表,能否有中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?的把握认为两种生产方式的效率有差异? 附:附:K2n adbc 2 ab cd ac bd , 解:解:(1)第二种生产方式的效率更高第二种生产方式的效率更高. 理由如下:理由如下: ()由茎叶图可知:用第一种生产方式的工人中,有由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间的工人完成生产任务所需时间高于高于 80 min, 用第二种生产方式的工人中, 有, 用第二种生产方式的工人中, 有 75%的工人完成生产任务所需时间低于的工人完成生产任务所需时间低于 79 min.因此第二种生产方式的效率更高因此第二种生产方式的效率更高. ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 min, 用第二种生产方式的工人完成生产任务所需时间的中位数为, 用第二种生产方式的工人完成生产任务所需时间的中位数为 73.5 min.因此第二种生产方因此第二种生产方式的效率更高式的效率更高. ()由茎叶图可知: 用第一种生产方式的工人完成生产任务所需平均时间高于由茎叶图可知: 用第一种生产方式的工人完成生产任务所需平均时间高于 80 min; 用; 用第二种生产方式的工人完成生产任务所需平均时间低于第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更因此第二种生产方式的效率更高高. ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最上的最多,关于茎多,关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7上的最多,关于茎上的最多,关于茎 7 大致呈对称分布大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成用第一种生产方式完成生产任务所需的时间更少生产任务所需的时间更少.因此第二种生产方式的效率更高因此第二种生产方式的效率更高. (以上给出了以上给出了 4 种理由,考生答出其中任意一种或其他合理理由均可得分种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知由茎叶图知 m7981280. 列联表如下:列联表如下: 超过超过 m 不超过不超过 m 第一种生产方式第一种生产方式 15 5 第二种生产方式第二种生产方式 5 15 (3)因为因为 K240 151555 220202020106.635,所以有,所以有 99%的把握认为两种生产方式的的把握认为两种生产方式的效率有差异效率有差异.
展开阅读全文