人教版 高中数学【选修 21】 :第一章1.2独立性检验的基本思想及其初步应用

上传人:仙*** 文档编号:44589895 上传时间:2021-12-05 格式:DOC 页数:24 大小:670.50KB
返回 下载 相关 举报
人教版 高中数学【选修 21】 :第一章1.2独立性检验的基本思想及其初步应用_第1页
第1页 / 共24页
人教版 高中数学【选修 21】 :第一章1.2独立性检验的基本思想及其初步应用_第2页
第2页 / 共24页
人教版 高中数学【选修 21】 :第一章1.2独立性检验的基本思想及其初步应用_第3页
第3页 / 共24页
点击查看更多>>
资源描述
人教版高中数学精品资料独立性检验的基本思想及其初步应用预习课本预习课本 P1015,思考并完成以下问题思考并完成以下问题1分类变量与列联表分别是如何定义的?分类变量与列联表分别是如何定义的?2独立性检验的基本思想是怎样的?独立性检验的基本思想是怎样的?3独立性检验的常用方法有哪些?独立性检验的常用方法有哪些?新知初探新知初探1与列联表相关的概念与列联表相关的概念(1)分类变量:变量的不同分类变量:变量的不同“值值”表示个体所属的表示个体所属的不同类型不同类型,像这样的变量称为分类变,像这样的变量称为分类变量量(2)列联表:列联表:列出的两个分类变量的列出的两个分类变量的频数表频数表, 称为列联表称为列联表一般地一般地,假设有两个分类变量假设有两个分类变量 X 和和 Y,它们的取值分别为它们的取值分别为x1,x2和和y1,y2,其样本其样本频数列联表频数列联表(称为称为 22 列联表列联表)为:为:y1y2总计总计x1ababx2cdcd总计总计acbdabcd在在 22 列联表中,如果两个分类变量没有关系,则应满足列联表中,如果两个分类变量没有关系,则应满足 adbc0, 因此因此|adbc|越越小,小, 关系越弱;关系越弱; |adbc|越大,越大, 关系越强关系越强2等高条形图等高条形图等高条形图与表格相比等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否图形更能直观地反映出两个分类变量间是否相互影响相互影响, 常用常用等高条形图展示列表数据的等高条形图展示列表数据的频率特征频率特征3独立性检验的基本思想独立性检验的基本思想(1)定义:利用随机变量定义:利用随机变量 K2来判断来判断“两个分类变量两个分类变量有关系有关系”的方法称为独立性检验的方法称为独立性检验(2)公式:公式:K2n adbc 2 ab cd ac bd ,其中,其中 nabcd 为样本容量为样本容量小试身手小试身手1判断下列命题是否正确判断下列命题是否正确(正确的打正确的打“”“”,错误的打,错误的打“”“”)(1)分类变量中的变量与函数中的变量是同一概念分类变量中的变量与函数中的变量是同一概念()(2)列联表频率分析法列联表频率分析法、等高条形图可初步分析两分类变量是否有关系等高条形图可初步分析两分类变量是否有关系, 而独立性检验而独立性检验中中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小取值则可通过统计表从数据上说明两分类变量的相关性的大小()(3)独立性检验的方法就是反证法独立性检验的方法就是反证法()答案:答案:(1)(2)(3)2与表格相比,能更直观地反映出相关数据总体状况的是与表格相比,能更直观地反映出相关数据总体状况的是()A列联表列联表B散点图散点图C残差图残差图D等高条形图等高条形图答案:答案:D3如果有如果有 99%的把握认为的把握认为“X 与与 Y 有关系有关系”,那么具体算出的数据满足,那么具体算出的数据满足()附表:附表:P(K2k0)0050025001000050001k0384150246635787910828Ak6635Bk5024Ck7879Dk3841答案:答案:A4下面是一个下面是一个 22 列联表:列联表:y1y2总计总计x1a2173x222527总计总计b46100则表中则表中 a,b 的值分别为的值分别为_答案:答案:52, 54等高条形图的应用等高条形图的应用典例典例为了解铅中毒病人与尿棕色素为阳性是否有关系为了解铅中毒病人与尿棕色素为阳性是否有关系, 分别对病人组和对照组的尿分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:液作尿棕色素定性检查,结果如下:组别组别阳性数阳性数阴性数阴性数总计总计铅中毒病人铅中毒病人29736对照组对照组92837总计总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?铅中毒病人与尿棕色素为阳性是否有关系?解解等高条形图如图所示:等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系此铅中毒病人与尿棕色素为阳性有关系在等高条形图中在等高条形图中, 可以估计满足条可以估计满足条件件Xx1的个体中具的个体中具有有Yy1的个体所占的比例的个体所占的比例aab,也可以估计满足条件也可以估计满足条件 Xx2的个体中具有的个体中具有 Yy1的个体所占的比例的个体所占的比例ccd 两个比例的值相差两个比例的值相差越大,越大,X 与与 Y 有关系成立的可能性就越大有关系成立的可能性就越大活学活用活学活用某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生 426 人人中有中有 332 人在考前心情紧张,性格外向的学生人在考前心情紧张,性格外向的学生 594 人中有人中有 213 人在考前心情紧张,作出等人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系高条形图,利用图形判断考前心情紧张与性格类别是否有关系解:解:作列联表如下:作列联表如下:性格内向性格内向性格外向性格外向总计总计考前心情紧张考前心情紧张332213545考前心情不紧张考前心情不紧张94381475总计总计4265941 020相应的等高条形图如图所示:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关以认为考前紧张与性格类型有关两个变量的独立性检验两个变量的独立性检验典例典例为了探究学生选报文为了探究学生选报文、理科是否与对外语的兴趣有关理科是否与对外语的兴趣有关,某同学调查了某同学调查了 361 名高名高二在校学生二在校学生,调查结果如下调查结果如下:理科对外语有兴趣的有理科对外语有兴趣的有 138 人人,无兴趣的有无兴趣的有 98 人人,文科对外文科对外语有兴趣的有语有兴趣的有 73 人人,无兴趣的有无兴趣的有 52 人人能否在犯错误的概率不超过能否在犯错误的概率不超过 01 的前提下的前提下,认为认为“学生选报文、理科与对外语的兴趣有关学生选报文、理科与对外语的兴趣有关”?解解根据题目所给的数据得到如下列联表:根据题目所给的数据得到如下列联表:理科理科文科文科总计总计有兴趣有兴趣13873211无兴趣无兴趣9852150总计总计236125361根据列联表中数据由公式计算得随机变量根据列联表中数据由公式计算得随机变量 K2的观测值的观测值k361 138527398 22111502361251871104因为因为 18711045024,所以在犯错误的概率不超过所以在犯错误的概率不超过 0025 的前提下认为休闲方式与性别有关的前提下认为休闲方式与性别有关独立性检验的综合应用独立性检验的综合应用典例典例某中学某中学将将 100名高一新生分成水平相同的甲名高一新生分成水平相同的甲、 乙两个乙两个“平行班平行班”, 每每班班50 人人 陈陈老师采用老师采用 A, B 两种不同的教学方式分别在甲两种不同的教学方式分别在甲、 乙两个班级进行教改实验乙两个班级进行教改实验 为了解教学效果为了解教学效果,期末考试后期末考试后,陈老师分别从两个班级中各随机抽取陈老师分别从两个班级中各随机抽取 20 名学生的成绩进行统计名学生的成绩进行统计,作出茎叶图作出茎叶图如图记成绩不低于如图记成绩不低于 90 分者为分者为“成绩优秀成绩优秀”(1)在乙班样本的在乙班样本的 20 个个体中,从不低于个个体中,从不低于 86 分的成绩中随机抽取分的成绩中随机抽取 2 个,求抽出的两个个,求抽出的两个均均“成绩优秀成绩优秀”的概率;的概率;(2)由以上统计数据作出列联表由以上统计数据作出列联表, 并判断能否在犯错误的概率不超过并判断能否在犯错误的概率不超过 0 1 的前提下认为的前提下认为:“成绩优秀成绩优秀”与教学方式有关与教学方式有关解解(1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于 86分的成绩中随机抽取两个包含的基本事件是:分的成绩中随机抽取两个包含的基本事件是:(86,93), (86,96), (86,97), (86,99), (86,99),(93,96),(93,97), (93,99), (93,99), (96,97), (96,99), (96,99),(97,99),(97,99),(99,99),共有共有 15种结果,种结果,符合条件的事件数符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有,共有 10 种结果,种结果,根据等可能事件的概率得到根据等可能事件的概率得到 P101523(2)由已知数据得由已知数据得甲班甲班乙班乙班总计总计成绩优秀成绩优秀156成绩不优秀成绩不优秀191534总计总计202040根据列联表中的数据,计算得随机变量根据列联表中的数据,计算得随机变量 K2的观测值的观测值k40 115519 263420203137,由于由于 31372706,所以在犯错误的概率不超过,所以在犯错误的概率不超过 01 的前提下认为:的前提下认为:“成绩优秀成绩优秀”与教学方式有关与教学方式有关(1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系联系(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论活学活用活学活用某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的他们把收集到的 180 节课分为三类课堂教学模式,教师主讲的为节课分为三类课堂教学模式,教师主讲的为 A 模式,少数学生参与的模式,少数学生参与的为为 B 模式,多数学生参与的为模式,多数学生参与的为 C 模式,模式,A,B,C 三类课的节数比例为三类课的节数比例为 321(1)为便于研究分析,教育专家将为便于研究分析,教育专家将 A 模式称为传统课堂模式,模式称为传统课堂模式,B,C 统称为新课堂模式统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下 22列联表列联表(单位:节单位:节)高效高效非高效非高效总计总计新课堂模式新课堂模式603090传统课堂模式传统课堂模式405090总计总计10080180请根据统计数据回答:有没有请根据统计数据回答:有没有 99%的把握认为课堂教学效率与教学模式有关?并说明的把握认为课堂教学效率与教学模式有关?并说明理由理由(2)教育专家采用分层抽样的方法从收集到的教育专家采用分层抽样的方法从收集到的 180 节课中选出节课中选出 12 节课作为样本进行研节课作为样本进行研究究,并从样本中的并从样本中的 B 模式和模式和 C 模式课堂中随机抽取模式课堂中随机抽取 2 节课节课,求至少有一节课为求至少有一节课为 C 模式课堂模式课堂的概率的概率参考临界值有:参考临界值有:P(K2k0)0100050025001000050001k02706384150246635787910828参考公式:参考公式:K2n adbc 2 ab cd ac bd ,其中其中 nabcd解:解:(1)由列联表中的统计数据计算随机变量由列联表中的统计数据计算随机变量 K2的观测值为:的观测值为:k180 60504030 210080909096635,由临界值表由临界值表 P(K26635)0010,有有 99%的把握认为课堂效率与教学模式有关的把握认为课堂效率与教学模式有关(2)样本中的样本中的 B 模式课堂和模式课堂和 C 模式课堂分别是模式课堂分别是 4 节和节和 2 节节从中任取两节从中任取两节有有C2615 种取法种取法, 其中至少有一节课其中至少有一节课为为C模式课堂取法模式课堂取法有有C26C249种种,至少有一节课为至少有一节课为 C 模式课堂的概率为模式课堂的概率为91535层级一层级一学业水平达标学业水平达标1以下关于独立性检验的说法中,以下关于独立性检验的说法中, 错误的是错误的是()A独立性检验依赖于小概率原理独立性检验依赖于小概率原理B独立性检验得到的结论一定准确独立性检验得到的结论一定准确C样本不同,独立性检验的结论可能有差异样本不同,独立性检验的结论可能有差异D独立性检验不是判断两事物是否相关的唯一方法独立性检验不是判断两事物是否相关的唯一方法解析:解析:选选 B根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的并不一定是准确的2观察下列各图,其中两个分类变量之间关系最强的是观察下列各图,其中两个分类变量之间关系最强的是()解析:解析:选选 D在四幅图中,在四幅图中,D 图中两个阴影条的高相差最明显,说明两个分类变量之图中两个阴影条的高相差最明显,说明两个分类变量之间关系最强,故选间关系最强,故选 D3 在列联表中在列联表中, 下列哪两个比值相差越大下列哪两个比值相差越大, 两个分类变量有关系的可能性就越大两个分类变量有关系的可能性就越大()Aaab与与dcdBcab与与acdCaab与与ccdDaab与与cbc解析:解析:选选 C由等高条形图可知由等高条形图可知aab与与ccd的值相差越大,的值相差越大,|adbc|就越大,相关性就就越大,相关性就越强越强4对于分类变量对于分类变量 X 与与 Y 的随机变量的随机变量 K2的观测值的观测值 k,下列说法正确的是,下列说法正确的是()Ak 越大,越大,“X 与与 Y 有关系有关系”的可信程度越小的可信程度越小Bk 越小,越小,“X 与与 Y 有关系有关系”的可信程度越小的可信程度越小Ck 越接近于越接近于 0,“X 与与 Y 没有关系没有关系”的可信程度越小的可信程度越小Dk 越大,越大,“X 与与 Y 没有关系没有关系”的可信程度越大的可信程度越大解析:解析:选选 BK2的观测值的观测值 k 越大,越大,“X 与与 Y 有关系有关系”的可信程度越大因此,的可信程度越大因此,A、C、D 都不正确都不正确5考察棉花种子经过处理跟生病之间的关系得到下表数据:考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子处理种子未处理种子未处理总计总计得病得病32101133不得病不得病61213274总计总计93314407根据以上数据,可得出根据以上数据,可得出()A种子是否经过处理跟是否生病有关种子是否经过处理跟是否生病有关B种子是否经过处理跟是否生病无关种子是否经过处理跟是否生病无关C种子是否经过处理决定是否生病种子是否经过处理决定是否生病D以上都是错误的以上都是错误的解析解析:选选 B由由 K2407 3221361101 29331413327401642706,即没有把握认为是即没有把握认为是否经过处理跟是否生病有关否经过处理跟是否生病有关6 在一项打鼾与患心脏病的调查中在一项打鼾与患心脏病的调查中, 共调查共调查了了1 671人人, 经过计经过计算算K2的观测的观测值值k27 63,根据这一数据分析,我们有理由认为打鼾与患心脏病是根据这一数据分析,我们有理由认为打鼾与患心脏病是_的的(填填“有关有关”或或“无无关关”)解析:解析:K2的观测值的观测值 k2763,k10828,在犯错误的概率不超过在犯错误的概率不超过 0001 的的前提下认为打鼾与患心脏病是有关的前提下认为打鼾与患心脏病是有关的答案:答案:有关有关7如果根据性别与是否爱好运动的列联表得到如果根据性别与是否爱好运动的列联表得到 K238523841,则判断性别与是则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过否爱好运动有关,那么这种判断犯错的可能性不超过_解析:解析:P(K23841)005判断性别与是否爱好运动有关,出错的可能性不超过判断性别与是否爱好运动有关,出错的可能性不超过 5%答案:答案:5%8统计推断统计推断,当当_时时,在犯错误的概率不超过在犯错误的概率不超过 005 的前提下认为事件的前提下认为事件 A 与与 B有关;当有关;当_时,认为没有充分的证据显示事件时,认为没有充分的证据显示事件 A 与与 B 是有关的是有关的解析:解析:当当 k3841 时,就有在犯错误的概率不超过时,就有在犯错误的概率不超过 005 的前提下认为事件的前提下认为事件 A 与与 B有关,当有关,当 k2706 时认为没有充分的证据显示事件时认为没有充分的证据显示事件 A 与与 B 是有关的是有关的答案:答案:k3841k27069为了调查胃病是否与生活规律有关,在某地对为了调查胃病是否与生活规律有关,在某地对 540 名名 40 岁以上的人进行了调查,岁以上的人进行了调查,结果是:患胃病者生活不规律的共结果是:患胃病者生活不规律的共 60 人,患胃病者生活规律的共人,患胃病者生活规律的共 20 人,未患胃病者生活人,未患胃病者生活不规律的共不规律的共 260 人,未患胃病者生活规律的共人,未患胃病者生活规律的共 200 人人(1)根据以上数据列出根据以上数据列出 22 列联表;列联表;(2)在犯错误的概率不超过在犯错误的概率不超过 0 01 的前提下认为的前提下认为 40 岁以上的人患胃病与否和生活规律有岁以上的人患胃病与否和生活规律有关系吗?为什么?关系吗?为什么?解:解:(1)由已知可列由已知可列 22 列联表:列联表:患胃病患胃病未患胃病未患胃病总计总计生活规律生活规律20200220生活不规律生活不规律60260320总计总计80460540(2)根据列联表中的数据,由计算公式得根据列联表中的数据,由计算公式得 K2的观测值的观测值k540 2026020060 222032080460963896386635,因此因此,在犯错误的概率不超过在犯错误的概率不超过 001 的前提下认为的前提下认为 40 岁以上的人患胃病与否和生活规岁以上的人患胃病与否和生活规律有关律有关10为了解某班学生喜爱打篮球是否与性别有关为了解某班学生喜爱打篮球是否与性别有关,对本班对本班 50 人进行了问卷调查得到了人进行了问卷调查得到了如下的列联表:如下的列联表:喜爱打篮球喜爱打篮球不喜爱打篮球不喜爱打篮球合计合计男生男生ab5女生女生c10d合计合计50已知在全部已知在全部 50 人中随机抽取人中随机抽取 1 人抽到爱打篮球的学生的概率为人抽到爱打篮球的学生的概率为35(1)请将上面的列联表补充完整;请将上面的列联表补充完整;(2)是否有是否有 995%的把握认为喜爱打篮球与性别有关;请说明理由的把握认为喜爱打篮球与性别有关;请说明理由附参考公式:附参考公式:K2n adbc 2 ab cd ac bd ,其中,其中 nabcdP(K2k0)0150100050025001000050001k020722706384150246635787910828解解:(1)列联表补充如下:列联表补充如下:喜爱打篮球喜爱打篮球不喜爱打篮球不喜爱打篮球合计合计男生男生20525女生女生101525合计合计302050(2)K250 2015105 23020252583337879,有有 995%的把握认为喜爱打篮球与性别有关的把握认为喜爱打篮球与性别有关层级二层级二应试能力达标应试能力达标1在第在第 29 届北京奥运会上,中国健儿取得了届北京奥运会上,中国健儿取得了 51 金、金、21 银、银、28 铜的好成绩,稳居金铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的友为此进行了调查,在参加调查的 2 548 名男性中有名男性中有 1 560 名持反对意见,名持反对意见,2 452 名女性中名女性中有有 1 200 名持反对意见名持反对意见, 在运用这些数据说明性别对判断在运用这些数据说明性别对判断“中国进入了世界体育强国之列中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力是否有关系时,用什么方法最有说服力()A平均数与方差平均数与方差B回归直线方程回归直线方程C独立性检验独立性检验D概率概率解析:解析:选选 C由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合况,判断有关与无关,符合 22 列联表的要求,故用独立性检验最有说服力列联表的要求,故用独立性检验最有说服力2对于独立性检验,下列说法正确的是对于独立性检验,下列说法正确的是()AK23841 时,有时,有 95%的把握说事件的把握说事件 A 与与 B 无关无关BK26635 时,有时,有 99%的把握说事件的把握说事件 A 与与 B 有关有关CK23841 时,有时,有 95%的把握说事件的把握说事件 A 与与 B 有关有关DK26635 时,有时,有 99%的把握说事件的把握说事件 A 与与 B 无关无关解析解析:选选 B由独立性检验的知识知由独立性检验的知识知:K23841 时时,有有 95%的把握认为的把握认为“变量变量 X 与与Y 有关系有关系”;K26635 时,有时,有 99%的把握认为的把握认为“变量变量 X 与与 Y 有关系有关系”故选项故选项 B 正确正确3想要检验是否喜欢参加体育活动是不是与性别有关,应该检验想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()AH0:男性喜欢参加体育活动:男性喜欢参加体育活动BH0:女性不喜欢参加体育活动:女性不喜欢参加体育活动CH0:喜欢参加体育活动与性别有关:喜欢参加体育活动与性别有关DH0:喜欢参加体育活动与性别无关:喜欢参加体育活动与性别无关解析解析: 选选 D独立性检验假设有反证法的意味独立性检验假设有反证法的意味, 应假设两类变量应假设两类变量(而非变量的属性而非变量的属性)无关无关,这时的这时的 K2应该很小,如果应该很小,如果 K2很大,则可以否定假设,如果很大,则可以否定假设,如果 K2很小,则不能够肯定或者否很小,则不能够肯定或者否定假设定假设4春节期间春节期间,“厉行节约厉行节约,反对浪费反对浪费”之风悄然吹开之风悄然吹开,某市通过随机询问某市通过随机询问 100 名性别名性别不同的居民是否能做到不同的居民是否能做到“光盘光盘”,得到如下的列联表:,得到如下的列联表:做不到做不到“光盘光盘”能做到能做到“光盘光盘”男男4510女女3015由此表得到的正确结论是由此表得到的正确结论是()A在犯错误的概率不超过在犯错误的概率不超过 001 的前提下的前提下,认为认为“该市居民能否做到该市居民能否做到光盘光盘与性别与性别有关有关”B在犯错误的概率不超过在犯错误的概率不超过 001 的前提下的前提下,认为认为“该市居民能否做到该市居民能否做到光盘光盘与性别与性别无关无关”C在犯错误的概率不超过在犯错误的概率不超过 01 的前提下,认为的前提下,认为“该市居民能否做到该市居民能否做到光盘光盘与性别与性别有关有关”D在犯错误的概率不超过在犯错误的概率不超过 01 的前提下,认为的前提下,认为“该市居民能否做到该市居民能否做到光盘光盘与性别与性别无关无关”解析:解析:选选 C由由 22 列联表得到列联表得到 a45,b10,c30,d15则则 ab55,cd45,ac75,bd25,ad675,bc300,n100代入代入 K2n adbc 2 ab cd ac bd ,得,得 K2的观测值的观测值 k100 675300 2554575253030因因为为 270630306635,故有,故有 99%的把握认为加工零件的质量与甲、乙有关的把握认为加工零件的质量与甲、乙有关8某大学餐饮中心为了解新生的饮食习惯某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查在全校一年级学生中进行了抽样调查,调调查结果如下表所示:查结果如下表所示:喜欢甜品喜欢甜品不喜欢甜品不喜欢甜品总计总计南方学生南方学生602080北方学生北方学生101020总计总计7030100(1)根据表中数据,问是否有根据表中数据,问是否有 95%的把握认为的把握认为“南方学生和北方学生在选用甜品的饮食南方学生和北方学生在选用甜品的饮食习惯方面有差异习惯方面有差异”;(2)已知在被调查的北方学生中有已知在被调查的北方学生中有 5 名数学系的学生,其中名数学系的学生,其中 2 名喜欢甜品现在从这名喜欢甜品现在从这 5名学生中随机抽取名学生中随机抽取 3 人,求至多有人,求至多有 1 人喜欢甜品的概率人喜欢甜品的概率P(K2k0)010000500010k0270638416635解:解:(1)将将 22 列联表中的数据代入公式计算,得列联表中的数据代入公式计算,得K2100 60102010 270308020100214762由于由于 47623841,所以有,所以有 95%的把握认为的把握认为“南方学生和北方学生在选用甜品的饮南方学生和北方学生在选用甜品的饮食习惯方面有差异食习惯方面有差异”(2)从从 5 名数学系学生中任取名数学系学生中任取 3 人的一切可能结果所组成的基本事件空间人的一切可能结果所组成的基本事件空间(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)(其中其中 ai表示喜欢甜品的学生表示喜欢甜品的学生,i1,2bj表示不喜欢甜品的学生表示不喜欢甜品的学生,j1,2,3)由由 10 个基个基本事件组成,且这些基本事件的出现是等可能的本事件组成,且这些基本事件的出现是等可能的用用 A 表示表示“3 人中至多有人中至多有 1 人喜欢甜品人喜欢甜品”这一事件,则这一事件,则A(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)事件事件 A 是由是由 7 个基本事件组成,因而个基本事件组成,因而 P(A)710(时间时间 120 分钟分钟满分满分 150 分分)一、选择题一、选择题(本大题共本大题共 12 小题,每小题小题,每小题 5 分,共分,共 60 分在每小题给出的四个选项中,分在每小题给出的四个选项中,只有一项是符合题目要求的只有一项是符合题目要求的)1对有线性相关关系的两个变量建立的回归直线方程对有线性相关关系的两个变量建立的回归直线方程yabx 中,回归系数中,回归系数b()A可以小于可以小于 0B大于大于 0C能等于能等于 0D只能小于只能小于 0解析:解析:选选 Ab0 时,则时,则 r0,这时不具有线性相关关系,但,这时不具有线性相关关系,但b可以大于可以大于 0 也可以也可以小于小于 02每一吨铸铁成本每一吨铸铁成本 y(元元)与铸件废品率与铸件废品率 x%建立的回归方程建立的回归方程y568x,下列说法正确,下列说法正确的是的是()A废品率每增加废品率每增加 1%,成本每吨增加,成本每吨增加 64 元元B废品率每增加废品率每增加 1%,成本每吨增加,成本每吨增加 8%C废品率每增加废品率每增加 1%,成本每吨增加,成本每吨增加 8 元元D如果废品率增加如果废品率增加 1%,则每吨成本为,则每吨成本为 56 元元解析解析: 选选 C根据回归方程知根据回归方程知 y 是关于是关于 x 的单调增函数的单调增函数, 并且由系数知并且由系数知 x 每增加一个单每增加一个单位,位,y 平均增加平均增加 8 个单位个单位3下表显示出样本中变量下表显示出样本中变量 y 随变量随变量 x 变化的一组数据,由此判断它最可能是变化的一组数据,由此判断它最可能是()x45678910y14181920232528A线性函数模型线性函数模型B二次函数模型二次函数模型C指数函数模型指数函数模型D对数函数模型对数函数模型解析解析:选选 A画出散点图画出散点图(图略图略)可以得到这些样本点在某一条直线上或该直线附近可以得到这些样本点在某一条直线上或该直线附近,故故最可能是线性函数模型最可能是线性函数模型4试验测得四组试验测得四组(x,y)的值为的值为(1,2),(2,3),(3,4),(4,5),则则 y 与与 x 之间的回归直线方程之间的回归直线方程为为()Ayx1B yx2Cy2x1Dyx1解析:解析:选选 A由题意发现,由题意发现,(x,y)的四组值均满足的四组值均满足yx1,故,故yx1 为回归直线方为回归直线方程程5下列关于等高条形图说法正确的是下列关于等高条形图说法正确的是()A等高条形图表示高度相对的条形图等高条形图表示高度相对的条形图B等高条形图表示的是分类变量的频数等高条形图表示的是分类变量的频数C等高条形图表示的是分类变量的百分比等高条形图表示的是分类变量的百分比D等高条形图表示的是分类变量的实际高度等高条形图表示的是分类变量的实际高度解析:解析:选选 C由等高条形图的特点及性质进行判断由等高条形图的特点及性质进行判断6根据一组样本数据根据一组样本数据(x1,y1),(x2,y2),(xn,yn)的散点图分析存在线性相关关系的散点图分析存在线性相关关系,求得其回归方程求得其回归方程y085x857,则在样本点,则在样本点(165,57)处的残差为处的残差为()A5455B245C345D11155解析:解析:选选 B把把 x165 代入代入y085x857,得,得 y0851658575455,由由 575455245,故选,故选 B7有甲、乙两个班级进行数学考试,按照大于等于有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,分为优秀,85 分以下为非优秀分以下为非优秀统计成绩,得到如下所示的列联表:统计成绩,得到如下所示的列联表:优秀优秀非优秀非优秀总计总计甲班甲班10b乙班乙班c30总计总计105已知在全部已知在全部 105 人中随机抽取人中随机抽取 1 人,成绩优秀的概率为人,成绩优秀的概率为27,则下列说法正确的是,则下列说法正确的是()A列联表中列联表中 c 的值为的值为 30,b 的值为的值为 35B列联表中列联表中 c 的值为的值为 15,b 的值为的值为 50C根据列联表中的数据,若按根据列联表中的数据,若按 95%的可靠性要求,能认为的可靠性要求,能认为“成绩与班级有关系成绩与班级有关系”D根据列联表中的数据,若按根据列联表中的数据,若按 95%的可靠性要求,不能认为的可靠性要求,不能认为“成绩与班级有关系成绩与班级有关系”解析:解析:选选 C由题意知,成绩优秀的学生数是由题意知,成绩优秀的学生数是 30,成绩非优秀的学生数是,成绩非优秀的学生数是 75,所以,所以 c 20 , b 45 , 选 项, 选 项 A 、 B 错 误 根 据 列 联 表 中 的 数 据 , 得 到错 误 根 据 列 联 表 中 的 数 据 , 得 到 K2105 10302045 25550307561093841,因此有因此有 95%的把握认为的把握认为“成绩与班级有关系成绩与班级有关系”,选项选项 C 正确正确8某考察团对全国某考察团对全国 10 大城市进行职工人均工资水平大城市进行职工人均工资水平 x(千元千元)与居民人均消费水平与居民人均消费水平 y(千千元元)统计调查统计调查,y 与与 x 具有相关关系具有相关关系,回归方程为回归方程为y066x1562,若某城市居民人均消若某城市居民人均消费水平为费水平为 7675 千元,估计该城市人均消费额占人均工资收入的百分比约为千元,估计该城市人均消费额占人均工资收入的百分比约为()A83%B72%C67%D66%解析解析:选选 A将将 y7675 代入回归方程代入回归方程,可计算得可计算得 x9262,所以该城市人均消费所以该城市人均消费额占人均工资收入的百分比约为额占人均工资收入的百分比约为 7675926208383%,即约为,即约为 83%9为了研究男子的年龄与吸烟的关系,抽查了为了研究男子的年龄与吸烟的关系,抽查了 100 个男子,按年龄超过和不超过个男子,按年龄超过和不超过 40岁,吸烟量每天多于和不多于岁,吸烟量每天多于和不多于 20 支进行分组,如下表:支进行分组,如下表:年龄年龄总计总计不超过不超过 40 岁岁超过超过 40 岁岁吸烟量不多于吸烟量不多于20 支支/天天501565吸烟量多于吸烟量多于10253520 支支/天天总计总计6040100则在犯错误的概率不超过则在犯错误的概率不超过_的前提下认为吸烟量与年龄有关的前提下认为吸烟量与年龄有关()A0001B001C005D没有理由没有理由解析:解析:选选 AK2100 50251015 265356040221610828,所以我们在犯错误的概率不超过所以我们在犯错误的概率不超过 0001 的前提下认为吸烟量与年龄有关的前提下认为吸烟量与年龄有关10为了考察两个变量为了考察两个变量 x 和和 y 之间的线性相关性之间的线性相关性,甲甲、乙两个同学各自独立做了乙两个同学各自独立做了 10 次次和和 15 次试验,并且利用线性回归方法,求得回归直线为次试验,并且利用线性回归方法,求得回归直线为 l1和和 l2,已知在两人的试验中发现,已知在两人的试验中发现对变量对变量 x 的观测数据的平均值恰好相等的观测数据的平均值恰好相等, 都为都为 s, 对变量对变量 y 的观测数据的平均值也恰好相等的观测数据的平均值也恰好相等,都为都为 t,那么下列说法正确的是,那么下列说法正确的是()A直线直线 l1和直线和直线 l2有交点有交点(s,t)B直线直线 l1和直线和直线 l2相交,但交点未必是点相交,但交点未必是点(s,t)C直线直线 l1和直线和直线 l2由于斜率相等,所以必定平行由于斜率相等,所以必定平行D直线直线 l1和直线和直线 l2必定重合必定重合解析:解析:选选 Al1与与 l2都过样本中心都过样本中心(x,y)11假设有两个分类变量假设有两个分类变量 X 和和 Y,它们的可能取值分别为,它们的可能取值分别为x1,x2和和y1,y2,其,其 22列联表如下:列联表如下:y1y2总计总计x1ababx2cdcd总计总计acbdabcd对于以下数据,对同一样本能说明对于以下数据,对同一样本能说明 X 与与 Y 有关的可能性最大的一组为有关的可能性最大的一组为()Aa9,b8,c7,d6Ba9,b7,c6,d8Ca8,b6,c9,d7Da6,b7,c8,d9解析解析:选选 B对于同一样本对于同一样本|adbc|越小越小,说明说明 X 与与 Y 之间的关系越弱之间的关系越弱,|adbc|越大越大,故检验知选故检验知选 B12两个分类变量两个分类变量 X 和和 Y, 值域分别为值域分别为x1,x2和和y1,y2, 其样本频数分别是其样本频数分别是 a10, b21, cd35 若若 X 与与 Y 有关系的可信程度不小于有关系的可信程度不小于 975%, 则则 c 等于等于()A3B4C5D6解析:解析:选选 A列列 22 列联表如下:列联表如下:x1x2总计总计y1102131y2cd35总计总计10c21d66故故 K2的观测值的观测值 k6610 35c 21c23135 10c 56c 5024 把选项把选项 A, B, C, D 代入验证可知代入验证可知选选 A二二、填空题填空题(本大题共本大题共 4 小题小题,每小题每小题 5 分分,共共 20 分分请把正确答案填在题中的横线上请把正确答案填在题中的横线上)13已知某车间加工零件的个数已知某车间加工零件的个数 x 与所花费时间与所花费时间 y(h)之间的线性回归方程为之间的线性回归方程为y001x05,则加工,则加工 600 个零件大约需要个零件大约需要_h解析:解析:当当 x600 时,时,y0016000565答案:答案:6514若一组观测值若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足之间满足 yibxiaei(i1,2,n),若,若 ei恒为恒为 0,则,则 R2为为_解析:解析:ei恒为恒为 0,说明随机误差总为,说明随机误差总为 0,于是,于是 yiy,故,故 R21答案:答案:115下列是关于出生男婴与女婴调查的列联表下列是关于出生男婴与女婴调查的列联表晚上晚上白天白天总计总计男婴男婴45AB女婴女婴E35C总计总计98D180那么那么 A_,B_,C_,D_,E_解析:解析:45E98,E53,E35C,C88,98D180,D82,A35D,A47,45AB,B92答案:答案:479288825316已知已知 x,y 之间的一组数据如表之间的一组数据如表,对于表中数据对于表中数据,甲甲、乙两同学给出的拟合直线分乙两同学给出的拟合直线分别为别为 l1:y13x1 与与 l2:y12x12,利用最小二乘法判断拟合程度更好的直线是,利用最小二乘法判断拟合程度更好的直线是_x13678y12345解析:解析:用用 y13x1 作为拟合直线时,所得作为拟合直线时,所得 y 的实际值与的实际值与 y 的估计值的差的平方和为:的估计值的差的平方和为:S11432(22)2(33)2410325113273用用 y12x12作为拟合直线时作为拟合直线时, 所所得得y 的实际值与的实际值与 y 的估计值的差的平方和为的估计值的差的平方和为: S2(11)2(22)23722(44)2592212因为因为 S27879,所以能在犯错误的概率不超过,所以能在犯错误的概率不超过 0005 的前提下认为教学方式与的前提下认为教学方式与成绩有关系成绩有关系20(本小题满分本小题满分 12 分分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在寸均在217,223(单位:单位:cm)之间,把零件尺寸在之间,把零件尺寸在219,221)的记为一等品,尺寸在的记为一等品,尺寸在218,219)221,222)的记为二等品的记为二等品,尺寸在尺寸在217,218)222,223的记为三的记为三等品,现从甲、乙工艺生产的零件中各随机抽取等品,现从甲、乙工艺生产的零件中各随机抽取 100 件产品,所得零件尺寸的频率分布直件产品,所得零件尺寸的频率分布直方图如图所示:方图如图所示:(1)根据上述数据完成下列根据上述数据完成下列 22 列联表列联表, 根据此数据你认为选择不同的工艺与生产出一根据此数据你认为选择不同的工艺与生产出一等品是否有关?等品是否有关?甲工艺甲工艺乙工艺乙工艺总计总计一等品一等品非一等品非一等品总计总计附:附:P(K2k0)010005001k0270638416635K2n adbc 2 ab cd ac bd (2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为件利润分别为 30 元、元、20 元、元、15 元,你认为以后该工厂应该选择哪种工艺生产该种零件?元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由请说明理由解:解:(1)22 列联表如下列联表如下甲工艺甲工艺乙工艺乙工艺总计总计一等品一等品5060110非一等品非一等品504090总计总计100100200K2200 50406050 2110901001002022706,所以没有理由认为选择不同的工艺与生所以没有理由认为选择不同的工艺与生产出一等品有关产出一等品有关(2)由题知运用甲工艺生产单件产品的利润由题知运用甲工艺生产单件产品的利润 X 的分布列为的分布列为X302015P050302X 的数学期望为的数学期望为 E(X)30052003150224,X 的方差为的方差为 D(X)(3024)205(2024)203(1524)20239乙工艺生产单件产品的利润乙工艺生产单件产品的利润 Y 的分布列为的分布列为Y302015P060103Y 的数学期望为的数学期望为 E(Y)300620011503245,Y 的方差为的方差为 D(Y)(3024 5)20 6(2024 5)20 1(1524 5)20 347 25由上述结果可以看出由上述结果可以看出 D(X)D(Y),即甲工艺波动小即甲工艺波动小,虽然虽然 E(X)6635,因此因此,在犯错误的概率不超过在犯错误的概率不超过 001 的前提下认为该地区的老年的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关人是否需要志愿者提供帮助与性别有关(3)由由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好用简单随机抽样的方法更好22(本小题满分本小题满分 12 分分)某市为了对学生的数理某市为了对学生的数理(数学与物理数学与物理)学习能力进行分析,从学习能力进行分析,从 10000 名学生中随机抽出名学生中随机抽出 100 位学生的数理综合学习能力等级分数位学生的数理综合学习能力等级分数(6 分制分制)作为样本,分数频作为样本,分数频数分布如下表:数分布如下表:等级得分等级得分(0,1(1,2(2,3(3,4(4,5(5,6人数人数3173030173(1)如果以能力等级分数大于如果以能力等级分数大于 4 分作为良好的标准,从样本中任意抽取分作为良好的标准,从样本中任意抽取 2 名学生,求恰名学生,求恰有有 1 名学生为良好的概率名学生为良好的概率(2)统计方法中,同一组数据常用该组区间的中点值统计方法中,同一组数据常用该组区间的中点值(例如区间例如区间(1,2的中点值为的中点值为 15)作作为代表:为代表:据此,计算这据此,计算这 100 名学生数理学习能力等级分数的期望名学生数理学习能力等级分数的期望及标准差及标准差(精确到精确到 01);若总体服从正态分布,以样本估计总体,估计该市这若总体服从正态分布,以样本估计总体,估计该市这 10 000 名学生中数理学习能力名学生中数理学习能力等级在等级在(19,41)范围内的人数范围内的人数(3)从这从这 10 000 名学生中任意抽取名学生中任意抽取 5 名同学,他们数学与物理单科学习能力等级分数如名同学,他们数学与物理单科学习能力等级分数如下表:下表:x(数学学习能力数学学习能力)23456y(物理学习能力物理学习能力)1534556请画出上表数据的散点图;请画出上表数据的散点图;请根据上表提供的数据请根据上表提供的数据,用最小二乘法求出用最小二乘法求出 y 关于关于 x 的线性回归方程的线性回归方程ybxa(附参附参考数据:考数据: 129114)解解:(1)样本中学生为良好的人数为样本中学生为良好的人数为 20 人人故从样本中任意抽取故从样本中任意抽取 2 名学生名学生,则仅有则仅有 1 名名学生为良好的概率为学生为良好的概率为C120C180C21003299(2)总体数据的期望约为总体数据的期望约为:05003150172503035030450175500330,标准差标准差(053)2003(153)2017(253)203(353)203(453)2017(553)200312 1.2911,由于由于3,11当当 x(19,41)时,即时,即 x(,),故数理学习能力等级分数在故数理学习能力等级分数在(19,41)范围中的概率为范围中的概率为 0682 6数理习能力等级分数在数理习能力等级分数在(19,41)范围中的学生的人数约为范围中的学生的人数约为 10 0000682 66 826人人(3)数据的散点图如图:数据的散点图如图:设线性回归方程为设线性回归方程为ybxa,则,则b错误错误!11,aybx04故回归直线方程为故回归直线方程为y11x04
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!