资源描述
3.2独立性检验的基本思想及其初步应用 自主学习 新知突破 1通过对实际问题的分析探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用;了解独立性检验的常用方法:等高条形图及K2统计量法2通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用3理解独立性检验的基本思想及实施步骤,能运用自己所学知识对具体案例进行检验 饮用水的质量是人类普遍关心的问题据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人人的身体健康状况与饮用水的质量之间有关系吗?提示人的身体健康状况与饮用水的质量之间有关系 1分类变量变量的不同“值”表示个体所属的_,像这样的变量称为分类变量2列联表(1)定义:列出的两个分类变量的_,称为列联表分类变量和列联表不同类别频数表 (2)22列联表一般地,假设两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:y1 y2总计x1 a b abx2 c d cd总计ac bd abcd 分类变量及其关系的分析的理解(1)这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等(2)频数分析是指用不同类别的事件发生的频率的大小比较来分析分类变量是否有关联关系(3)等高条形图更加形象直观地反映两个分类变量之间的差异,进而推断它们之间是否具有关联关系 1等高条形图与表格相比,更能直观地反映出两个分类变量间是否_,常用等高条形图展示列联表数据的_2观察等高条形图发现_和_相差很大,就判断两个分类变量之间有关系等高条形图相互影响频率特征 绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色 独立性检验 独立性检验思想的理解及常用的几个数值(1)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K26.635)0.01来评价假设不合理的程度,由实际计算得K2的观测值k6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%. (2)在实际问题中要记住以下几个常用值:若k6.635,则在犯错误的概率不超过0.01的前提下认为“X与Y有关系”;若k3.841,则在犯错误的概率不超过0.05的前提下认为“X与Y有关系”;若k2.706,则在犯错误的概率不超过0.1的前提下认为“X与Y有关系”;若k2.706,则认为没有充分证据显示“X与Y有关系” 1观察下列各图,其中两个分类变量x,y之间关系最强的是() 解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强答案:D 2下面是一个22列联表:则表中a,b处的值分别为()A94,96B52,50C52,54 D54,52y1 y2总计x1 a 21 73x2 2 25 27总计b 46 3在吸烟与患肺病是否相关的判断中,有下面的说法:若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误其中说法正确的是_ 解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案: 4为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.70及70分以下70分以上总计对照班32 18 50试验班12 38 50总计 44 56 100 附:P(K2k0) 0.025 0.010 0.005k0 5.024 6.635 7.879 合作探究 课堂互动 利用等高条形图判断分类变量间的关系2012年5月1日起我国对醉驾列入法律,交通事故明显降低,现从发生交通事故的司机中抽取2 000名司机的随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:有责任无责任总计有酒精650 150 800无酒精700 500 1 200总计1 350 650 2 000 (1)试作出相应的等高条形图;(2)结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系 思路点拨 (1)相应的等高条形图如图: (2)图中两个深色条的高分别表示司机血液中有酒精和无酒精样本中对事故负有责任的频率,从图中可以看出,司机血液中有酒精样本中对事故负有责任的频率明显高于司机血液中无酒精样本中对事故负有责任的频率由此可以认为司机血液中含有酒精与对事故负有责任有关系 2分析分类变量关系的步骤:(1)作大量的调查、研究,统计出结果;(2)列出列联表利用频率粗略估计;(3)作出等高条形图,从直观上进一步判断分类变量之间的关联关系特别提醒:通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度 1某校对学生课外活动进行调查,结果整理成下表:请根据数据,利用图形判断:喜欢体育或喜欢文娱是否与性别有关系体育文娱合计男生21 23 44女生6 29 35合计27 52 79 解析:其等高条形图如图所示由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系 利用随机变量K2判断分类变量间的关系下表是某地区的一种传染病与饮用水的调查表:得病不得病合计干净水52 466 518不干净水94 218 312合计146 684 830 (1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异思路点拨(1)根据表中的信息计算K2的观测值,并根据临界值表来分析相关性的大小,对于(2)要列出22列联表,方法同(1) 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们在犯错误的概率不超过0.001的前提下肯定结论的正确性,(2)中我们在犯错误的概率不超过0.025的前提下肯定结论的正确性. 12分 规律方法利用K2公式判断两分类变量是否有关系的方法 2某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:根据表中数据,能否在犯错误的概率不超过0.001的前提下认为这一问题的看法与性别有关系?(P(K 210.828)0.001)赞同反对总计男198 217 415女476 109 585总计674 326 1 000 独立性检验的综合应用为了调查某生产线上质量监督员甲对产品质量的好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量的好坏有无影响能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲在不在生产现场与产品质量的好坏有关系? 思路点拨 解析:(1)22列联表如下:由列联表可得|acbd|982174938|12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关”合格品数次品数总计甲在生产现场982 8 990甲不在生产现场493 17 510总计1 475 25 1 500 (2)由等高条形图可知:在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系” 规律方法判断两个分类变量之间有无关系,可以用22列联表、等高条形图、独立性检验等方法作出判断,其中从列联表和等高条形图中只能粗略地进行估计,要进行精确的判断,必须利用独立性检验进行计算并与临界值对比 3在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,做出列联表,试用独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效? 解析:根据题目所给的数据作出如下的列联表:色盲不色盲总计男38 442 480女6 514 520总计44 956 1 000 为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,数据如表,试问吸烟量与年龄是否有关?年龄合计不超过40岁超过40岁吸烟量不多于20支/天50 15 65吸烟量多于20支/天10 25 35合计60 40 100 提示由于对22列联表中a,b,c,d的位置不确定,在代入公式时取错了数值,导致计算结果的错误
展开阅读全文