《独立性检验》

上传人:少*** 文档编号:243750023 上传时间:2024-09-30 格式:PPT 页数:35 大小:1.03MB
返回 下载 相关 举报
《独立性检验》_第1页
第1页 / 共35页
《独立性检验》_第2页
第2页 / 共35页
《独立性检验》_第3页
第3页 / 共35页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,独立性检验,本节研究的是,两个分类变量的独立性检验问题,。,在日常生活中,我们常常关心,分类变量的之间是否有关系,独立性检验,独立性检验,日常生活中我们关心这样一些问题:,吸烟与患呼吸道疾病有无关系?,饮食与心脏病之间有无关系?,性别与喜欢数学课之间有无关系?,以上问题用什么知识来解决呢?,统计学中检验两个变量,是否有关系,的一种统计方法,独立性检验,独立性检验,学习目标,1.,会列,22,列联表,会画等高条形图,2.,会从,22,列联表,等高条形图中直观,的判断出两个分类变量之间是否有关?,3.,了解独立性检验的基本思想和步骤,某医疗机构为了了解,患呼吸道疾病,与吸烟是否有关,,进行了一次抽样调查,共调查了,515,个成年人,其中吸烟者,220,人,不吸烟者,295,人,调查结果是:吸烟的,220,人中,37,人患,呼吸道疾病,,,183,人未患,呼吸道疾病,;不吸烟的,295,人中,21,人患病,,274,人未患,病,。,根据这些数据能否,断定,:患,呼吸道疾病,与,吸烟有关?,问题,:,吸烟与患呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,问题,:,为了调查吸烟是否对呼吸道有影响,某医疗研究所随机地调查了,515,人,得到如下结果(单位:人),列联表,在不吸烟者中患病的比重是,在吸烟者中患病的比重是,7.12%,16.82%,不患病,患病,1),通过图形直观判断,三维柱状图,不患病,患病,2),通过图形直观判断,二维条形图,不患病,患病,3),通过图形直观判断,患病,比例,不患病,比例,问题,1,:,吸烟与不吸烟,患病的可能性的大小是否有差异?,吸烟者和不吸烟者患呼吸道疾病的可能性存在差异,吸烟者患呼吸道疾病的可能性大,问题,2,:,差异大到什么程度才能作出,“,吸烟与患病有关,”,的判断?,问题,3,:能否用数量刻画出,“,有关,”,的程度?,初步结论:,思考交流:,反证法原理:,在一个已知假设下,如果,推出一个矛盾,,就,证明,了这个假设不成立。,假设检验原理:,在一个已知假设下,如果,一个与该假设矛盾的小概率事件发生,,,就,推断,这个假设不成立。,数据整理;,(列,2,2,联表),做出相反的假设;(“患病与吸烟没有关系”),计算 ;,查临界值表;,下结论。,统计学对此类问题提供了这样的方法:,数据整理;,(列,2,2,联表),做出相反的假设;(“患病与吸烟没有关系”),计算 ;,查临界值表;,下结论。,统计学对此类问题提供了这样的方法:,吸烟与患呼吸道疾病关系列联表,患病,不患病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,1,、列,2 2,联表,H,0,:,吸烟,和,患呼吸道疾病,没有关系,通过数据和图表分析,得到结论是:,吸烟与患呼吸道病有关,结论的可靠程度如何?,2,、做出相反的假设,3,、计算,吸烟的人中患病的比例:,不吸烟的人中患病的比例:,吸烟与患呼吸道疾病关系列联表,患病,不患病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,若,H,0,成立,作为检验在多大程度上可以认为,“,两个变量有关系,”,的标准 。,统计学家为了消除样本量对上式的影响,引入,了,卡方统计量,通过公式计算,吸烟与患呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,4,、查表,临界值表,1),如果,P(,10.828)= 0.001,表示有,99.9%,的把握认为,”,X,与,Y,”,有关系,;,2),如果,P( 7.879)= 0.005,表示有,99.5%,的把握认为,”,X,与,Y,”,有关系,;,3),如果,P( 6.635)= 0.01,表示有,99%,的把握认为,”,X,与,Y,”,有关系,;,4),如果,P( 5.024)= 0.025,表示有,97.5%,的把握认为,”,X,与,Y,”,有关系,;,5),如果,P( 3.841)= 0.05,表示有,95%,的把握认为,”,X,与,Y,”,有关系,;,6),如果,P( 2.706)= 0.10,表示有,90%,的把握认为,”,X,与,Y,”,有关系,;,7),如果,P(,2.706),就认为没有充分的证据显示,”,X,与,Y,”,有关系,;,已知在 成立的情况下,,故有,99.9%,的把握认为,H,0,不成立,即有,99.9%,的把握认为,“,患呼吸道疾病与吸烟有关系,”,。,5,、下结论,网络链接,检验结果,亲子鉴定的可靠性,DNA,是从几滴血,腮细胞或培养的组织纤内提取而来,.,用畴素将,DNA,样本切成小段,放进喱胶内,用电泳槽推动,DNA,小块使之分离,-,最细的在最远,最大的最近,.,之後,分离开的基因放在尼龙薄膜上,使用特别的,DNA,探针去寻找基因,相同的基因会凝聚于一,然後,利用特别的染料,在,X,光的环境下,便显示由,DNA,探针凝聚于一的黑色条码,.,小孩这种肉眼可见的条码很特别,-,一半与母亲的吻合,一半与父亲的吻合,.,这过程重覆几次,每一种探针用于寻找,DNA,的不同部位并影成独特的条码,用几组不同的探针,可得到超过,99,9%,的父系或然率或分辨率,.,DNA,亲子鉴定的原理和程序,DNA,亲子鉴定的结果,孩子会有一条纹与亲生母亲相同而另一条码与待证实父亲,1,号,(AF1),相同,此人是生父,;,被排除的男子,(AF2),则与小孩并无相同的条码,.,肯定父系关系,= 99.99%,或更大的生父或然率,(,法律上证明是生父,),否定父系关系,= 0%,生父或然率,(100%,排除为生父,),例,1.,在,500,人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外,500,名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?,未感冒,感冒,合计,使用血清,258,242,500,未使用血清,216,284,500,合计,474,526,1000,解:设,H,0,:感冒与是否使用该血清没有关系。,因当,H,0,成立时,,2,6.635,的概率约为,0.01,,故有,99%,的把握认为该血清能起到预防感冒的作用。,P(x,0,),0.50,0.40,0.25,0.15,0.10,0.05,0.025,0.010,0.005,0.001,x,0,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,P(x,0,),0.50,0.40,0.25,0.15,0.10,0.05,0.025,0.010,0.005,0.001,x,0,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,有效,无效,合计,口服,58,40,98,注射,64,31,95,合计,122,71,193,解:设,H,0,:药的效果与给药方式没有关系。,因当,H,0,成立时,,2,1.3896,的概率大于,15%,,故不能否定假设,H,0,,即不能作出药的效果与给药方式有关的结论。,2.072,例,2,:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的,193,个病人的数据,能否作出药的效果和给药方式有关的结论?,P(x,0,),0.50,0.40,0.25,0.15,0.10,0.05,0.025,0.010,0.005,0.001,x,0,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,例,3,:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?,有效,无效,合计,复方江剪刀草,184,61,245,胆黄片,91,9,100,合计,275,70,345,解:设,H,0,:两种中草药的治疗效果没有差异。,因当,H,0,成立时,,2,10.828,的概率为,0.001,,故有,99.9%,的把握认为,两种药物的疗效有差异。,小结:,1,、独立性检验的基本思想,2,、独立性检验是用 统计量研究一类问题的方法。,3,、用 统计量研究问题的步骤,由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量,n,越大,估计越准确。,例,1,:随着,新还珠格格,的热播,又掀起了一,场“还珠热”。为了了解喜爱看,新还珠格格,是,否与性别有关,小欣随机抽查了,140,名男性和,160,名女性,调查发现,男性和女性中分别有,80,人和,120,人喜爱看,其余人不喜爱看。,(,2,)利用图形判断性别与是否喜爱看,新,还珠格格,有关?,(,1,)根据以上数据建立一个,22,的列联表;,为考察高中生的性别与是否喜欢数学课程之间的,关系,在某城市的某校高中生中随机抽取,300,名学生,,得到如下联表:,喜欢数学课程,不喜欢数学课程,总计,男,37,85,122,女,35,143,178,总计,72,228,300,解:在假设“性别与是否喜欢数学课程之间没有关系”的前提,下,K,2,应该很小,并且,例,3.,性别与喜欢数学课,由表中数据计算,K,2,的观测值,k 4.513,。在多大程度上可以认,为高中生的性别与是否喜欢数学课程之间有关系?为什么?,而我们所得到的,K,2,的观测值,k 4.513,超过,3.841,,这就意味着,“性别与是否喜欢数学课程之间有关系”这一结论错误的可能,性约为,0.05,,即有,95%,的把握认为“性别与是否喜欢数学课程,之间有关系”。,例,1.,在某医院,因为患心脏病而住院的,665,名男性病人,中,有,214,人秃顶,;,而另外,772,名不是因为患心脏病而住,院的男性病人中有,175,秃顶,.,分别利用图形和独立性检,验方法判断秃顶与患心脏病是否有关系,?,你所得的结论,在什么范围内有效,?,秃顶与患心脏病列联表,患心脏病,患其他病,总计,秃顶,214,175,389,不秃顶,451,597,1048,总计,665,772,1437,有,99%,的把握认为“秃顶与患心脏病有关”,例,2.,为考察高中生的性别与是否喜欢数学课程之间的关,系。在某城市的某校高中生随机抽取,300,名学生。得到,如下列联表:,性别与喜欢数学课程列联表,喜欢,不喜欢,总计,男,37,85,122,女,35,143,178,总计,72,228,300,由表中数据计算得到 的观测值 ,4.514,。能够以,95,的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?,解:在假设,“,性别与是否喜欢数学课程之间没有关系,”,的前提下, 应该很小,并且,而我们所得到的 的观测值 超过,3.841,,这就,意味着,“,性别与是否喜欢数学课程之间有关系,”,这一结论,是错误的可能性约为,0.05,,即有,95%,的把握认为,“,性别与,是否喜欢数学课程之间有关系,”,。,练习,:,甲乙两个班级进行一门考试,按照学生考试成绩优秀和,不优秀统计后,得到如下列联表,:,优秀,不优秀,总计,甲班,10,35,45,乙班,7,38,45,总计,17,73,90,画,出列联表的条形图,并通过图形判断成绩与班级是否,有关,.,利用列联表的独立性检验估计,认为“成绩与班级,有关系”犯错误的概率是多少。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!