独立性检验的基本思想及其初步应用-课件

上传人:痛*** 文档编号:243987110 上传时间:2024-10-01 格式:PPT 页数:33 大小:4.42MB
返回 下载 相关 举报
独立性检验的基本思想及其初步应用-课件_第1页
第1页 / 共33页
独立性检验的基本思想及其初步应用-课件_第2页
第2页 / 共33页
独立性检验的基本思想及其初步应用-课件_第3页
第3页 / 共33页
点击查看更多>>
资源描述
3.2,独立性检验的基本思想,及其初步应用,新课,新课,另习题课、习题见金榜,3.2,独立性检验的,基本思想及其初步应用,3.2新课新课,另习题课、习题见金榜3.2独立性检验的,我们经常听到这些说法:,吸烟对患肺癌有影响;,数学好的人物理一般也很好;,是否喜欢数学课程与性别之间有关系;,人的血型会决定人的性格;,星座与人的命运之间有某种联系,.,这些说法都有道理吗?,我们经常听到这些说法:,1.,理解独立性检验的基本思想,.,(重点),2.,会从列联表、等高条形图直观判断吸烟与患肺癌 有关,.,(难点),3.,了解随机变量,K,2,的含义,理解独立性检验的基本思想及实施步骤,.,(难点),1.理解独立性检验的基本思想.(重点),探究点,1,独立性检验的基本思想,对于性别变量,其取值为男和女两种,.,这种变量,的不同“值”表示个体所属的不同类别,像这样的变,量称为,.,分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等,.,分类变量,探究点1 独立性检验的基本思想 对于性别变量,其取值为,不患肺癌,患肺癌,总计,不吸烟,7 775,42,7 817,吸烟,2 099,49,2 148,总计,9 874,91,9 965,问题:,为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了,9 965,人,得到如下结果:,吸烟与患肺癌列联表(单位:人),在吸烟者中患肺癌的比重是,_.,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大,.,2.28%,在不吸烟者中患肺癌的比重是,_,0.54%,不患肺癌患肺癌总计不吸烟7 775427 817吸烟2 09,通过图形直观判断两个分类变量是否相关:,等高,条形图,通过图形直观判断两个分类变量是否相关:,通过数据和图形分析,得到结论是:吸烟与患肺癌有关,.,那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题,.,假设,H,0,:吸烟与患肺癌之间没有关系,吸烟与患肺癌列联表,(,单位:人,),不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,通过数据和图形分析,得到结论是:吸烟与患肺癌有关.那,如果“吸烟与患肺癌没有关系,”,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,.,即,如果“吸烟与患肺癌没有关系”,那么吸烟样本中不患肺癌,引入一个随机变量,它是检验在多大程度上可以认为“两个变量,有关系”的标准,.,ad-bc,越小,,说明吸烟与患肺癌之间的关系越弱,;,ad-bc,越大,,说明吸烟与患肺癌之间的关系越强,.,其中,n=a+b+c+d,为样本容量,.,引入一个随机变量 它是检验在多大程度上可以认为“两个变,不患肺癌,患肺癌,总计,不吸烟,7 775,42,7 817,吸烟,2 099,49,2 148,总计,9 874,91,9 965,通过公式计算,吸烟与患肺癌列联表(单位:人),不患肺癌患肺癌总计不吸烟7 775427 817吸烟2 09,已知在 成立的情况下,,,即在 成立的情况下,,K,2,的观测值大于,6.635,的概率非常小,近似为,0.01,,是一个小概率事件,.,思考:,这个值到底告诉我们什么呢?,现在,K,2,的观测值,k,56.632,,远远大于,6.635,,所以有理由,断定,H,0,不成立,,,即认为,“吸烟与患肺癌有关系”,.,已知在 成立的情况下,即在 成立的情况下,K,独立性检验的定义,:,利用随机变量,K,2,来判断“两个分类变量有关系”的方法,称为独立性检验,.,独立性检验的一般步骤,:,(,1,),假设,两个分类变量,X,与,Y,没有关系,.,(,2,)计算出,K,2,的观测值,k.,(,3,)把,k,的值与,临界值,比较确定,X,与,Y,有关的,程度或无关系,.,独立性检验的定义:利用随机变量K2来判断“两个分类变量有,设有两个分类变量,X,和,Y,,它们的取值分别为,x,1,x,2,和,y,1,y,2,,,其样本频数列联表,(,称为,22,列联表,),为,y,1,y,2,总计,x,1,a,b,a+b,x,2,c,d,c+d,总计,a+c,b+d,a+b+c+d,设有两个分类变量X和Y,它们的取值分别为x1,x2,临界值表:,如,P(k10.828)=0.001,表示在,犯错误的概率不超过,0.001,的前提下,,认为“,X,与,Y,有关系,”.,如,P(k6.635)=0.010,表示在,犯错误的概率不超过,0.010,的前提下,,认为“,X,与,Y,有关系,”.,临界值表:如P(k10.828)=0.001表示在,独立性检验的基本思想类似反证法,(1),假设结论不成立,即“两个分类变量没有关系”,.,(2),在此假设下随机变量,K,2,应该很小,如果由观测数据计算得到,K,2,的观测值,k,很大,则在一定程度上说明假设不合理,.,(3),根据随机变量,K,2,的含义,可以通过评价该假设不合理的程度,如由实际计算出的,k10.828.,说明假设不合理的程度为,99.9%,即“两个分类变量有关系”这一结论成立的可信度约为,99.9%.,独立性检验的基本思想类似反证法(1)假设结论不成立,即“两个,探究点,2,独立性检验的初步应用,例,.,在某医院,因为患心脏病而住院的,665,名男性病人中,有,214,人秃顶,而另外,772,名不是因为患心脏病而住院的男性病人中有,175,人秃顶,.(1),利用图形判断秃顶与患心脏病是否有关系,;(2),能否在犯错误的概率不超过,0.01,的前提下认为秃顶与患心脏病有关系?,探究点2 独立性检验的初步应用 例.在某医院,因为患,患心脏病,患其他病,总计,秃顶,214,175,389,不秃顶,451,597,1 048,总计,665,772,1 437,(1),相应的等高条形图如下所示,,秃顶,不秃顶,不患心脏病,患心脏病,解:,根据题目所给数据得到如下列联表:,由图可认为秃顶与患心脏病有关系,患心脏病患其他病总计秃顶214175389不秃顶451597,因此,在犯错误的概率不超过,0.01,的前提下,认为秃顶与患心脏病有关系,.,(2),根据列联表中的数据,得到,因此,在犯错误的概率不超过0.01的前提下,认为秃顶,y,1,y,2,总计,x,1,a,b,a+b,x,2,c,d,c+d,总计,a+c,b+d,a+b+c+d,思考:,考察下表,,定义,根据独立性检验原理,如何用,W,构造一个判断,X,和,Y,是否有关系的规则,,使得在该规则下把“,X,和,Y,没有关系”错判成“,X,和,Y,有关系”的概率不超过,0.01,?,通分(分子),.,y1y2总计x1aba+bx2cdc+d总计a+cb+da,由,W,的定义可以发现:它越大,越有利于结论“,X,和,Y,有关系”;它越小,越有利于结论“,X,和,Y,没有关系”,.,因此可以建立如下的判断规则:,当,W,的观测值,0,时,就判断“,X,和,Y,有关系”;否则,判断“,X,和,Y,没有关系”,.,这里,0,为正实数,满足如下条件:在“,X,和,Y,没有关系”的前提下,,由W的定义可以发现:它越大,越有利于结论“X和Y有关,思考:,若在“,X,和,Y,没有关系”,的情况下有:,思考:若在“X和Y没有关系”,1.,独立性检验中的统计假设就是假设两个分类量,A,,,B,(,),A.,互斥,B.,不互斥,C.,相互独立,D.,不独立,C,1.独立性检验中的统计假设就是假设两个分类量C,2,.,下列说法中正确的是,(,),独立性检验的基本思想是带有概率性质的反证法;,独立性检验就是,在假设,H,0,下,如果出现一个与,H,0,相,矛盾的小概率事件,,就推断,H,0,不成立,且该推断犯错,误的概率不超过这个小概率,则作出拒绝,H,0,的推断;,独立性检验一定能给出明确的结论,A,.,B,.,C,.,D,.,2.下列说法中正确的是(),练,练,3,有两个分类变量,X,与,Y,的一组数据,由其列联表,计算得,K,2,4.523,,则,认为,X,与,Y,有关系是错误的,可信度为,(,),A,95%,B,90%,C,5%,D,10%,3有两个分类变量X与Y的一组数据,由其列联表,4,在对人们的休闲方式的一次调查中,共调查了,124,人,其中女性,70,人,男性,54,人,女性中有,43,人,主要的休闲方式是看电视,另外,27,人主要的休闲方式,是运动;男性中有,21,人主要的休闲方式是看电视,,另外,33,人主要的休闲方式是运动,(1),根据以上数据建立一个,22,的列联表,.,(2),判断休闲方式与性别是否有关系,4在对人们的休闲方式的一次调查中,共调查了,性别,看电视,运动,总计,女,43,27,70,男,21,33,54,总计,64,60,124,休闲方式,看电视运动总计女432770男213354总计646,(),(),独立性检验的一般步骤,:,(,1,)假设两个分类变量,X,与,Y,没有关系;,(,2,)计算出,K,2,的观测值,k,;,(,3,)把,k,的值与临界值比较确定,X,与,Y,有关的程度或,无关系,.,独立性检验的一般步骤:(1)假设两个分类变量X与Y没有关系;,独立性检验基本的思想类似,反证法,(,1),假设结论不成立,即,“,两个分类变量没有关系,”,.,(2),在此假设下随机变量,K,2,应该很小,如果由观测数据,计算得到,K,2,的观测值,k,很大,则在一定程度上说明假设,不合理,.,(3),根据随机变量,K,2,的含义,可以通过,评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为,99.9%,即,“,两个分类变量有关系,”,这一结论成立的可信度为约为,99.9%.,独立性检验基本的思想类似反证法(1)假设结论不成立,即“两个,当你无法从一楼蹦到三楼时,不要忘记走楼梯,.,要记住伟大的成功往往不是一蹴而就的,必须学会分解你的目标,逐步实施,.,当你无法从一楼蹦到三楼时,不要忘记走楼梯.要记住伟大,课本,P97,练习、习题、,。,课下阅书!,课本P97课下阅书!,再见,再见,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!