高中数学-独立性检验的基本思想及其初步应用-ppt课件

上传人:494895****12427 文档编号:252225331 上传时间:2024-11-13 格式:PPT 页数:20 大小:485.04KB
返回 下载 相关 举报
高中数学-独立性检验的基本思想及其初步应用-ppt课件_第1页
第1页 / 共20页
高中数学-独立性检验的基本思想及其初步应用-ppt课件_第2页
第2页 / 共20页
高中数学-独立性检验的基本思想及其初步应用-ppt课件_第3页
第3页 / 共20页
点击查看更多>>
资源描述
独立性检验的基本思想,及其初步应用,独立性检验的基本思想,对于性别变量,其取值为男和女两种,这种变量的不同,“,值,”,表示个体所属的不同类别,像这样的变量称为,分类变量,.,在日常生活中,主要考虑,分类变量之间是否有关系,:,如是否吸烟、,是否患肺癌、,宗教信仰、国籍等等,.,例如,吸烟是否与患肺癌有关系?,性别是否对于喜欢数学课程有影响?等等,.,在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。,对于性别变量,其取值为男和女两种,这种变量的不同“值,为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了,9965,人,得到如下结果,(,单位,:,人,),表,1-7,吸烟与患肺癌,列联表,那么吸烟是否对患肺癌有影响,?,因此,直观上得到结论,:,吸烟者和不吸烟者患肺癌的可能性存在差异。,在不吸烟者中患肺癌的比例是,在吸烟者中患肺癌的比例是,0.54%,2.28%,9965,91,9874,总计,2148,49,2099,吸烟,7817,42,7775,不吸烟,总计,患肺癌,不患肺癌,列联表,:,两个分类变量的频数表,探究:,为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了996,等高条形图,患病比例,不患病比例,0.54%,2.28%,等高条形图不患病比例0.54%2.28%,上面我们通过分析数据和图形,得到的直观印象是,“,吸烟和患肺癌有关,”,。这一直觉来自于观测数据,即样本。,问题是它能够在多大程度上代表总体呢?,能否用数量刻画出有关的程度?,H,0,:,吸烟与患肺癌没有关系,我们假设,看看能推出什么样的结论。,a+b+c+d,b+d,a+c,总计,c+d,d,c,吸烟,a+b,b,a,不吸烟,总计,患肺癌,不患肺癌,为了研究的一般性,在列联表,1-7,中用字母代替数字:,上面我们通过分析数据和图形,得到的直观印象是“吸烟和患肺癌有,结论:,|ad-bc|,越小,说明吸烟与患肺癌之间关系越弱,;,|ad-bc|,越大,说明吸烟与患肺癌之间关系越强,;,如果,”,吸烟与患肺癌没有关系,”,则在吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即,a+b+c+d,b+d,a+c,总计,c+d,d,c,吸烟,a+b,b,a,不吸烟,总计,患肺癌,不患肺癌,结论:|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;如,为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量,若,H,0,成立,即,“,吸烟与患肺癌没有关系,”,,则,K,2,应很小,.,由列联表中数据,利用公式(,1,)计算得,K,2,的观测值为:,(,1,),其中,n=a+b+c+d,为样本容量,.,为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们,在,H,0,成立的情况下,统计学家估算出如下的概率:,也就是说,在,H,0,成立的情况下,随机变量,K,2,超过,6.635,的概率约为,0.01,,是一个小概率事件,.,现在,K,2,的观测值为,56.632,,远远大于,6.635,,所以有理由断定,H,0,不成立,,即认为,“,吸烟与患肺癌有关系,”,但这种判断会犯错误,犯错误的概率不会超过,0.01,,即我们有,99,的把握认为“吸烟与患肺癌有关系”,.,在H0成立的情况下,统计学家估算出如下的概率:也就是说,在H,利用随机变量,K,2,来确定在多大程度上可以认为,“,两个分类变量有关系,”,的方法称为两个分类变量的独立性检验,.,独立性检验:,利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关,a+b+c+d,b+d,a+c,总计,c+d,d,c,a+b,b,a,总计,若要推断的结论为,H,1,:,”,X,与,Y,有关系,”,可进行如下操作,:,2,、,图形分析法:,通过等高条形图。,你能从上述探究过程中总结出判断两个分类变量有关系的思路吗?,1,、,频率比较法:,根据列联表。,思考:,a+b+c+db+da+c总计c+ddca+bba总计若要推,3,、,独立性检验法,查对临界值表,作出判断。(如果,K,2,值很大,,就断言,H,0,不成立,即认为,“,两个分类变量,有关系,”,;如果很小,则说明在样本数据中没有发现足够证据拒绝,H,0,。),具体做法是,:,首先假设该结论不成立,即,H,0,:,X,与,Y,没有关系,根据观测数据计算,3、独立性检验法查对临界值表,作出判断。(如果K2值很大,就,10.828,7.879,6.635,5.024,3.841,2.706,2.072,1.323,0.708,0.445,k,0.001,0.005,0.010,0.025,0.05,0.10,0.15,0.5,0.40,0.50,(,1,)如果,k10.828,,就有,99.9%,的把握认为,“,X,与,Y,有关系,”,;,(,2,)如果,k7.879,,就有,99.5%,的把握认为,“,X,与,Y,有关系,”,;,(,3,),如果,k6.635,,就有,99%,的把握认为,“,X,与,Y,有关系,”,;,(,4,)如果,k5.024,,就有,97.5%,的把握认为,“,X,与,Y,有关系,”,;,(,5,)如果,k3.841,,就有,95%,的把握认为,“,X,与,Y,有关系,”,;,(,6,)如果,k2.706,,就有,90%,的把握认为,“,X,与,Y,有关系,”,;,(,7,),如果,k=2.706,,就认为没有充分的证据显示,“,X,与,Y,有关系,”,.,临界值,10.8287.8796.6355.0243.8412.70,例,1,在某医院,因为患心脏病而住院的,665,名男性病人中,有,214,人秃顶,;,而另外,772,名不是因为患心脏病而住院的男性病人中,有,175,人秃顶,.,利用图形,判断秃顶与患心脏病是否有关系。,能否在犯错误的概率不超过,0.010,的前提下认为秃顶与患心脏病有关系?,解,:,根据题目所得数据得到列联表,:,1437,772,665,总计,1048,597,451,不秃顶,389,175,214,秃顶,总计,患其他病,患心脏病,秃顶与患心脏病列联表,例题解析:,例1 在某医院,因为患心脏病而住院的665名男性病人中,有,(,1,)等高条形图,从图中可以看出,秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率,因此可直观地认为秃顶与患心脏病有关系。,(1)等高条形图从图中可以看出,秃顶样本中患心脏病的频率明显,因此,在犯错误的概率不超过,0.010,的前提下认为,“,秃顶与患心脏病有关,”,,即有,99%,的把握认为,“,秃顶与患心脏病有关,”,。,(,2,)独立性检验法,1437,772,665,总计,1048,597,451,不秃顶,389,175,214,秃顶,总计,患其他病,患心脏病,因此,在犯错误的概率不超过0.010的前提下,例,2,为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取,300,名学生,得到如下联表:,由表中数据计算,K,2,的观测值,k4.513,。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?,例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城,这一结论只适用于被调查的学校,这一结论只适用于被调查的学校,练习,在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况,:,男乘客晕机的有,24,人,不晕机的有,31,人,;,女乘客晕机的有,8,人,不晕机的有,26,人,.,请你根据所给数据判定,:,在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机,?,练习 在一次天气恶劣的飞行航程中,调,变式训练,某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下,:,变式训练,1,、通过频率比较法,图形分析法判断两个分类变量是否有关系。(不精准),(,1,),ad-bc,(,2,),a/a+bc/c+d,a+b+c+d,b+d,a+c,总计,c+d,d,c,x,2,a+b,b,a,x,1,总计,y,2,y,1,2,、利用,独立性检验,判断两个分类变量是否有关系。,(,1,)假设无关,(,2,)求,k,值,(,3,)下结论,判断两分类变量是否有关的方法:,小结:,1、通过频率比较法,图形分析法判断两个分类变量是否有关系。(,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!