【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3)

上传人:仙*** 文档编号:195996587 上传时间:2023-03-24 格式:PPT 页数:21 大小:485.01KB
返回 下载 相关 举报
【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3)_第1页
第1页 / 共21页
【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3)_第2页
第2页 / 共21页
【数学】32《独立性的基本思想及其初步应用》PPT课件(新人教A版选修2-3)_第3页
第3页 / 共21页
点击查看更多>>
资源描述
3.2独立性检验的独立性检验的基本思想及其初基本思想及其初步应用步应用2 2定量变量回归分析(画散点图、相关系数r、定量变量回归分析(画散点图、相关系数r、变量 相关指数R、残差分析)变量 相关指数R、残差分析)分类变量分类变量研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量之间是否有关系分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。性别是否对于喜欢数学课程有影响?等等。变量的不同变量的不同”值值”表示个体所属的不同类别表示个体所属的不同类别.分类变量:如:性别,是否吸烟,宗教信仰,国籍等在日常生活中,我们常常关心两个分类变量之间是否具有关系.例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965列联表列联表:列出两个分类变量的频数表列出两个分类变量的频数表那么吸烟是否对患肺癌有影响?粗略估计:在不吸烟者中,有0.54%患有肺癌;在吸烟者中,有2.28%患有肺癌.因此,直观上得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异因此因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强。越大,说明吸烟与患肺癌之间关系越强。不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+dadbc即aa+ba+caa+ba+cnnnnnna+ba+bP(A),P(A),n na+ca+cP(B),P(B),n n.a aP(AB)P(AB)n n其中为样本容量,即n=a+b+c+dn=a+b+c+d在表中,在表中,a恰好为事件恰好为事件AB发生的频数;发生的频数;a+b和和a+c恰好分别为事恰好分别为事件件A和和B发生的频数。由于频率接近于概率,所以在发生的频数。由于频率接近于概率,所以在H0成立的条成立的条件下应该有件下应该有(a+b+c+d)a(a+b)(a+c),怎样描述实际观测值与估计值的差异呢?怎样描述实际观测值与估计值的差异呢?统计学中采用统计学中采用22()abacannnKabacnnn ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)(22()()()()()n adbcac bdab cd化简得K2(K 2 2观观测测值值预预期期值值)用用卡卡方方统统计计量量:预预期期值值来来刻刻画画实实际际观观测测值值与与估估计计值值的的差差异异.即即 独立性检验第一步:第一步:H H0 0:吸烟吸烟和和患病患病之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患病有关吸烟与患病有关结论的可靠结论的可靠程度如何?程度如何?患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列联表列联表 用用2 2统计量研究统计量研究这类问题的方法这类问题的方法步骤步骤第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。dcban其中 22na db cKabcdacbdP(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828210.828K 26.635K 22.706K 22.706K 0.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如 独立性检验通过公式计算通过公式计算患病患病不患病不患病总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965229965 7775 4942 209956.6327817 2148 9874 91KH H0 0:吸烟吸烟和和患病患病之间没有关系之间没有关系解解:已知在已知在 成立的情况下,成立的情况下,0H故有故有99.9%99.9%的把握认为的把握认为H H0 0不成立,即有不成立,即有99.9%99.9%的把握认为的把握认为“患病与吸烟有关系患病与吸烟有关系”。即在即在 成立的情况下,成立的情况下,大于大于10.82810.828概率非常概率非常小,近似为小,近似为0.0010.0010H2K现在的现在的 =56.632=56.632的观测值远大于的观测值远大于10.82810.828,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0010.001。2K2(1 0.8 2 8)0.0 0 1PK0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.8282()P Kkk(1)10.828,99.9%kXY如果就有的把握认为与 有关系(2)7.879,99.5%kXY如果就有的把握认为与 有关系(3)6.635,99%kXY如果就有的把握认为与 有关系(4)5.024,97.5%kXY如果就有的把握认为与 有关系(5)3.841,95%kXY如果就有的把握认为与 有关系(6)2.706,90%kXY如果就有的把握认为与 有关系(7)2.706,kXY如果就认为没有充分的证据显示与 有关系在H0成立的情况下,统计学家估算出如下的概率:26.6350.01P K 即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01.也就是说,在H0成立的情况下对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01206.635,?KH如果就判定不成立 这种判断出错的可能性有多大只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为”吸烟与患肺癌有关系”例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有174人秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解:根据题目所得数据得到列联表:患心脏病患其他病总计秃顶214175389不秃顶4515971048总计6657721437秃顶与患心脏病列联表患心脏病患其他病总计秃顶214175389不秃顶4515971048总计665772143722n adbcKabcdacbdnabcd 其中为样本容量22,1437214 597 175 45116.3736.635389 1048 665 772Kk根据列联表中的数据 得的观测值为所以有99%的把握认为”秃顶与患心脏病有关”2.利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由22n adbcKabcdacbdnabcd 其中为样本容量给出的随机变量K2的值k,其值越大,说明”X与Y有关系”成立的可能性越大.当得到的观测数据a,b,c,d都不小于5时,可以通过查表来断言”X与Y有关系”的可信程度反证法原理与假设检验原理反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。例例1.1.在在500500人身上试验某种血清预防感冒作用,把他们人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外一年中的感冒记录与另外500500名未用血清的人的感冒记名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?感冒的作用?未感冒未感冒感冒感冒合计合计使用血清使用血清258242500未使用血清未使用血清216284500合计合计4745261000解:设解:设H0:感冒与是否使用该血清没有关系。:感冒与是否使用该血清没有关系。075.7500500526474216242284258100022 因当因当H0成立时,成立时,26.635的概率约为的概率约为0.01,故有,故有99%的把握认的把握认为该血清能起到预防感冒的作用。为该血清能起到预防感冒的作用。P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828有效有效无效无效合计合计口服口服585840409898注射注射646431319595合计合计1221227171193193解:设解:设H0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。22193 583164401.3896122719895K因当因当H0成立时,成立时,K21.3896的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。,即不能作出药的效果与给药方式有关的结论。2.072例例2 2:为研究不同的给药方式(口服与注射)和药的效:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的调查的结果列在表中,根据所选择的193193个病人的数个病人的数据,能否作出药的效果和给药方式有关的结论?据,能否作出药的效果和给药方式有关的结论?P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例例3:气管炎是一种常见的呼吸道疾病,医药研究人:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?所得数据如表所示,问:它们的疗效有无差异?有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:设解:设H0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。22345 1849619111.09827570245100K因当因当H0成立时,成立时,K210.828的概率为的概率为0.001,故有,故有99.9%的把握的把握认为,两种药物的疗效有差异。认为,两种药物的疗效有差异。例4.在研究某种新药对小白兔的防治效果时,得到下表数据:存活数死亡数总计未用新药10138139用新药12920149总计23058288试分析新药对防治小白兔是否有效?2288101 2038 1298.6587.879139 149 230 58k99.5%的把握判定新药对防治小白兔是有效的.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!