资源描述
怎样进行独立性检验(B 版) 山东 孙刚璞 一、独立性检验的基本思想 独立性检验的基本思想类似于数学中的反证法 其目的是为了确认“两个分类变量有关 系”这一结论成立的可信程度 它首先假设结论不成立,即“两个分类变量没有关系”成立, 在该假设下,构造的随机变量 x2的值应该很小如果由观测数据计算得到的 X2的观测值很 大,则在一定程度上说明假设不合理 因此可以根据随机变量 X2的含义来确定该假设不合理 . 2 的程度如果X 6.635,则说明该假设不合理的程度是 99 %,从而可认为“两个分类变量 有关系”这一结论成立的可信程度为 99% . 二、独立性检验的相关概念 1.2X 2 列联表 一般地,如果有两个分类变量 X 和 Y,它们的值域分别是x, x2力,y2,它们的样 本频数列联表(见下表)称为 2X 2 列联表. 72 总计 12 1+ 如j 7? 22 g 总计 心2 n 2. X2统计量 2 X 统计量是统计学中的一个非常有用的统计量, 它是根据概率的统计定义和事件的独 立性得到的,其计算公式是 X2 n(mn22 2n21).利用它的大小可以决定是否拒绝原来 m n2 n 小 2 的统计假设,如果计算出的 X2值较大,就拒绝假设;如果 X2值较小,就接受假设. 3临界值 通过对X2统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常 2 用的有两个:3.841 和 6.635.在对具体问题进行独立性检验时, 把计算出的X 值与以上两个 临界值进行对比,从而确定两个事件的关系 三、独立性检验步骤 使用X2统计量作 2X 2 列联表的独立性检验的步骤是: (1) 检查 2X2 列联表中的数据是否符合要求; (2) 由公式X2 n(n理 也2疲工计算出X2的值; n n2 n 小 2 (3) 将X2的值与两个临界值进行对比, 进而作出统计推断:如果计算出的X2 3.841 , 则有 95%的把握说两个事件有关;如果计算出的 X2 6.635,则有 99%的把握说两个事件 2 有关;如果计算出的 X 6.635,所以有 99%的把握说,运动员受伤与不做热身运动有关 例 2 某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为, 在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利 某记者为此追踪了某著 名乒乓球运动员在该球场中的 308 场比赛,获得数据如下表: 胜 负 合计 先迈人击脚 17* 27 205 先迈人右脚 84 19 )03 合计 262 46 308 据此资料,你能得出什么结论? 因为 1.502 V 3.384,所以我们认为先迈进左脚与否跟比赛的胜负是无关的 五、注意事项 1.使用X2统计量作 2X 2 列联表的独立性检验时,要求表中的四个数据都要大于 5,因 此在选取样本时一定要注意 2要注意独立性检验的结论与实际问题的差异,独立性检验的结论是一个数学统计量, 它与实际问题的确定性是存在差异的 . 3独立性检验的结论不只是对样本成立,它对总体来说也是成立的,这体现了统计的意 义. 38.974 . 解:由X2门(计22叭)2 n2 n 小 2 308 (178 19 84 27)2 205 103 262 46 1.502 。
展开阅读全文