第09章新卡方检验课件

上传人:痛*** 文档编号:241638657 上传时间:2024-07-12 格式:PPT 页数:50 大小:898.50KB
返回 下载 相关 举报
第09章新卡方检验课件_第1页
第1页 / 共50页
第09章新卡方检验课件_第2页
第2页 / 共50页
第09章新卡方检验课件_第3页
第3页 / 共50页
点击查看更多>>
资源描述
检验检验 第九章第九章 2检验检验(Chi-square test)是现代统计学的是现代统计学的创始人之一,英国人创始人之一,英国人Karl Pearson(1857-1936)于于1900年提出的一种具有广泛用途的年提出的一种具有广泛用途的统计方法,常用于统计方法,常用于计数资料的统计分析计数资料的统计分析。Karl Pearson 2检验的应用:检验的应用:1)推断两个或多个相互独立的总体率与总体构)推断两个或多个相互独立的总体率与总体构 成比之间有无差别;成比之间有无差别;2)两种属性或两个变量之间有无关联性及相关)两种属性或两个变量之间有无关联性及相关 程度;程度;3)频数分布的拟合优度检验;)频数分布的拟合优度检验;4)配对计数资料的两率之间有无差别的比较。)配对计数资料的两率之间有无差别的比较。2检验的基本思想:检验的基本思想:以以2值的大小来反映理论频数(值的大小来反映理论频数(T)与实际频数)与实际频数(A)的吻合程度。在零假设的吻合程度。在零假设H0成立的条件下成立的条件下(H0:1=2),实际频数和理论频数应该相差不),实际频数和理论频数应该相差不大,即大,即2值不应该很大,若实际算出的值不应该很大,若实际算出的2值较值较大,超过了设定的检验水准所对应的界值,则有大,超过了设定的检验水准所对应的界值,则有理由怀疑理由怀疑H0的真实性,从而拒绝的真实性,从而拒绝H0,接受,接受H1,即即12,就有理由认为原假设不成立就有理由认为原假设不成立。第一节第一节分布分布 分布是一种分布是一种连续型随机变量连续型随机变量的概率的概率分布,概率密度函数分布,概率密度函数与自由度有关与自由度有关。不同自由度有不同分布曲线,所以卡不同自由度有不同分布曲线,所以卡方分布为方分布为一簇分布曲线一簇分布曲线。分布曲线的特点:分布曲线的特点:1 1)2 2值不小于值不小于0 0,其取值范围为(,其取值范围为(0 0,););2 2)2 2分布曲线形状随自由度分布曲线形状随自由度而变化,即不而变化,即不同的自由度有不同的曲线。同的自由度有不同的曲线。不同自由度的不同自由度的2 2分布右侧尾部面积为分布右侧尾部面积为a时的临界值记为时的临界值记为2 2a,a,卡方分布的一个基本性质:卡方分布的一个基本性质:可加性可加性第二节第二节 独立性检验独立性检验一、四格表(一、四格表(22表)卡方检验表)卡方检验二、行二、行列表(列表(RC表)卡方检验表)卡方检验三、配对四格表卡方检验三、配对四格表卡方检验一、独立样本一、独立样本2 22 2列联表资料的列联表资料的2 2检验检验目的:目的:两独立样本率差异的比较。即根据两独两独立样本率差异的比较。即根据两独 立样本的频率分布,检验两个样本的总立样本的频率分布,检验两个样本的总 体分布是否相同。体分布是否相同。1.基本公式基本公式式中,式中,A为实际频数(为实际频数(actual frequency)T为理论频数(为理论频数(theoretical frequency)例例72的计算结果的计算结果2.四格表资料检验的四格表资料检验的专用公式专用公式3.3.四格表资料检验的连续性校正公式四格表资料检验的连续性校正公式 四格表资料 检验公式选择条件:n40且T5,专用公式或基本公式 n40但有1T5,校正公式;Fisher确 切概率 n40或T1,或P 直接计算概率 (Fisher确切概率)。连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一般不作校正。时,一般不作校正。二、行列表资料的 检验 应用:应用:R R C C列表的列表的 检验用于多个样本率的比较、两检验用于多个样本率的比较、两 个或多个构成比的比较、以及双向无序分类资料个或多个构成比的比较、以及双向无序分类资料 的关联性检验。的关联性检验。其基本数据有以下三种情况:其基本数据有以下三种情况:多个样本率比较时,有多个样本率比较时,有R R行行2 2列,称为列,称为R R2 2表,表,如例如例8-38-3;两个样本的构成比比较时,有两个样本的构成比比较时,有2 2行行C C列,称列,称2 2C C表,表,如例如例8-48-4;多个样本的构成比比较,以及双向无序分类资料关联性检验多个样本的构成比比较,以及双向无序分类资料关联性检验时,有时,有R R行行C C列,称为列,称为R RC C表。表。检验统计量(检验统计量(专用公式专用公式)1.多个样本率的比较多个样本率的比较行行列表中的各格子应该有列表中的各格子应该有T1,并且,并且1T5的格的格子数不宜超过子数不宜超过1/5格子总数,否则可能产生偏性。处格子总数,否则可能产生偏性。处理方法有三种:理方法有三种:增大样本含量增大样本含量根据专业知识删去或合并根据专业知识删去或合并改用双向无序改用双向无序RC表的表的Fisher确切概率法。确切概率法。3.行行列表资料列表资料 检验的检验的注意事项注意事项当多个样本率比较所得的统计推断为拒绝当多个样本率比较所得的统计推断为拒绝H H0 0,接受,接受H H1 1时,若要推断任两个总体率间有无差别,需进一步时,若要推断任两个总体率间有无差别,需进一步作多个样本率的多重比较。作多个样本率的多重比较。即先调整即先调整,再进行率的两两比较。,再进行率的两两比较。=/N N=C=/N N=Ck k2 2=k(k-1)/2=k(k-1)/2N N为要进行两两比较的次数,为要进行两两比较的次数,K K为参加检验的组数。为参加检验的组数。与前面一样进行四格表卡方检验。与前面一样进行四格表卡方检验。多个实验组与同一对照组比较时,多个实验组与同一对照组比较时,=/k-1 k=/k-1 k为参加检验的组数。为参加检验的组数。3.3.行行列表资料列表资料 检验的注意事项检验的注意事项 三、三、配对四格表资料的配对四格表资料的 检验检验也称也称McNemar检验(检验(McNemars test)配对四格表资料配对四格表资料 2检验的目的是通过检验的目的是通过对单一样本数据的分析,推断两种处理对单一样本数据的分析,推断两种处理的结果有无差别的结果有无差别。应用:应用:计数资料的配对设计常用于计数资料的配对设计常用于2 2种检种检 验方法、培养方法、诊断方法的验方法、培养方法、诊断方法的 比较。比较。特点:特点:对样本的各观察单位分别用对样本的各观察单位分别用2 2种方种方 法处理,然后观察法处理,然后观察2 2种处理方法的种处理方法的 计数结果。计数结果。156页例页例8-5.式中,式中,a,d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。检验统计量为检验统计量为p158R*R列联表列联表x2检验检验 第三节第三节 拟合优度检验拟合优度检验 根据样本的频率分布检验其总体分布是否等于根据样本的频率分布检验其总体分布是否等于某给定的理论分布。某给定的理论分布。注意:理论频数注意:理论频数F 不宜过小,如不小于不宜过小,如不小于5,否则需要合并,否则需要合并看书上例题看书上例题P162:例例8-8.Z(2.95-4.1966)/0.6737 拟合优度拟合优度2 2 检验的注意事项:检验的注意事项:1 1)分组不同拟合的结果可能不同,一般)分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于要求分组时每组中的理论频数不小于5 5;2 2)需要有足够的样本含量,如果样本含)需要有足够的样本含量,如果样本含量不大,需要经连续性校正。量不大,需要经连续性校正。条件:条件:直接计算出有利于拒绝直接计算出有利于拒绝H H0 0的概率。的概率。理论依据:理论依据:超几何分布,非超几何分布,非 检验的范畴。检验的范畴。第四节第四节 四格表资料的四格表资料的Fisher确切概率法确切概率法 阳性例数阳性例数阴性例数阴性例数合计合计A A组组2 214141616B B组组3 38 81111合计合计5 522222727实际值实际值A A2 214143 38 8理论值理论值T T10.887610.88765.112426045.112426047.485217.485213.51479293.5147929P P值值2.4E-082.4E-08X2X231.116531.1165Fisher精确检验的基本思想:精确检验的基本思想:在四格表周边合计数固定不变的条在四格表周边合计数固定不变的条件下(件下(横竖横竖),计算表内),计算表内4个实际频数变个实际频数变动时的各种组合之概率动时的各种组合之概率 ;再按检验假;再按检验假设用单侧或双侧的累计概率设用单侧或双侧的累计概率 ,依据所,依据所取的检验水准取的检验水准 做出推断。做出推断。(1)各组合概率Pi的计算 在四格表周边合计数不变的条件下,表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例6-11,表内4个实际频数变动的组合数共有5+1=6个,依次为:各组合的概率各组合的概率Pi 服从超几何分布,其和为服从超几何分布,其和为1。计算公式为!为阶乘符号 比样本四格表更极端的概率比样本四格表更极端的概率(1 1)单侧检验小于等于样本四格表概率一侧的概率之和。)单侧检验小于等于样本四格表概率一侧的概率之和。(2 2)双侧检验小于等于样本四格表概率两侧概率之和。)双侧检验小于等于样本四格表概率两侧概率之和。累计概率的计算累计概率的计算 (单、双侧检验不同单、双侧检验不同)0.31640.92895+1
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!