医学统计学卡方检验

上传人:仙*** 文档编号:35535004 上传时间:2021-10-27 格式:PPT 页数:35 大小:878.01KB
返回 下载 相关 举报
医学统计学卡方检验_第1页
第1页 / 共35页
医学统计学卡方检验_第2页
第2页 / 共35页
医学统计学卡方检验_第3页
第3页 / 共35页
点击查看更多>>
资源描述
1第七章第七章 2 检检 验验1检验的基本思想和用途检验的基本思想和用途掌握内容:掌握内容:4行行 列表资料检验及应用时应注意的问题列表资料检验及应用时应注意的问题2成组设计四格表资料检验的计算及应用条件成组设计四格表资料检验的计算及应用条件3配对设计四格表资料检验配对设计四格表资料检验1四格表资料的四格表资料的Fisher精确概率法的基本思想精确概率法的基本思想与检验步骤与检验步骤5频数分布拟合优度的检验频数分布拟合优度的检验了解内容了解内容2 2 检验是一种用途很广的假设检验方检验是一种用途很广的假设检验方法。本章只介绍它在分类变量资料中的应用,法。本章只介绍它在分类变量资料中的应用,即推断两个及多个总体率或总体构成比之间即推断两个及多个总体率或总体构成比之间有无差别,两种属性或两个变量之间有无关有无差别,两种属性或两个变量之间有无关联,以及频数分布的拟合优度检验等。联,以及频数分布的拟合优度检验等。3第一节第一节 四格表资料的四格表资料的 2 检验检验一、检验的基本思想一、检验的基本思想以两样本率比较的以两样本率比较的 检验为例,介绍检验为例,介绍检验的基本思想。检验的基本思想。 22分布是一种连续型分布分布是一种连续型分布 ,它的形状依赖于自,它的形状依赖于自由度的大小,当自由度由度的大小,当自由度2时,曲线呈时,曲线呈L型;型;随着的增加,曲线逐渐趋于对称;当自由度随着的增加,曲线逐渐趋于对称;当自由度时时, 分布趋向正态分布。分布具有可加性。分布趋向正态分布。分布具有可加性。224 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11 A12n1(固定值固定值)2 A21 A22n2(固定值固定值)合计合计 m1 m2n(T11)(T21)(T12)(T22)5 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 a bn1(固定值固定值)2 c dn2(固定值固定值)合计合计 m1 m2n(T11)(T21)(T12)(T22)要想知道处理组要想知道处理组1,2之间差别是否有统计学意义,之间差别是否有统计学意义,常用检验统计量来作假设检验。常用检验统计量来作假设检验。26TTA22)(其基本公式为:其基本公式为:(7.1)由公式由公式(7.1)可以看出:值反映了实际频数与可以看出:值反映了实际频数与理论频数的吻合程度,其中反映了某个格子理论频数的吻合程度,其中反映了某个格子实际频数与理论频数的吻合程度。若检验假设成实际频数与理论频数的吻合程度。若检验假设成立,实际频数与理论频数的差值会小,则立,实际频数与理论频数的差值会小,则 值也值也会小;反之,若检验假设不成立,实际频数与理会小;反之,若检验假设不成立,实际频数与理论频数的差值会大,则论频数的差值会大,则 值也会大。值也会大。 TTA2)(20H20H27值的大小还取决于个数的多少(严值的大小还取决于个数的多少(严格地说是自由度的大小)。由于各皆是格地说是自由度的大小)。由于各皆是正值,故自由度愈大,值也会愈大;所以只正值,故自由度愈大,值也会愈大;所以只有考虑了自由度的影响,值才能正确地反映有考虑了自由度的影响,值才能正确地反映实际频数和理论频数的吻合程度。检验时,实际频数和理论频数的吻合程度。检验时,要根据自由度查界值表。当要根据自由度查界值表。当 时,时,拒绝,接受拒绝,接受 ;当时,尚没有;当时,尚没有理由拒绝。理由拒绝。 而自由度而自由度 。2TTA2)(TTA2)(22AT22,P0H1H2,2P0H218 : ,两总体率不等,两总体率不等 : ,两总体率相等,两总体率相等 二、检验的检验步骤二、检验的检验步骤 21建立检验假设建立检验假设0H211H2105. 0 2计算检验统计量计算检验统计量 (1)当总例数大于)当总例数大于40且所有格子的理论数大且所有格子的理论数大于于5时:用检验的基本公式或四格表资料检验时:用检验的基本公式或四格表资料检验的专用公式;的专用公式; TTA22)(基本公式基本公式9专用公式专用公式 )()()()(22dbcadcbanbcad(2)当总例数)当总例数 且只有一个格子的且只有一个格子的 时:用四格表资料检验的校正公式;或改用四时:用四格表资料检验的校正公式;或改用四格表资料的格表资料的Fisher确切概率法。确切概率法。40n51T2校正公式校正公式 TTAc22)5 . 0()()()()(222b+da+cc+da+bn|ad-bc|-=nc校正公式校正公式 10(3)当,或)当,或 时,不能用检验,时,不能用检验,改用四格表资料的改用四格表资料的Fisher确切概率法。确切概率法。40n1T3作出统计结论作出统计结论以以=1查界值表,若,按查界值表,若,按检验水准拒绝,接受,可认为两总体率不检验水准拒绝,接受,可认为两总体率不同;若同;若 ,按检验水准,按检验水准 不拒绝,不拒绝,尚不能认为两总体率不同。尚不能认为两总体率不同。205. 0P05. 00H1H05. 0P05. 00H211两样本率比较的资料,既可用两样本率比较的资料,既可用 检验检验也可用也可用 检验来推断两总体率是否有差别,检验来推断两总体率是否有差别,且在不校正的条件下两种检验方法是等价的,且在不校正的条件下两种检验方法是等价的,对同一份资料有。对同一份资料有。u22u212例为了解铅中毒病人是否有尿棕色素增加现例为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人与对照定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?人群的尿棕色素阳性率差别有无统计学意义?表两组人群尿棕色素阳性率比较表两组人群尿棕色素阳性率比较组别组别阳性数阳性数阴性数阴性数合计合计阳性率阳性率(%)铅中毒病人铅中毒病人2973680.56对照组对照组9283724.32合计合计38357352.05(18.74)(19.26)(17.74)(17.26)1312.2374.17)74.1728(26.19)26.199(26.17)26.177(74.18)74.1829(22222用专用公式:用专用公式:12.233538373673) 972829()()()()(222dbcadcbanbcad下结论:下结论:以以=1查界值表,按检查界值表,按检验水准拒绝,接受,可认为两总体率不同;验水准拒绝,接受,可认为两总体率不同;205. 0P0H1H05. 014例例2某矿石粉厂生产一种矿石粉时,在数天内即有部分某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患有职业性皮肤炎。后随机抽取工人患有职业性皮肤炎。后随机抽取15名工人穿新防护名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,资料见下表,问两组的患病率差别有皮肤炎患病情况,资料见下表,问两组的患病率差别有无统计学意义?无统计学意义?表穿新旧防护服工人的皮肤炎患病比较表穿新旧防护服工人的皮肤炎患病比较防护服种类防护服种类皮肤炎症皮肤炎症合计合计阳性数阳性数阴性数阴性数新新1(3.84)14(11.16)15旧旧10(7.16) 18(20.84)28合计合计11324315本例本例n40,因有一格子的理论数,因有一格子的理论数5,因而要,因而要用校正用校正 检验。检验。2H0:两组工人皮肤炎总体患病率相等,即两组工人皮肤炎总体患病率相等,即H1:两组工人皮肤炎总体患病率不等,即两组工人皮肤炎总体患病率不等,即212105. 0校正校正 值为:值为:294.284.20)5 .0|84.2018(|16.7)5 .0|16.710(|16.11)5 .0|16.1114(|84.3)5 .0|84.31(|2222216以以=1查界值表,按查界值表,按 检检验水准不拒绝验水准不拒绝 ,接受,接受 ,尚不能认为穿不同,尚不能认为穿不同防护服的两组工人的皮肤炎患病率的差别有统防护服的两组工人的皮肤炎患病率的差别有统计学意义;计学意义;205. 0P0H1H05. 0注意:本例若不作连续性校正,则,注意:本例若不作连续性校正,则,得得33. 4205. 0P,可见两者是有区别的。,可见两者是有区别的。17第二节第二节 配对四格表资料的配对四格表资料的 2检验检验 属于配对设计的两组频数分布的属于配对设计的两组频数分布的 2检验。检验。这类问题的原始数据可以表示为表这类问题的原始数据可以表示为表7-2所示的所示的四格表形式。表四格表形式。表7-2和表和表7-1的区别仅在设计的区别仅在设计上,前面是两个独立样本,行合计是事先固上,前面是两个独立样本,行合计是事先固定的;而这里的定的;而这里的“两份样本两份样本” 互不独立,样互不独立,样本量都是本量都是n,是固定的,而行合计与列合计,是固定的,而行合计与列合计却是事先不确定的。却是事先不确定的。 18变量变量1变量变量2合计合计阳性阳性阴性阴性阳性阳性阴性阴性合计合计(固定值)(固定值)ab1ncd2n1m2mn表表7-2 两个变量阳性率比较的一般形式和符号两个变量阳性率比较的一般形式和符号 变量变量1的阳性率的阳性率 变量变量2的阳性率的阳性率 nn1nbanm1nca 19变量变量1 1的阳性率变量的阳性率变量2 2的阳性率的阳性率 nbancancb可见,两个变量阳性率的比较只和、有关,可见,两个变量阳性率的比较只和、有关,而与、无关。而与、无关。 bcad:,即两种方法的总体检测结果相同:,即两种方法的总体检测结果相同 0HCB :,即两种方法的总体检测结果不相同:,即两种方法的总体检测结果不相同 1HCB 05. 020若若H0 成立,变量成立,变量1与变量与变量2所示的结果不一致的所示的结果不一致的两个格子理论频数都应该是。由两个格子理论频数都应该是。由 2 检验检验基本思想得基本思想得 :2/ )(cb2222222cbcbccbcbb 化简后得到,化简后得到, 2 统计量的计算公式为统计量的计算公式为:cbcb 22)( 21若若, 需对上述公式校正需对上述公式校正, 校正公式为:校正公式为: 40 cbcbcb22) 1|(|22例某研究室用甲乙两种血清方法检查鼻咽癌例某研究室用甲乙两种血清方法检查鼻咽癌患者血清患者血清93份,结果如下表,问两法的检出率份,结果如下表,问两法的检出率有无差别?有无差别?表两种血清学检查结果比较表两种血清学检查结果比较甲法甲法乙法乙法合计合计45226762026合计合计51429323:,即两种方法的总体检测结果相同:,即两种方法的总体检测结果相同 0HCB :,即两种方法的总体检测结果不相同:,即两种方法的总体检测结果不相同 1HCB 05. 01. 建立假设检验,确定检验水准。建立假设检验,确定检验水准。2. 计算统计量计算统计量由于由于 ,需作连续性校正,计,需作连续性校正,计算卡方值:算卡方值:4028 cb04. 8622) 1|622(|22243. 作出统计推断作出统计推断25行行列表资料的检验,用于多个样本列表资料的检验,用于多个样本率的比较、两个或多个构成比的比较、以率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。其基及双向无序分类资料的关联性检验。其基本数据有以下本数据有以下3种情况:种情况:第三节行第三节行列表的列表的2检验检验26多个样本率比较时,有多个样本率比较时,有R行行2列,称为表;列,称为表;两个样本的构成比比较时,有两个样本的构成比比较时,有2行行C列,称为列,称为表;表;多个样本的构成比比较,以及双向无序分类资料多个样本的构成比比较,以及双向无序分类资料关联性检验时,有关联性检验时,有R行行C列,称为表。列,称为表。以上以上3种情况可统称为行种情况可统称为行列表资料。列表资料。 第三节行第三节行列表的列表的2检验检验2RC2CR27, (行数行数-1)(列数列数-1) 行行列表资料的检验仍可用列表资料的检验仍可用Pearson公式,公式,但用下列专用公式,计算简单,但用下列专用公式,计算简单, 22) 1(22CRnnAn1. 多个率的比较多个率的比较例例2. 多个构成比的比较多个构成比的比较例例283. 行行列表资料检验的注意事项列表资料检验的注意事项 2(一)一般认为,行(一)一般认为,行列表中的理论频数列表中的理论频数不应小于不应小于1,或的格子数不宜超过格子,或的格子数不宜超过格子总数的总数的 。若出现上述情况,可通过以下方。若出现上述情况,可通过以下方法解决:法解决:最好是增加样本含量,使理论频最好是增加样本含量,使理论频数增大;数增大;根据专业知识,考虑能否删去理根据专业知识,考虑能否删去理论频数太小的行或列,能否将理论频数太小论频数太小的行或列,能否将理论频数太小的行或列与性质相近的邻行或邻列合并;的行或列与性质相近的邻行或邻列合并;改用双向无序表的改用双向无序表的Fisher确切概率法(可用确切概率法(可用SAS软件实现)。软件实现)。51T5/129(二二)多个样本率比较,若所得统计推断为多个样本率比较,若所得统计推断为拒绝拒绝H0,接受,接受H1时,只能认为各总体率之时,只能认为各总体率之间总的来说有差别,但不能说明任两个总间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两总体率之间皆有差别。要进一步推断哪两总体率之间有差别,需进一步做多个样本率体率之间有差别,需进一步做多个样本率的多重比较。的多重比较。304.行行列表的分割列表的分割在行行列表的中,若拒绝无效假设列表的中,若拒绝无效假设H0只能做出总的结论,但还不知道哪两只能做出总的结论,但还不知道哪两个率之间有差别。若想知道哪两个率之间个率之间有差别。若想知道哪两个率之间有差别,还要进行两两比较,本节介绍两有差别,还要进行两两比较,本节介绍两两比较的方法之一:行两比较的方法之一:行列表的分割。列表的分割。2314.行行列表的分割列表的分割(一)多个实验组间的两两比较(一)多个实验组间的两两比较由于要做重复多次的假设检验,需对第由于要做重复多次的假设检验,需对第类错误作校正,新的校正检验水准为:类错误作校正,新的校正检验水准为:(1),2k kNN 32表三种疗法效率表三种疗法效率对比组对比组有效有效无效无效合计合计西药组西药组中药组中药组5135494510080中西药结合组中西药结合组591574合计合计145109254例:某医师分别用西药,中药和中西药例:某医师分别用西药,中药和中西药结合治疗恶性肿瘤,结果如下表:结合治疗恶性肿瘤,结果如下表:33经过总的假设检验,拒绝了经过总的假设检验,拒绝了H0,因此,可因此,可进一步作两两比较。进一步作两两比较。表三种疗法效率的两两比较表三种疗法效率的两两比较对比组对比组有效有效无效无效合计合计值值P值值西药组西药组中药组中药组51354945100800.940.017合计合计8694180西药组西药组中西药结合组中西药结合组515949151007415.100.017合计合计11064174中药组中药组中西药结合组中西药结合组35 594515807420.930.017合计合计9460154234(二)多个实验组与一个对照组的比较(二)多个实验组与一个对照组的比较此时,校正的检验水平为:此时,校正的检验水平为:1k 35 The End
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 销售管理


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!