第8章卡方检验综述课件

上传人:仙*** 文档编号:241647879 上传时间:2024-07-12 格式:PPT 页数:57 大小:882.50KB
返回 下载 相关 举报
第8章卡方检验综述课件_第1页
第1页 / 共57页
第8章卡方检验综述课件_第2页
第2页 / 共57页
第8章卡方检验综述课件_第3页
第3页 / 共57页
点击查看更多>>
资源描述
(卡方)检验(卡方)检验第八章第八章问题一问题一:一对因子遗传实验一对因子遗传实验,白猪和黑猪杂交白猪和黑猪杂交F2代代260头,头,181头白猪,请问毛色分离头白猪,请问毛色分离是否受一对等位基因控制?是否受一对等位基因控制?问题二:某问题二:某村近村近5年来出生年来出生112名男孩,名男孩,88名女孩,名女孩,请问该村近请问该村近5年出生的男女比例是否失调年出生的男女比例是否失调?问题三问题三:猪场为检验某种疫苗是否有预防效果猪场为检验某种疫苗是否有预防效果,注射疫苗的猪注射疫苗的猪44头,有头,有12头发病;未头发病;未注射疫苗猪有注射疫苗猪有36头其中发病的有头其中发病的有22头头,请问该疫苗是否有预防效果请问该疫苗是否有预防效果?第一第一节 2检验的原理的原理2检验是通过提出某种假定的理论值与实际值进行检验是通过提出某种假定的理论值与实际值进行比较,从而确定两者的符合程度比较,从而确定两者的符合程度。适合性检验(适合性检验(test for goodness-of-it)通常用于通常用于实际次数与理论次数之间的比较。实际次数与理论次数之间的比较。独立性检验(独立性检验(test for independence)是研究两类是研究两类实验因子之间相互独立还是相互影响。实验因子之间相互独立还是相互影响。uiN(0,1)n连续性数据的连续性数据的2定义定义一、一、2检验的原理检验的原理不同自由度的概率密度的曲线不同自由度的概率密度的曲线次数资料的次数资料的2定义定义其中:其中:O 观测次数观测次数 E 理论次数理论次数 例例 青豆、黄豆(仅颜色不同)各青豆、黄豆(仅颜色不同)各1000粒混于小粒混于小罐中,每次抽取罐中,每次抽取100粒。第一次抽样得青豆粒。第一次抽样得青豆53粒,黄豆粒,黄豆47粒;第二次抽样得青豆粒;第二次抽样得青豆42粒,黄豆粒,黄豆58粒,分别求粒,分别求2值值并比较两次实验值与理论值并比较两次实验值与理论值的符合程度。的符合程度。抽样抽样抽样抽样1 1所得次数值与理论值更相符合。所得次数值与理论值更相符合。所得次数值与理论值更相符合。所得次数值与理论值更相符合。卡方测验为单尾测验卡方测验为单尾测验,对于一定的自由度对于一定的自由度,df=3若若 则推断为显著则推断为显著;若若 则推断为不显著则推断为不显著2的显著性是相对于某一统计假设来说的显著性是相对于某一统计假设来说-独立性测验和适合性测验独立性测验和适合性测验近似服从近似服从2分布分布 2分布是连续性随机变量的概率分布,而次数资分布是连续性随机变量的概率分布,而次数资料是间断型的。料是间断型的。2检验是右侧检验检验是右侧检验 观察频数与理论频数相差越大,观察频数与理论频数相差越大,2值越大,只有值越大,只有大的大的2值才可能否定原假设,所以卡方检验始终值才可能否定原假设,所以卡方检验始终是右侧检验。是右侧检验。连续性矫正连续性矫正 当资料的当资料的df=1和小样本尤其是理论次数小和小样本尤其是理论次数小于于5的情况下,由连续型的的情况下,由连续型的x2分布推得的概分布推得的概率与真正概率差异较大,必须进行矫正。率与真正概率差异较大,必须进行矫正。矫正后的矫正后的x2值:值:二、二、2检验的一般步骤检验的一般步骤a提出无效假设提出无效假设b计算理论次数计算理论次数Ec 计算统计量计算统计量 2值值d 统计推断统计推断例例1 一对因子遗传实验,观察白猪和黑猪杂交仔二代一对因子遗传实验,观察白猪和黑猪杂交仔二代260头;其中有白猪头;其中有白猪181头,黑猪头,黑猪79头。问毛色分离头。问毛色分离是否受一对等位基因控制?是否受一对等位基因控制?1、H0:猪毛色猪毛色F2分离符合分离符合3:1比率比率 HA:不符合不符合2 2、计算理论次数:、计算理论次数:、计算理论次数:、计算理论次数:白猪理论头数:白猪理论头数:白猪理论头数:白猪理论头数:2602603/4=1953/4=1953/4=1953/4=195 黑猪理论头数:黑猪理论头数:黑猪理论头数:黑猪理论头数:260260 1/4=651/4=651/4=651/4=65一、实际资料与先验理论的适合性检验一、实际资料与先验理论的适合性检验一、实际资料与先验理论的适合性检验一、实际资料与先验理论的适合性检验第二节第二节 适合性检验适合性检验3、列计算表:、列计算表:性状性状性状性状实际次数实际次数实际次数实际次数(OO)理论次数理论次数理论次数理论次数(E E)白色白色白色白色181181195195黑色黑色黑色黑色79796565总和总和总和总和2602602602604 4、求、求、求、求 值:值:值:值:5、查、查 表:表:df=n-1=2-1=1(计算理论次数时受一个总数的限制计算理论次数时受一个总数的限制)查表得,查表得,差异不显著,差异不显著,表明实际次数与理论次数是符合的。表明实际次数与理论次数是符合的。本例如果不矫正,其结果:本例如果不矫正,其结果:求得求得求得求得 差异显著,可推断实际次数与理论差异显著,可推断实际次数与理论差异显著,可推断实际次数与理论差异显著,可推断实际次数与理论次数是不符合的。可见当次数是不符合的。可见当次数是不符合的。可见当次数是不符合的。可见当 时矫正是很有必要的。时矫正是很有必要的。时矫正是很有必要的。时矫正是很有必要的。性性 状状黑色无角黑色无角黑色有角黑色有角红色无角红色无角红色有角红色有角总数总数观察次数观察次数(O)15239536250理论次数理论次数(E)140.62546.87546.87515.625250O-E11.375-7.8756.125-9.625例例2 两对因子遗传实验,用黑色无角牛和红色有角牛杂交两对因子遗传实验,用黑色无角牛和红色有角牛杂交仔二代出现黑色无角牛仔二代出现黑色无角牛152头头,黑色有角牛黑色有角牛39头头,红色无红色无角角53头头,红色有角红色有角6头头,共共250头。问两对性状分离是否符头。问两对性状分离是否符合合9:3:3:1的遗传比例?的遗传比例?性性 状状黑色无角黑色无角黑色有角黑色有角红色无角红色无角总数总数观察次数观察次数(O)1523953244理论次数理论次数(E)146.448.848.8244O-E5.6-9.84.2 说明实际观测次数与理论次数差异不显著,说明实际观测次数与理论次数差异不显著,说明实际观测次数与理论次数差异不显著,说明实际观测次数与理论次数差异不显著,3 3种表现型的分离符合独立遗传的分离比例:种表现型的分离符合独立遗传的分离比例:种表现型的分离符合独立遗传的分离比例:种表现型的分离符合独立遗传的分离比例:说明实际观测次数与理论次数差异显著,说明实际观测次数与理论次数差异显著,说明实际观测次数与理论次数差异显著,说明实际观测次数与理论次数差异显著,3 3种表现型组合与红色有角比率不符合:的分离。种表现型组合与红色有角比率不符合:的分离。种表现型组合与红色有角比率不符合:的分离。种表现型组合与红色有角比率不符合:的分离。性性 状状合并组合并组 红色有角红色有角总数总数观察次数观察次数(O)2446250理论次数理论次数(E)234.37515.625250O-E9.625-9.625例例例例3 433 43窝小白鼠窝小白鼠窝小白鼠窝小白鼠(N=43),(N=43),每窝每窝每窝每窝4 4只只只只,经某剂量射线照射后经某剂量射线照射后经某剂量射线照射后经某剂量射线照射后1414天天天天内各窝死亡情况:全部成活的有内各窝死亡情况:全部成活的有内各窝死亡情况:全部成活的有内各窝死亡情况:全部成活的有1313窝窝窝窝;死一只的有死一只的有死一只的有死一只的有2020窝窝窝窝;死死死死2 2只的有只的有只的有只的有7 7窝窝窝窝;死死死死3 3只的有只的有只的有只的有3 3窝窝窝窝;全部死亡的一窝没有全部死亡的一窝没有全部死亡的一窝没有全部死亡的一窝没有.检验射线检验射线检验射线检验射线照射后小白鼠死亡数是否服从二项分布。照射后小白鼠死亡数是否服从二项分布。照射后小白鼠死亡数是否服从二项分布。照射后小白鼠死亡数是否服从二项分布。二、实际资料与理论分布相符合程度的适合性检验二、实际资料与理论分布相符合程度的适合性检验HH0 0:小白鼠死亡数服从二项分布;:小白鼠死亡数服从二项分布;:小白鼠死亡数服从二项分布;:小白鼠死亡数服从二项分布;HHA A:小白鼠死亡数不服从二项分布。:小白鼠死亡数不服从二项分布。:小白鼠死亡数不服从二项分布。:小白鼠死亡数不服从二项分布。每窝死亡只数每窝死亡只数每窝死亡只数每窝死亡只数x xB(4,p)B(4,p)平均死亡率为平均死亡率为p=0.25 n=4,每窝死亡的概率为:每窝死亡的概率为:小白鼠死亡小白鼠死亡n+1种类型的概率:种类型的概率:死亡数死亡数观察窝数观察窝数理论概率理论概率观察窝数观察窝数0130.316413.6051200.421918.141270.21099.068330.04692.016400.00390.167总4343df=3-2=1(5组合并成组合并成3组组,计算理论次数时受一个总数和平均计算理论次数时受一个总数和平均数的限制数的限制)校正公式计算:校正公式计算:0.05,2 0.05,接受接受H0,射线照射后小白鼠的死亡数,射线照射后小白鼠的死亡数服从二项分布服从二项分布当实际次数分布以二项分布或波松分布配合当实际次数分布以二项分布或波松分布配合时时,由于每一理论次数受总次数和平均数由于每一理论次数受总次数和平均数np的限制的限制,所以所以df=k-1-1注意将每一理论次数注意将每一理论次数5的组的组,上上述计算的述计算的df的的k指合并后的组数指合并后的组数根据处理及考察指标的多少分为不同的两向列联表根据处理及考察指标的多少分为不同的两向列联表独立性测验又叫次数资料的相依性检验。它是检独立性测验又叫次数资料的相依性检验。它是检验两个方向上的数据资料的表现是相互独立的还是相验两个方向上的数据资料的表现是相互独立的还是相互影响的一种统计分析方法互影响的一种统计分析方法。第三节第三节 独立性检验独立性检验 列联表列联表处理处理处理处理类类类类 别别别别合计合计合计合计1 12 2k k1 1OO1111OO1212OO1K1KR R1 12 2OO2121OO2222OO2K2KR R2 2r rOOr1r1OOr2r2OOrKrKR Rr r合计合计合计合计C C1 1C C2 2C CK KGGk k是变量的类别数,是变量的类别数,是变量的类别数,是变量的类别数,r r是处理的个数是处理的个数是处理的个数是处理的个数 自由度自由度总自由度总自由度(rk-1)减去减去 行自由度行自由度(r-1)减去减去 列自由度列自由度(k-1)df=(rk-1)-(r-1)-(k-1)=(r-1)(k-1)一、一、22列联表的检验列联表的检验【例例例例1 1】某猪场用某猪场用某猪场用某猪场用8080头猪检验某种疫苗是否有预防效果。头猪检验某种疫苗是否有预防效果。头猪检验某种疫苗是否有预防效果。头猪检验某种疫苗是否有预防效果。结果是注射疫苗的结果是注射疫苗的结果是注射疫苗的结果是注射疫苗的4444头中有头中有头中有头中有 12 12 头发病,头发病,头发病,头发病,3232头未发病;未头未发病;未头未发病;未头未发病;未注射的注射的注射的注射的3636头中有头中有头中有头中有2222头发病,头发病,头发病,头发病,1414头未发病,问该疫苗是否有头未发病,问该疫苗是否有头未发病,问该疫苗是否有头未发病,问该疫苗是否有预防效果?预防效果?预防效果?预防效果?1、提出无效假设与备择假设提出无效假设与备择假设H0:发病与否和注射疫苗无关,即二因发病与否和注射疫苗无关,即二因子相互独立。子相互独立。HA:发病与否和注射疫苗有关,即二因发病与否和注射疫苗有关,即二因子彼此相关。子彼此相关。2、计算理论次数计算理论次数根据二因子相互独立的假设,注射疫苗根据二因子相互独立的假设,注射疫苗与否不影响发病率。也就是说注射组与与否不影响发病率。也就是说注射组与未注射组的理论发病率应当相同,均应未注射组的理论发病率应当相同,均应等于总发病率等于总发病率34/80=0.425=42.5%。注射组的理论发病数:注射组的理论发病数:T11=4434/80=18.7 注射组的理论未发病数:注射组的理论未发病数:T12=4446/80=25.3,或或 T12=44-18.7=25.3;未注射组的理论发病数:未注射组的理论发病数:T21=3634/80=15.3,或或 T21=34-18.7=15.3;未注射组的理论未发病数:未注射组的理论未发病数:T22=3646/80=20.7,或或 T22=36-15.3=20.7。从上述各理论次数从上述各理论次数Tij的计算可以看到,的计算可以看到,理论次数的计算利用了行、列总和,总理论次数的计算利用了行、列总和,总总和,总和,4个理论次数仅有一个是独立的。个理论次数仅有一个是独立的。自由度为自由度为1,应选择矫正的统计量。,应选择矫正的统计量。3 3、计算、计算、计算、计算 统计量:统计量:统计量:统计量:4、查自由度、查自由度df=1的的 2临界值,作出统计推断临界值,作出统计推断 因为因为 20.01(1)=6.63,=7.944 20.01(1),P0.01,否定否定H0,接受接受HA,表明发病率与是否注射疫苗极显著相关,这里表明发病率与是否注射疫苗极显著相关,这里表现为注射组发病率极显著低于未注射组,说表现为注射组发病率极显著低于未注射组,说明该疫苗是有预防效果的。明该疫苗是有预防效果的。2*2列联表计算卡方值的简化形式列联表计算卡方值的简化形式(N40):治疗方法治疗方法治疗方法治疗方法发病发病发病发病未发病未发病未发病未发病行总和行总和行总和行总和发病率发病率发病率发病率注射注射注射注射12(a)12(a)(18.7)(18.7)32(b)32(b)(25.3)(25.3)44(T44(TR1R1)27.3%27.3%未注射未注射未注射未注射22(c)22(c)(15.3)(15.3)14(d)14(d)(20.7)(20.7)36(T36(TR2R2)61.1%61.1%列总和列总和列总和列总和34(T34(Tc1c1)46(T46(Tc2c2)80(T)80(T)治疗方法治疗方法治疗方法治疗方法发病发病发病发病未发病未发病未发病未发病行总和行总和行总和行总和发病率发病率发病率发病率注射注射注射注射121232 32 444427.3%27.3%未注射未注射未注射未注射22221414363661.1%61.1%列总和列总和列总和列总和343446468080 例例2:在甲、乙两地区进行水牛体型调查,将牛:在甲、乙两地区进行水牛体型调查,将牛的体型按优、良、中、劣四个等级分类,其结果的体型按优、良、中、劣四个等级分类,其结果见下表,试问两地区间水牛体型有无差异?见下表,试问两地区间水牛体型有无差异?优优优优良良良良中中中中劣劣劣劣总和总和总和总和甲甲甲甲1010(13.3)(13.3)1010(10.0)(10.0)6060(53.3)(53.3)1010(13.4)(13.4)9090乙乙乙乙1010(6.7)(6.7)5 5(5.0)(5.0)2020(26.7)(26.7)1010(6.6)(6.6)4545总和总和总和总和2020151580802020135135地区地区地区地区体型体型体型体型2*c表独立性检验表独立性检验1.提出无效假设与备择假设提出无效假设与备择假设H0:水牛体型构成比与地区无关,即两水牛体型构成比与地区无关,即两地水牛体型构成比相同。地水牛体型构成比相同。HA:水牛体型构成比与地区有关,即两水牛体型构成比与地区有关,即两地水牛体型构成比不同。地水牛体型构成比不同。3.计算计算 2值值2.计算各个理论次数计算各个理论次数 4.查自由度查自由度df=3的的 2临界值,作出统计推断临界值,作出统计推断 因为因为 20.05(3)=7.81 2=7.5820.05,不能否定不能否定H0,可以认为甲、乙两地水牛体型可以认为甲、乙两地水牛体型构成比相同。构成比相同。或或在进行在进行在进行在进行22c c列联表独立性检验时,可利用下述简化公式:列联表独立性检验时,可利用下述简化公式:列联表独立性检验时,可利用下述简化公式:列联表独立性检验时,可利用下述简化公式:利用第利用第2个简化式计算个简化式计算 2值:值:优优优优良良良良中中中中劣劣劣劣总和总和总和总和甲甲甲甲10101010606010109090乙乙乙乙10105 5202010104545总和总和总和总和2020151580802020135135【例例】分别统计了分别统计了A、B 两个品种各两个品种各67头经产母猪头经产母猪的产仔情况,结果见下表,问的产仔情况,结果见下表,问A、B 两品种的产两品种的产仔构成比是否相同?仔构成比是否相同?A A、B B 两个品种产仔数的分类统计两个品种产仔数的分类统计两个品种产仔数的分类统计两个品种产仔数的分类统计 H0:A、B 两个品种产仔数分级构成比相同。两个品种产仔数分级构成比相同。HA:A、B 两个品种产仔数分级构成比不同。两个品种产仔数分级构成比不同。2、计算、计算 2值值 用简化公式计算得:用简化公式计算得:1、提出无效假设与备择假设、提出无效假设与备择假设3、自由度、自由度df=(2-1)(3-1)=2,查临界,查临界 2值,作出值,作出统计推断统计推断 因为因为 20.05(2)=9.21,2 20.01,P0.01,所所以否定以否定H0,接受接受HA。表明表明A、B 两品种产仔数构成比差异极显著。两品种产仔数构成比差异极显著。需要应用需要应用 2检验的再分割法来具体确定分级构检验的再分割法来具体确定分级构成比差异在那样的等级。成比差异在那样的等级。表表715 21计算表计算表 4、2检验的再分割法检验的再分割法(1)先对两个品种产仔数在先对两个品种产仔数在9头以下和头以下和1012头进行头进行 2检验,分割后的情况如下:检验,分割后的情况如下:利用简化公式计算利用简化公式计算 21值为:值为:由由df1=2-1=1,查查 2值表得:值表得:20.05(1)=3.841,因为,因为 210.05,表明这两个品种的产仔数在表明这两个品种的产仔数在9头以下和头以下和1012头头这两个级别内的比率差异不显著。这两个级别内的比率差异不显著。利用简化公式计算利用简化公式计算 22值为:值为:(2 2)对产仔数在)对产仔数在)对产仔数在)对产仔数在1313头以上组与其他合并组(即头以上组与其他合并组(即头以上组与其他合并组(即头以上组与其他合并组(即9 9头头头头以下和以下和以下和以下和10121012头两个组的合并)进行头两个组的合并)进行头两个组的合并)进行头两个组的合并)进行 2 2检验,分割后检验,分割后检验,分割后检验,分割后见下表。见下表。见下表。见下表。由由df2=2-1=1,查查 2值表得:值表得:20.05(1)=3.84,20.01(1)=6.63,21 20.01(1),P0.01,表明这两个品种的产仔数在合并表明这两个品种的产仔数在合并组与组与13头以上组的比率差异极显著。头以上组的比率差异极显著。B品种产仔数在品种产仔数在13 头以上的比率(头以上的比率(29/67=42.38%)极显著高于极显著高于A品种产仔数在品种产仔数在13头以上的比率(头以上的比率(6/67=8.96%)。)。【例例3】对三组奶牛(每组对三组奶牛(每组39头)分别喂给不头)分别喂给不同的饲料,各组发病次数统计如下表,问发病同的饲料,各组发病次数统计如下表,问发病次数的构成比与所喂饲料是否有关?次数的构成比与所喂饲料是否有关?二、二、R*C表独立性检验表独立性检验H0:发病次数的构成比与饲料种类无关,发病次数的构成比与饲料种类无关,即二者相互独立。即二者相互独立。HA:发病次数的构成比与饲料种类有关,发病次数的构成比与饲料种类有关,即二者彼此不独立。即二者彼此不独立。1、提出无效假设与备择假设、提出无效假设与备择假设对于理论次数小于对于理论次数小于5者,将相邻几个组加以合并见下者,将相邻几个组加以合并见下表,合并后的各组的理论次数均大于表,合并后的各组的理论次数均大于5。2、计算理论次数、计算理论次数 利用简化式计算利用简化式计算 2值值3、计算、计算 2值值自由度自由度df=(4-1)(3-1)=6,查临界查临界 2值得:值得:20.05(6)=12.59因为计算所得的因为计算所得的 20.05,不能否不能否定定HO,可以认为奶牛的发病次数的构成比与饲可以认为奶牛的发病次数的构成比与饲料种类相互独立,即用三种不同的饲料饲喂奶牛,料种类相互独立,即用三种不同的饲料饲喂奶牛,各组奶牛发病次数的构成比相同。各组奶牛发病次数的构成比相同。4、查临界、查临界 2值,进行统计推断值,进行统计推断 计算概率的法则独立事件的乘法独立事件的乘法 假定假定P(A)和和P(B)是两个独立事件是两个独立事件A与与B各自出现的概各自出现的概率,则事件率,则事件A与与B同时出现的概率等于两独立事件出现同时出现的概率等于两独立事件出现概率概率P(A)与与P(B)的乘积,即的乘积,即P(AB)=P(A)P(B)事件的独立性:即两事件各自发生的可能性彼事件的独立性:即两事件各自发生的可能性彼此不受对方影响此不受对方影响独立性的假设是事件独立性的假设是事件A与与B 相互独立相互独立,各理论次数各理论次数:
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!