资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,|x,1,x,2,|,s,本公式:适用于哪种类型的资料?哪种研究设计?哪种分布形式?哪些使用条件?,t=,x,1,x,2,成组设计资料不是来自正态分布总体,或经 F 检验方差不齐时,其检验可选择下列三种方法:,1.采用适当的变量变换,使其转成为正态分布的情况下,又达到方差齐性,再用 t 检验;,2.采用 t 检验;,3.采用非参数统计方法。,v=n,1,n,2,2,|x1 x2,1,第十五章 非参数统计,统计分析方法大致分为两大类,一类是,参数统计方法,(parametric statistics),另一类是,非参数统计方法,(non-parametric statistics)。,第一节 概 述,1、前面所讲的内容除部分,2,检验的内容外,基本上是,参数的统计方法,,它们都是,以样本来自某种总体分布为已知前提,,然后选择相应的统计分析方法或公式,以计算各种统计量为基础,,对未知总体参数予以估计或检验。,第十五章 非参数统计,2,2、若不知道样本来自的总体类型或已知的总体不符合估计或检验的条件,此时可用,非参数统计方法。,非参数统计方法是一种,与总体分布状态无关,的统计检验方法,它,比较的不是参数,而是比较分布的位置,,故有与“参数无关”(parameter free)、或者“与分布无关”(distribution free)方法之称。在这种方法中,资料的数据常常被用“符号”(sign)或“等级”(rank)来代替或转换进行分析。,2、若不知道样本来自的总体类型或已知的总体不,3,3、非参数统计方法的主要,优缺点,不受总体分布类性的限制,,应用范围广泛,,基本上,每一种参数统计方法都有相应非参数统计方法对应;对数据的要求不象参数统计方法那样严格。,其不足之处是对符合用参数统计的资料,用非参数统计方法时,,犯第二类错误的概率比参数统计方法要大,,亦即(1)要小。若要使其相同,非参数的方法比参数的方法所需要得样本含量更多。,故适合参数统计条件的资料,通常首选参数统计,,若应用条件不能满足,才用非参数统计的方法。,3、非参数统计方法的主要优缺点,4,第二节 两独立样本检验(成组设计),两独立样本检验即,成组设计的两样本资料的比较,。,一、,等级和检验,(rank test,Wilcoxon,Mann and Whitney 法),目的:检验两总体分布的位置相同。,检验的基本步骤:(例 15.1 p 202),1.将两比较组的,数据混合,,并由小到大排列,统一编秩(等级),,遇相同等级时取平均等级。,2.以,较小样本,的等级之和,作为 T,。,3.计算 T,T,=n,1,(n,1,+n,2,+1)T,4.以,T 和 T,中较小者与附录 C 附表11中相,第二节 两独立样本检验,5,应数值比较,,如果小于表中 p=0.05时的 T 数值,则差别有统计学意义。,附录 C 附表 11 的统计学意义,本例,n,1,=7,按公式n,1,(n,1,+n,2,+1)/2计算,理论等级和是126/2,而n,1,的实际等级和为93.5,其差值T,为32.5,,,离理论值63.0相差愈远,如此,p 值就愈小;假如两者之差较大,表明 n,1,的等级总和小(或大),离中点较近,则 p 值也就较大。,63.0,126,93.5,32.5,42,37,42,37,应数值比较,如果小于表中 p=0.05时的 T 数值,则,6,二、中位数检验(median test),其方法和步骤是先,混合数据计算中位数 M,d,,如两组分布位置相同,则其两组分别在中位数的两侧各有一半的观察例数,,故可对中位数的上下两侧例数的差异在两组间是否有统计学意义进行检验。,1.两样本,混合由小到大排列,求其中位数 M,d,。,2.列中位数检验用表。,分别计数两样本中超过 M,d,的观察例数,,记为 m,1,和 m,2,。将 m,1,、,二、中位数检验(median test),7,m,2,以及两样本含量 n,1,、n,2,列入表中。(表15.3和表15.4 p 203 204),3.,如果两样本含量均超过10,则用四格表,2,检验法,否则用四格表精确概率检验。,本例 M,d,=17,(g/100g),。,列中位数检验表如下:,中 位 数 检 验 表,非铅作业组 铅作业组 合计,M,d,例数(m,)2 6 8,M,d,例数(n,m,)8 1 9,合 计 10 7 17,由于两样本含量均小于10,故宜用四格表精确概率法。,m2 以及两样本含量 n1、n2 列入表中。(表15.3和表,8,E,RC,=n,R,n,C,/N=8 10/17=4.706,|O,|=|2 4.706|=2.706,经周边合计不变的四个基本数据的组合中大于2.706的有:,8 0 2 6 1 7,2 7 8 1 9 0,P,1,=,8!9!10!7!/8!0!2!7!17!=0.001851,p,7,=,8!9!10!7!/2!6!8!1!17!=0.012957,p,8,=,8!9!10!7!/1!7!9!0!17!=0.000411,P =p,1,+p,7,+p,8,=0.015219,(1),(7),(8),E RC=n R n C/N=8,9,本例,P=0.015219 0.05,故差别有统计学意义,认为铅作业工人的血铅值高于非铅作业工人。结论同上述等级和检验法及 t 检验法。,若超过附表11的最大例数值,则用正态检验。,第三节 K 个独立样本检验(完全随机设计),K 个独立样本检验即是,完全随即设计的多组样本的比较,。前面讲述的检验方法有单向(因素)方差分析,包括,总的比较,和,多重比较,。,一、,总的比较,1.,H 检验,(Kruskal and Wallis 法),本方法的,前提是假定K个样本的抽样总体是连续性的并且是相同的,,检验的目的是判断,K,个总体的分布位置是否相同。,本例,P=0.015219 0.05,,10,【例 15.2】表15.6 (p 206),检验步骤如下:,H,0,:各组分布相同。,H,1,:各组分布至少两组不同。0.05,(1)将个组数据混合后由小到大排列统一编秩次(等级),若有相同数据则取平均秩次(等级)。,(2)计算各组等级之和 T,i,(3)计算各组的平均等级(平方)和(T,/n,i,)与总的平均等级(平方)和(T,/n,i,)。,(4)计算各组中的每个等级平方和T 与总的等级平方和T 。,(5)按下式计算 S,2,值,资料中无相同数据时 S,2,=N(N+1)/12,2,i,2,i,2,i,2,i,【例 15.2】表15.6 (p 20,11,资料中有相同数据时,1 (N+1),2,n1 4,(6)计算 H 值,资料中无相同数据时,12,N(N+1),资料中有相同数据,1 T N(N+1),2,S,2,n,i,4,T ,2,ij,S,2,=,2,i,(T /n,i,)3(N+1),H =,H=+,2,i,资料中有相同数据时 T ,12,(7)确定 p 值,判断结果,如果处理组数 k3,n5,则可查附录 C 附表13作出判断。如果超出附表13的范围,根据在 n 不太小时 H 近似服从于 v=k 1的,2,分布,可查,2,界值得表作出判断。,2.中位数检验法,(1)将各组数据混合由小到大排列。,(2)求出混合数据的中位数 M,d,。,(3)列表分别计数出各组中 M,d,的观察值个数(m,i,)或 M,d,的观察值个数(n,m,)。,(4)按公式,2,=(OE),/E 或=N(O,2,/n,R,n,C,)1,计算,2,值,v=k1。,(7)确定 p 值,判断结果,13,例 15.2 中 位 数 检 验 表(2k表),组 别,1 2 3,M,d,(m,i,)1 4 10,M,d,(n,m,)9 6 0,(E=5,可用上述,2,检验公式),应用上述,2,检验公式,n 应足够的大,一般需在 10 以上,否则理论数会过小。,本例结果,v=(31)=2,2,=16.8,p0.01,差别有统计学意义,认为各组间血浆总皮质醇测定值不同。,2,0.01,2,例 15.2 中 位 数 检,14,二、多重比较(multiple comparison),首先计算各组平均等级之差:,d,ij,=|(T,I,/n,i,)(T,j,/n,j,)|,再计算差异的临界值 d,0.05,:,N1H 1 1,Nk n,i,n,j,如 d,ij,d,0.05,,则第 i 组与第 j 组之间的差异有统计学意义。,见例15.2 表15.8 (p 209),或者,d,ij,a b,d,0.05,=t,0.05,v,S,2,+,(a),(b),t,再根据vN k 查,t 界值表确定 p 值。,二、多重比较(multiple comp,15,第四节 两个相关样本检验(配对设计),即,配对设计的两样本资料的检验,。常用方法为符号检验和符号等级检验(Wilcoxon法),一、,符号检验,(sign test),【例 15.3】表 15.9 (p 210),将本例冷、热消化法前后两组数据差值的符号(+、)计入表中,差值为 0 者不计,也不计入比较的总例数中。,本例两组尿铅含量正号 5 例和负号 10 例共 15 例,按无差别的无效假设,应正、负号各半,即理论值 E 15/2 7.5 例。,第四节 两个相关样本检验(配对设计,16,应用,2,=(OE0.5),2,/E 或,2,=(|bc|1),2,/(bc)(+为b,为c),然后用 v=1的,2,界值比较,确定 p 值,判断结果。,【例 15.4】表15.10 (p 211),比较饲料中缺乏vit E 与肝脏中vit A含量的关系。发现正常饲料组鼠肝中vit A高于vit E缺乏的大鼠有 7 例,相反者1 例,代入公式得:,2,=(|71|1),/(7+1)3.125 3.84,其差别无统计学意义。用参数法 t=4.2,p0.01,差别有显著性。两者的不同是因为符号检验法没有利用原资料中变量信息(差数的大小),应用 2=(OE0.5)2,17,而且样本量较少,故即使有差别也难以比较出来。,如果差别是客观存在的,增大样本含量则可发现其差别。一般来说,资料含量 6 对以下是难以检出差别的;7 12 对时也不敏感;20对以上时较易检出存在的差别。与 t 检验法相比,符号检验法只有其65的检验效率。可见,资料符合参数法则尽可能用参数法。,另外,也可用下述改进方法。,二、符号等级检验(Wilcoxon 法),在配对资料的检验中,由于利用了同一对子中的两个数据间差值大小的信息,故检验效果比符号检验法好,。,计算步骤如下:,(1)将每对的差数按其绝对值的大小排列,,而且样本量较少,故即使有差别也难以比较出来。如果差别是客观存,18,并标明等级及原差数的正、符号。,(2)分别计算正号等级的总和、负号等级的总和,以两者较小者为 T。,(3)以 T 值与附录 C 附表 10 进行比较,以判断差别的统计学意义。,本例T=1,与附表10中 v=8,T,0.02,=2 比较,T T,0.02,p0.02,则其差别有统计学意义,说明正常饲料的鼠肝中vit A 含量高。可见本法较为敏感。,若对子数 n25,则用下列公式:,z=|T,T,|/,T,(z1.96,则 p0.05),式中,,T,=n(n+1)/4,n(n+1/2)(n+1),12,T,=,并标明等级及原差数的正、符号。T=,19,当差数相等,则取其平均等级。假如两差数相等的等级分别为 10 和11,则其平均等级为:,(10+11)/2=10.5,本法与符号检验法比较,其敏感性较强。,第五节 K个相关样本检验,一、K个相关样本的总的比较(区组设计),即,随机区组设计的K个样本资料之间的总的比较,。常用方法有M检验、F检验和中位数检验。,1.M 检验(Friedmen test)查表法,【例 15.5】表 15.12 (p 213),检验 6 名产妇
展开阅读全文