第7章方差分析1

上传人:无*** 文档编号:171789418 上传时间:2022-11-28 格式:PPT 页数:87 大小:902KB
返回 下载 相关 举报
第7章方差分析1_第1页
第1页 / 共87页
第7章方差分析1_第2页
第2页 / 共87页
第7章方差分析1_第3页
第3页 / 共87页
点击查看更多>>
资源描述
第 七 章方 差 分 析 1.采用 检验法检验过程烦琐。2.采用 检验法无统一的试验误差,误差估计的精确性和检验的灵敏性低。3.采用 检验法推断的可靠性低,检验的 I 型错误率大。如6次检验0的概率是0.95时的误差为:1-0.956=0.265。先介绍几个常用术语:n在科学研究中进行多个平均数间的差异显著性检验,即方差分析。n方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。第一节 方差分析的基本原理一、数学模型n假设有 组观测数据,每组有 个观测值,则用线性可加模型来描述每一个观测值,有:是在第 次处理下的第 j 次观测值,为总体平均数,为处理效应,是试验误差,要求是相互独立的,且服从正态分布N(0,2)。ijiijx对于样本估计的线性模型为:n 为总体平均数,为样本处理效应,是试验误差。n根据对 的不同假定,将数学模型分为固定模型(各个处理的效应值是固定的)和随机模型(各个处理的效应值 不是固定的)。ijiijetxxx二、平方和与自由度的分解n将总变异分解为处理间变异和处理内变异。但这种分解是通过将总均方的分子称为总离均差平方和,简称为总平方和,分解成处理间平方和与处理内平方和两部分;将总均方的分母称为总自由度,分解成处理间自由度与处理内自由度两部分来实现的。(一)总平方和的分解n设某单因素试验A具有n个处理样本,每个样本有n个观测值,则试验A共有nk个观测值。这类试验资料的模式如下表所示。n处理间平均数的差异由处理效应所致;同一处理内的变异则由随机误差引起,根据线性可加数学模型,则有:处理每组具有n个观测值的k组样本符号表每一处理n个观测值离均差平方和累加,有:2222)()(2)()()()()()()(xxxxxxxxxxxxxxxxxxxxiiiiiiininiinnxxxxxxxxxx1211212)()(2)()(0)(21niixxxx上式可简写成:分别表示总平方和,处理间平方和,处理内平方和。即:总平方和=处理间平方和+处理内平方和,实际计算时及可用下式推导:ninnxxxxxx121212)()()(knkiknxxxxnxx11212112)()()(把 个处理的离均差平方和累加,得:令矫正数C=T2/kn,则:knTxknxxxxSSkinjT2222112)()(CxSST2kiikitxxxxnxxnSS12212)2()(kkiixnkxxnxn12122kikixnkxnxnkxnkxn12212222CTnnknkTnTniki2222121)(即tTeitSSSSSSCTnSS21(二)自由度的分解 在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的总个数减1,即。处理间自由度为处理数减1,即。处理内自由度为资料中观测值的总个数减k,即()。kinjijxx110.)(因为 所以 综合以上各式得:)1()1()()1(1nkkknkknketTdfdfdftTetTdfdfdfkdfkndf11各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 MST(或 )、MSt(或 )和MSe(或 )。即 *总均方一般不等于处理间均方加处理内均方。2TS2tS2eSTTTTdfSSSMS/2ttttdfSSSMS/2eeeedfSSSMS/2【例】某猪场对4个不同品种幼猪进行4个月增重测定,每个品种选择体重接近的幼猪4头,测定结果列如下表,试进行方差分析。4个不同品种猪4个月的增重量(kg)重 复品种大白沈白沈黑沈花123431.924.031.835.924.825.726.825.922.223.026.724.327.030.829.024.6总和T123.6103.296.2111.4T=434.4平均数30.925.824.127.9=27.2本例中,品种=4,重复=4,观测数据总数=44=16。(1)平方和计算:3.21396.1179326.120076.240.249.3196.11793164.434222222CCxSSnkTCT94.10396.1179390.11897)4.1112.1036.123(4112222CCTnSSit36.10994.10330.213tTeSSSSSS(2)自由度的计算:(3)方差的计算:在方差分析中不涉及总均方的数值,所以不必计算之。151441 nkdfT3141 kdft12315tTedfdfdf113.912/36.109/647.343/94.103/eeetttdfSSMSdfSSMS三、统计假设的显著性检验F检验 F=2/2将大方差做分子,使F值大于1,做单尾检验。进行不同处理差异显著性的F检验时,一般把处理间方差2为分子,称大样方;误差方差2为分母,称小样方;求其比值。统计学上把两个均方之比值称为F值。即:F=2/2具有两个自由度:()若在给定的 和 的条件下,继续从该总体进行一系列抽样,则可获得一系列的 值。这些 值所具有的概率分布称为 分布。分布密度曲线是随自由度、的变化而变化的一簇偏态曲线。不同自由度和分布的特征:1、构造检验的统计量(分布与拒绝域)分布的取值范围是(0,+),其平均值 =1。用()表示 分布的概率密度函数,则其分布函数()为:因而F分布右尾从到+的概率为:FdFFfFFPFF)()()(FdFFfFFFFP)()(1)(表列出的是不同 和 下,()=0.05 和(F)=0.01时的 值,即右尾概率=0.05和=0.01时的临界 值,一般记作(),()。F检验若实际计算的 值大于 ,则 F 值在=0.05的水平上显著,我们以95%的可靠性推断 代表的总体方差大于 代表的总体方差。这种用 值出现概率的大小推断两个总体方差是否相等的方法称为检验。无效假设把各个处理的变量假设来自同一总体,即0:2=2,对A:22。),(05.021dfdfF2tS2eS检验时,是将由试验资料所算得的值与根据和查表所得的临界 值 相比较作出统计推断的。若 ,即P0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在 值的右上方标记“ns”,或不标记符号;),(01.0),(05.02121,dfdfdfdfFF),(05.021dfdfFF若 ,即0.01P0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在 值的右上方标记“*”;若 ,即P0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在 值的右上方标记“*”。),(01.0),(05.02121dfdfdfdfFFF),(01.021dfdfFF 两个总体方差比的 检验(临界值)无效假设是否成立,决定了计算的F值在F分布中出现的概率。上例中,F=2/2=34.647/9.113=3.802*根据=3,=12 查 表,得F0.01(3,12)=5.95 和 F0.05(3,12)=3.49;因为FF0.05(3,12)=3.49,P0.05。所以否定0:2=2,接受A:22。表明品种猪的增重差异是显著的。将方差分析结果列成方差分析表。不同品种猪4个月增重的方差分析表变异来源品种间品种内312103.94109.3634.6479.1133.802*3.49 5.95总变异15 213.30四、多重比较值显著或极显著,否定了无效假设,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较。多重比较的方法甚多,常用的有最小显著差数法(LSD法,least significant difference)和最小显著极差法(LSR法,Least significant ranges),现分别介绍如下。(一)最小显著差数法(LSD法)n实质是两个平均数相比较的 检验。基本作法是:在 F 检验显著的 前提下,先计算出显著水平为的最小显著差数 ,然后将任意两个处理平均数的差数的绝对值 与其比较。若 ,即为在给定的水平上差异显著,反之差异不显著。LSD.jixxLSDxxji.显著性水平和拒绝域(双侧检验)/2 显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)由 得:式中:为在 检验中误差自由度下,显著水平为的临界 值,为 均数差异标准误,由下式算得:.jixxjisxxt.)(jiexxdfaaStLSD)(edft.jixxS21222122.nnnsnsnsSeeexxji.jixxjistxx其中 为 F 检验中的误差均方,n 为各处理的重复数。当显著水平=0.05 和 0.01时,从 t 值表中查出 和 ,代入式得:2eS)(05.0edft)(01.0edft.)(01.001.0)(05.005.0jiejiexxdfxxdfStLSDStLSDLSD法的步骤:(1)列出平均数的多重比较表,各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数 和 ;(3)将平均数多重比较表中两两平均数的差数与 、比较,作出统计推断。05.0LSD01.0LSD05.0LSD01.0LSD上例中,各处理的多重比较。因为 查 t 值表,当误差自由度=12 时 0.05()=0.05(12)=2.179 0.01()=.01(12)=3.056故显著水平为 0.05 与 0.01 的最小显著差数为1346.24/113.92/22.nSSexxji)(5233.61346.2056.3)(6513.41346.2179.2.)(01.001.0)(05.005.0kgStLSDkgStLSDjiejiexxdfxxdf多重比较结果常用标记字母法表示:首先将平均数从大到小依次排列。然后在最大平均数上标 a,将该平均数与下面的平均数比较,凡相差不显著()标 a,直至某个与之相差显著的则标 b。再以该标有 b 的平均数为标准,与各个比他大的平均数比较,凡相差不显著的在 a 右标 b,再以标 b 的最大平均数为标准与下面未标记的平均数比较不显著标 b,显著标 c。再与上面比较,如此反复。这样各平均数间凡有一个相同标记字母差异不显著,凡具不同标记字母差异显著。差异极显著标记法同上,但用大写字母。如对本例:品种平均数差异显著性=0.05=0.01大白沈花沈白沈黑30.927.925.824.1a ab b bA AB AB B多重比较的梯形比较法结果表明大白与沈黑差异极显著,大白与沈白差异显著。其他品种间差异不显著。品种平均数差异显著性-24.1-25.8-27.9大白沈花沈白沈黑30.927.925.824.1 6.8*3.81.7 5.1*2.13.0对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯 I 型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。(二)最小显著极差法 (LSR法)nLSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平上依秩次距 的不同而采用的不同的检验尺度叫做最小显著极差LSR。n常用的LSR法有新复极差法和q检验法两种。1.新复极差法(SSR法)SSR法(shortest significant ranges),又称Duncan法(邓肯法)。新复极差法是计算最小显著极差时需查SSR表。最小显著极差计算公式为:无效假设为:0:A-B=0 xMdfaMaSSSRLSRe),(,SSR法检验步骤:(1)按相比较的样本容量计算平均数标准差:当时,有:(2)查所具有的自由度和比较所含平均数个数M时的SSR值(附表8),然后计算最小显著极差值为:(3)将各平均数按大小顺序排列,用各个M值值即可检验各平均数间极差的显著性。nSSex2xMdfMsSSRLSRe),(,对本例各平均数作新复极差检验:查附表8,当=12,=2时,SSR0.05=3.08,SSR0.01=4.32,故:当=3,=4时按同理计算,将结果列于下表:5094.12nSSex52.632.45094.165.408.35094.1),(01.0,01.0),(05.0,05.0 xMdfMxMdfMSSSRLSRSSSRLSRee不同品种4个月增重试验与值(新复极差法)M234SSR0.05SSR0.01LSR0.05LSR0.013.084.324.656.523.224.504.886.793.314.625.006.97将上表中的平均数差数(极差)与表最小显著极差比较,检验平均数间差异显著性。如大白与沈黑,M=4,极差=6.85.00,差异显著;大白与沈花,M=2,极差=3.04.65,差异不显著。同理比较其他品种间平均数间差异显著性,见下表。猪的品种4个月增重差异显著性比较(新复极差法)结论:猪的4个品种中只有大白与沈黑,大白与沈白4个月增重差异达到显著。品种平均数差异显著性=0.05=0.01大白沈花沈白沈黑30.927.925.824.1a ab b bAAAA2.检验法(q test)n是以统计量 的概率分布为基础的(查附表9)。值由下式求得:n式中,为极差,分布依赖于误差自由度 及平均数个数。n利用 q 检验法进行多重比较时,将极差与 比较,作出统计推断。即为水平上的最小显著极差。),(MdfxeqSxxSLSRSq/)(/),(,MdfxMeqSLSR对本例作:查附表9,当=12,=2时,0.05=3.08,0.01=4.32,同理可查=3,=4时 值,根据公式计算最小显著极差(将结果列于下表):5094.12nSSex52.632.45094.165.408.35094.1),(01.0,01.0),(05.0,05.0 xMdfMxMdfMSqLSRSqLSRee不同品种4个月增重的LSR值(q检验)M234q0.05q0.01LSR0.05LSR0.013.084.324.656.523.775.045.697.614.205.506.348.30猪品种间4个月增重差异显著性比较表(q检验)n结论:只有大白与沈黑4个月增重差异达到显著。其他品种间比较差异均不显著。品种平均数差异显著性=0.05=0.01大白沈花沈白沈黑30.927.925.824.1a ab ab bAAAA以上3种多重比较方法,其检验尺度有如下关系:法新复极差法q检验法当平均数个数M=2时,取等号;平均数个数M 3时,取小于号。精度要求高的试验用q检验法,一般试验用法检验,试验中各个处理平均数皆与对照相比的可用法检验。综上所述,方差分析的基本步骤:(1)将样本数据的总平方和与自由度分解为各变异因素的平方和和自由度;(2)列方差分析表进行 检验;以弄清各变异因素的平方和和自由度;(3)对各处理平均数进行多重比较。第二节 单因素方差分析在试验中所考虑的因素只有一个时,称为单因素试验。根据组内观测次数是否相等,单因素试验资料的方差分析又分为组内观测次数相等和组内观测次数不等两种情况。本节各举一例予以说明。一、组内观测次数相等的方差分析n这是 组处理中,每一个处理都含有个观测值。方差分析计算公式:变异来源处理间处理内总变异例:测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每地随机抽取4个样本,测定的结果如下表,试比较各地区黄鼬针毛长度差异显著性。地区东北内蒙古河北安徽贵州合计123432.032.831.230.429.227.426.326.725.526.125.826.723.325.125.125.522.322.522.923.7126.4109.6104.199.091.4530.5444442031.6027.4026.0324.7522.8526.533997.443007.992709.982453.162089.6414258.21(1)=5,=4.进行51.14071)45/(5.530/22knTC71.17351.14071)4.916.1094.126(4117.18651.1407121.14258222222CTnSSCxCxSSitijT99.1271.1737.186tTeSSSSSS15419,4151,191451tTetTdfdfdfkdfkndf(3)计算方差:(4)进行F检验43.43471.1732tttdfSSS866.01599.122eeedfSSS15.50866.043.4322etssF查 值表得:0.05(4,15)=3.06,F0.01(4,15)=4.89,故FF0.01,P0.01,表明5个地区黄鼬冬季针毛长度差异非常显著。将上述结果记入方差分析表:变异来源地区间地区内 415173.71 12.9943.43 0.8750.15*3.064.98总变异19 186.70(3)多重比较。采用最小显著差数法进行检验:查附表3,当=15时,0.05=2.131,0.01=2.947,于是有:0.05=2.1310.658=1.4020.01=2.9470.658=1.939各组内观测次数相等,组内方差均为0.866,均用0.05及0.01比较,组间差数 0.01极显著,0.05显著。658.04/866.02/2221nSSexx结果表明,东北与其他地区,内蒙古与安徽、贵州,河北与贵州黄鼬冬季针毛长度差异极显著,安徽与贵州差异显著,而内蒙古与河北、河北与安徽差异不显著。地区平均数差异显著性=0.05=0.01东北内蒙古河北安徽贵州31.6027.4026.0324.7522.85a b bc c dA B BC CD D二、组内观测次数不相等的方差分析设处理数为k;观测次数为的单因素分组资料,上述方差分析方法仍然可用,但观测总数为。变异来源处理间处理内总变异计算平均数的标准误时,首先计算各的平均数 :然后有:iiiiiinnnkknnnn222011)1)()(02nssex02221nssexx例:用某种小麦种子进行切胚乳试验试验分为3种处理:整粒小麦、切去一半胚乳、切去全部胚乳,同时播种到条件较一致的花盆中,出苗后每盆选留2株,成熟后进行单株考种,每粒重结果如下表,试进行方差分析。处理株号合计 平均数21202429252224252822232525292130312627242626 20 2120424414625.524.424.3方差分析步骤:(1)平方和计算:5.1470124/)146244204(/22NxCij7.2238.65.2308.66146102448204/5.23026292122222tTeiitijTSSSSSSCnxSSCCxSS212232131231241tTetiTdfdfdfkdfndf(2)列方差分析表变异来源处理间处理内221 6.8233.7 3.410.70.318总变异23230.5从上表结果可知,F1,三种处理的每株粒重无显著差异。不需要进行多重比较。如果F检验差异显著,需要进一步计算0,并求得平均数标准误(用于LSR检验)或平均差数标准误(用于LSD检验)。要尽量避免不等观测次数的试验,精度低,计算麻烦。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!