资源描述
第四章 动物试验设计第一节 试验概述第二节 试验设计原理(重复、随机排列、局部控制)第三节 经典试验设计(完全随机、随机单位组、拉丁方等)第四节 正交试验设计*(正交表及其种类、表头设计)本章内容要点提示:试验设计属于科学试验方法论的范畴,学习时要注意将试验误差和前一章作为随机变量介绍的误差联系起来,进一步区分动物科学试验研究和抽样分析的不同点;了解试验研究的程序和试验方案的内容,重点掌握试验误差的控制办法,特别是试验动物个体差异的控制技术;要在充分认识随机单位组设计和拉丁方设计的动物分组、优势及其缺陷的基础上,理解其它各种试验设计与它们的联系和区别;对于正交设计,要熟悉正交表的类与型,熟练正交表的使用方法(因素上列,处理成行)以及由正交拉丁方构造部分正交表的原理。涉及教材内容:第十二章第一四节全部,第五、六、七、八节一部分内容。作业布置:教材第十二章第九、十节P318P324内容自习;教材P325 T2、 T3、 T4、 T9。 第一节 试验概述一、 试验研究的基本知识1、试验研究在科研中的地位。(1) 科学研究的基本过程。科研活动是人类认识世界,能动地改造世界的过程,任何一个领域的科研活动都不可能一下子全部完结,但对一个具体的研究课题而言,都是一个有始有终的过程,这个过程对于自然科学来讲,大体上包括以下四个阶段: 调查研究 试验研究 解释或表达 选题 假说形成 假说验证 科技写作 什么叫“假说”?用已有的事实材料和科学原理为依据,对未知事物的猜测或假定性解释。假说及其形成作为科研活动的阶段之一,标志着科研方法的进步和完善,其价值在于研究工作可以它为基点,把研究方向朝四面八方铺开,尽可能地将它应用于各种具体情况而引伸出许多预期结果,来和客观实际结果作比较,从而提出试验或观察方法,恩格斯在自然辩证法中有过这样一句名言:“只要自然科学还在思维着,它的发展形式就是假说”。哥伦布发现美州大陆就是为验证“地球是球体”这样一个假说而得到的意外发现。狭义相对论的提出,就是迈克尔逊等人为验证,光的传播介质是“以太”这样一个假说而导出了洛仑兹变换,这一变换经爱因斯坦的头脑就成了新的发现线索。所以科研工作就以“假说形成”为时间界限分为前后两个阶段。假说形成前是科研工作的准备阶段,其方法主要调查研究。假说形成后的阶段是试验或观测阶段,这一阶段主要是试验研究,因此,实践检验真理在科研工作中就表现为试验验证假说。(2)什么叫试验研究?在尽可能排除外界影响,突出主要因素,并能细腻地观察到各种现象之间相互关系的条件下,使某种过程重演,以观察未知事实,验证假说。动物试验研究的任务在于以动物作为试验对象,研究、揭示和掌握动物生长发育规律以及这些规律与饲养管理、环境条件的关系。通过试验,鉴定新的动物品系,探索新的饲料配方、饲养管理方法和技术措施,找出其中的规律,并将这些规律应用到生产实践中去,以解决畜牧业、水产业等生产中存在的问题,进一步提高产品的质量和数量,取得更大的经济效益和社会效益。2、试验研究与统计学统计学最主要的应用领域有两个:工农业生产和社会经济领域。动物试验的适当的设计与统计分析,是统计方法在农业中应用的直接形式。由于农业试验周期长,环境因素变异大,如不对试验的设计安排作精心考虑,并使用有力的统计分析方法,则得不出什么有用的结论,所以试验设计及其统计分析的发展,始自农业和生物方面的应用。尤其是试验设计的基本思想和方法,最初都是从农业试验开始发展起来的。如在Australia的一些较大的科研单位和试验站所进行的农业试验研究,大多较为庞杂,且耗时多年、试验设计与数据分析工作做得非常严肃、认真。程序是: 交计划任务 定研究方案 课题主持人 生统局统计专家 工人或试验员 报告分析结果 按时邮寄数据 这样严格的分工使研究人员集中精力从事自己的课题研究:熟悉自己研究范围内的基础知识及其更新和发展情况。统计学家则专门从事生物统计方面的学习和研究,并在各州农业厅设专门机构生物统计局,订有世界各国出版的与生物统计有关的杂志,每年还派人参加世界性的生统会议,也常有外国专家和学者去他们那里讲课或交流经验。我国统计学管理机构尚处于学会团体性质的阶段,如中国现场统计学会,定期开展学术活动,主办刊物数理统计与管理。3、农业试验研究的一般程序选题计划实施总结(1)选定研究课题 当前生产提出的实际问题; 生产进一步发展需要解决的理论和技术问题; 推广国内外先进经验; 科学发展上需要解决的理论问题。要求:第一,要深入生产实际,抓主要矛盾(找瓶颈);第二,要广泛搜集国内外有关资料。 (2)拟订试验计划按统计学原理,设计和确定完成试验任务的方法和步骤。具体包括: 设计试验方案; 确定试验设计种类; 制订管理措施; 拟订观察项目、记载方法及标准。要求:第一,符合试验任务要求的精确度;第二,照顾需要和可能,做到多、快、好、省。(3)实施试验计划也就获取试验数据的过程。 根据方案做好准备工作; 科学布置动物试验; 有始有终地做好管理工作; 完成计划规定的观察记载任务。要求:贯彻单一差异原则,减少误差,杜绝差错。(4)对试验数据进行统计分析,作出科学结论。首先是对所有数据进行整理,发现错误设法更正,无法更正又证明确是错误的观察值应剔除,其次是对所有数据按统计学原理进行分析,找出规律并确定可靠程度,最后作出总结,写出试验研究报告,如果学术价值较高还须进一步撰写学术论文,这就是“科技写作”。二、 试验方案1、试验方案的内容:试验方案指试验中进行比较的一组试验处理的总称。试验方案是全部试验工作的核心,它是围绕研究课题,根据试验的目的和要求制订的,其内容包括试验因素、试验水平、试验指标和试验处理。分别介绍如下:试验因素在控制影响试验结果的其它条件的情况下,人为变动的一个或几个试验条件。如品比试验、饲料试验中的品种、饲料即是。试验指标衡量试验因素效应的指示性状,如比较两个品种优劣的试验,试验指标就可以是日增重或者是其它某种经济性状。试验指标对试验(处理)因素效应的定量表达就是试验数据。试验水平试验因素从质或量的方面分成不同的等级,其中的每一个等级就是一个水平,如品比试验中的每一个品种就是从质的方面来策划分水平的,饲料试验中的饲料就可以是从量的方面来划分水平的。试验处理如试验中仅一个因素,则该因素的每一个水平就是一个试验处理;如果试验中包括两个或两个以上的因素,则试验处理就是这些因素各个水平的组合,简称组合或水平组合。例如有一矿物质元素对架子猪的补饲试验方案 ,A因素为补饲配方,分A1、A2、A3三种,B因素为补饲量,分15g、25g、20g, C因素为食盐量,设0g、4g、8g,则水平组合数为33327个。C1C2C3A1B1A1B1C1A1B1C2A1B1C3B2A1B2C1A1B2C2A1B2C3B3A1B3C1A1B3C2A1B3C3A2B1A2B1C1A2B1C2A2B1C3B2A2B2C1A2B2C2A2B2C3B3A2B3C1A2B3C2A2B3C3A3B1A3B1C1A3B1C2A3B1C3B2A3B2C1A3B2C2A3B2C3B3A3B3C1A3B3C2A3B3C3如重复2次,则共需27254头试验动物,这就是试验规模。2、因素效应及交互作用简单效应(其平均值就是主效应):试验因素的相对独立作用,即因素对性状的数量指标所起的增加减少的作用,简称主效。以一日粮中添加氨基酸对雏鸡增重的试验为例,若添加蛋氨酸使增重由470g增加到480g,则效应就是加(A2)与不加(A1)蛋氨酸这样的不同水平引起的增重差异,为 +10g,这就是简单效应。交互作用(互作效应,简称互作)上例中,假定在添加蛋氨酸的同时,再添加赖氨酸,事先已知加(B2)与不加(B1)赖氨酸时,增重可望由470g增加到472g(即简单效应为 +2g),现这两个措施同时采用后,其结果(A2B2 A1B1)无非是下列三种情况之一:等于12g:即A2B2 A1B1=12,称两个因素无交互作用,称“零互作”。大于12g:即A2B2 A1B112,两个因素有类似正反馈的交互作用,称“正互作”。小于12g:即A2B2 A1B112,两个因素有类似负反馈的交互作用,称“负互作”。3、确定试验方案的要点。抓主要矛盾,力求试验因素简单明确;因素过多时先选一、两个关键性因素进行试验,然后再作比较复杂的试验,这样先简后繁,结论明确;或者先做预备试验,再做能完成多元统计分析的模式试验。同一因素各水平间的差别要拉开档次;从量的方面划个水平时,等比级数比等差级数好(旋转组合设计二者兼顾)每个因素所设水平数要适当;水平数太少了容易漏掉有用的信息,多了增加工作量。方案中要明确中心水平(处理);中心水平即预计结果可能最优的水平,其余水平都是围绕该水平展开设置(如回归设计)。尽量排除非试验因素的限制,使其处于比较良好的状态,有助于因素效应的充分发挥;差异比较法必须建立在单一差异原则的基础上,以保证试验具有严密的可比性,这就要求:第一, 试验因素以外的其它条件相对一致,谨防干扰;第二, 试验处理中应设置作为比较标准的处理,也就是要有对照(CK)。三、动物试验的种类和要求按试验因素的多少,分为三类:1、单因素试验:只研究一个因素效应的试验。优点:设计简单明了,结果很直观;缺点:影响试验指标的因素很多时,结果有片面性。2、复因素试验:研究两个或两个以上因素效应的试验,其特点是说明问题较全面,可以研究各因素的主效应,也可以研究因素间的协同效应(或互作),试验效率比单因素试验高。3、综合试验:研究一定条件下各因素最优(或较优)组合的综合效应,并比较其实用价值的试验。特点是大多属生产试验,如确定规范化饲养模式。动物试验的要求有三个:1、试验条件的代表性(典型性)包括生物学和环境条件两个方面的代表性,前者指试验动物个体必须能够代表该品种,不要选择性状特殊的个体,后者指环境应能代表拟推广该试验结果的地区的自然条件和生产条件,如气候、饲料、饲养管理水平及设备等。既要有先进性,又要有实用性。2、试验数据的可靠性(正确性)包括数据的准确度和精确度两个方面,准确度指观察值Y与其相应真值接近的程度,指标是 / (%),其值越小,准确度越大。但由于一般试验中,真值为未知数,只能根据的样本标准误算得另一个指标,即S / (%),这就是精确度,它反映观察值彼此接近的程度。3、试验结果的重演性(规律性)指在相同或相似条件下,再重复做类似试验时,应该能获得相同或相似的结果。由于动物试验的条件难以人为控制,即使重复同一试验,试验结果也会因为不同的动物个体而有出入,完全相同不可能,但类似是完全应该的。第二节 试验设计原理一、试验误差的分类由于试验因素既有主效应,又有互作效应,因此,同一试验中各试验处理因其所含水平(组合)不同而出现不同的效应值,这种反映各试验处理真实效应的数值叫处理真值。而对于动物试验来讲,试验数据的各观察值由于受到许多非试验因素的干扰和影响,即包含了处理真值,又包含了使之偏离处理真值的试验因素效应,就叫做试验误差,也简称误差。按性质的不同,试验误差分两类。1、系统误差(片面误差)试验因素以外的其它条件明显不一致所产生的误差,其特点是:干扰因素始终朝一个方向影响试验结果,使观察值总是比处理真值偏大(或偏小),直接影响试验结果的准确度 / (%); 可人为控制,即通过合理的试验设计消除掉(如尽量选择个体均匀的试验动物以获得较为一致的初始重量)使之不带进数据内,或者虽带进数据中(窝别效应,如动物试验中来源于不同母畜而产生的不可避免的遗传型差异),但可以和试验因素效应一样能定量分析出来,故又可称之为系统因素效应。以两因素各二水平的RCBD实例展开讲 G G G G 4 (A2B2) 3 2 1 2 (A1B2) 1 4 3 1 (A1B1) 2 3 4 3 (A2B1) 4 1 2 G G G G 可控因素 系统因素 试验因素2、偶然误差(随机误差)在严格控制试验条件相对一致后,仍不能消除的偶发性误差,简称机误,其特点是:干扰因素使观察值大于处理真值或小于处理真值的机会均等,即误差的符号可正可负,其取值是一个服从正态分布的随机变量,即可以定量估计y任一取值范围的概率(如果、已知的话),直接影响的是试验结果的精确度S / (%);不管怎样控制条件,这种误差均为只能减小而不可能彻底消除。一个成功的试验设计一方面要降低偶然误差,另一方面又要消除系统误差(如初始重量),或者使之能够明确、定量地分析出来,转化成单位组效应,所以实际研究中所讲的“试验误差”仅剩下偶然误差(因此,又称其为剩余误差),而把系统误差纳入到可控因素效应中去了。即: 试验误差 系统误差 系统因素效应 转化成单位组效应 (可控因素效应) 偶然误差 “剩余误差” 这样一来,准确度和精确度就成了一回事,对试验误差的研究也就单纯指对偶然误差的概率分布进行研究了,并且和第二章所讲的关于随机变量的误差统一起来。只是对试验误差的概率分布研究不象第二章那样能够在总体参数已知条件下进行,而只能以数据的特征数、S代替、来进行,即相当于以样本(一份或一组试验数据)去推断总体结果,比抽样研究复杂得多。二、试验设计三原则试验设计有广义、狭义之分广义的试验设计是指实施整个试验计划的方法,包括方案的确定,试验地、试验材料的选择,小区排列技术,数据的搜集整理和统计分析方法等等,它针对的是整个研究课题,如本章标题就要广义地理解。狭义的试验设计仅指实施试验方案的方法、即各重复和和试验单位的随机分组方法、针对的只是随机分组技术。如本节的标题就要狭义地理解。1、重复试验中同一处理安排的试验单位数即重复次数。如每一处理只安排1个试验单位(动物),叫一次重复;安排2个试验单位,叫两次重复,依次类推。其作用有二:第一,估计试验误差(抽样误差)试验任一个处理的小区观察值都是一个随机变量的取值,其真值和是未知数(或者说是待研究的),如果只有一个观察值y,不仅无法估计y-的绝对数。就是y-取值范围的概率分布也无法计算,但如果有了重复观多值,虽然抽样误差的绝对数还是无法计算,但取值范围的概率分布却可以计算出来,这是因为值虽然未知,但各处理样本标准差S可以算出,用它代替计算就可以把转化为标准化随机变量t ,从而运用t分布计算任一取值区间的概率。概括地讲,重复是估计抽样误差的必要条件。由于动物试验是以不同处理间的差异比较为基础,用任意两个处理的样本标准差代替总体标准差算得差数的样本标准误,就可以将差数的抽样误差转换为标准化变量t来进行研究与分析。第二、降低试验误差(偶然误差)同名试验单位由于其个体自然条件不同,或者占据不同的外界环境条件,因此,对于各试验单位之间出现的偶然误差就可以通过计算同名单位观察值的平均数相互抵消一部分,且重复次数越多,误差正负相抵的机会也就越多。从数量上讲,因为抽样误差的变异幅度S 与重复次数n的平方根成反比(教材称“抽样误差的大小与重复次数的平方根成反比”容易误导!应改为“标准误的大小与重复次数的平方根成反比”, 因为抽样误差是随机变量, 只能描述其概率分布,而不能用表述常量的方式来对待它!),所以,重复次数n越多,算术平均数的精确度S / (%)越高(数值越小!)。2、随机化重复只是估计试验误差的必要条件,还要加上随机化才够得上充分,因为要使估计的各处理平均数的误差没有偏性的话,试验中的每一个处理都必须有同等的机会被安排在任意一个试验单位内,即随机化是估计抽样误差的充分条件。随机不仅仅是一种要求,更是一种信仰。由于试验的每一个处理均有相同的重复次数,故随机的方法就是在每一个重复所含的试验单位上随机化各试验处理,方法可以抽签,按计算器或使用随机数字表。3、局部控制。单用重复也不是降低试验误差(系统误差)的充分条件,还必须实施局部控制,即分范围控制非试验因素,使之对重复内各试验处理的影响趋于最大限度的一致。即重复只是降低试验误差(转化系统误差)的必要条件,局部控制是降低试验误差(转化系统误差)的充分条件。按已知的系统性差异将试验动物划分成不同的组别叫做单位组,一个单位组安排一个重复,各单位组内再安排各试验处理,也就成了重复区组。由于单位组比试验规模小得多,只是其重复次数n的1/n倍,试验动物个体容易选得较为均匀一致,故同一单位组所有处理间的差异符合单一差异原则,而不同单位组间的差异则可利用统计分析方法从数据中定量分析出来,排除了系统误差对数据的影响,因此大幅度地控制试验动物差异往往靠局部控制。实施局部控制后能影响试验数据的就只有单位组内的偶然误差了,与因增加重复而扩大试验规模(即增加试验动物)可能导致的系统因素效应无关。综合重复、随机排列、局部控制三者的关系,图示如下: 重复 随机排列 局部控制 估计抽样误差 转化系统误差 降低偶然误差 只剩偶然误差 第三节 经典试验设计除拉丁方和正交设计外,各类试验设计均结合方差分析实例一并讲授!一、完全随机设计二、随机单位组设计三、 拉丁方设计1、试验单位分组的随机化方法:将一个重复的所有处理(含CK)从两个方向排列成单位组(也叫区组),各处理在横行区组和直行区组内都必须出现而且仅出现一次,所有处理在横、直行区组内都随机排列,方法是:选择标准方:统计上将第一横行,第一直行(列)的字母都按拉丁字母顺序排列的拉丁方。教材列出44至88共5种阶数的标准方,供选用(n = k);列随机:按顺序编排的列号使用随机数字表进行随机排序;行随机:在列随机的基础上,对整行(横行)进行随机排序;处理随机:将处理编号随机排序后依次代换拉丁字母。 35214 21345541321245341321以n = k = 5所用55拉丁方为例,随机过程及其结果如下:1 2 3 4 5 1 4 5 3 2ABCDE 1ADECB 5 EBADCBAECD2BCDEA 1 ADECB CDAEB3CEBAD 2 BCDEADEBAC4DACBE 4 DACBEECDBA5EBADC 3 CEBAD 1、2、3、4、5 D、A、E、C、B2、特点:把两个方向的试验动物或条件差异转化为两个区组效应,再借助ANOVA从数据中分析出来,这就是双向控制作用。3、优势:可分析出两个方向的系统误差,比随机单位组设计还多一个方向的局部控制,因此 ,试验具有较高的精确度。4、缺陷:缺乏灵活性 ,因为各区组必须按拉丁方规则构造,不能随意调整;缺乏弹性(伸缩性),即处理次数与重复次数必须相等。处理数增加,试验规模不必要的硬性扩大,因此,一般只适宜于处理数为58个的试验方案,少于5个,用单个拉丁方试验嫌误差自由度dfe太小,以44为例;用于4个处理的试验方案,dfe =15333 = 610或12,试验结果有可能因为dfe较小时,需要的F0.05偏大使得处理效应本来应该有的显著性测验不出来。只有采用两个44标准方分别进行随机排列后再随机代换同一组处理编号1、2、3、4(内容相同),之后再进行动物分组,就可以既保留双向控制的优势,又增加了误差自由度,这就是复拉丁方设计,此时: dfe =(322)(82)(82)(41)= 151 2 3 4 2 4 1 3ABCD1BDAC1BDACA=21324BADC2ACBD4DACBB=14132CDBA3DACB3DACBC=43241DCAB4CBDA2ACBDD=324131 2 3 4 1 3 2 4ABCD1ACBD3CADBA=13124BCDA2BDCA1ACBDB=41342CDAB3CADB2BDCAC=34231DABC4DBAC4DBACD=22413四、系统分组设计五、交叉设计第四节 正交试验设计一、正交试验产生的必然性多因素多验随着因素数及其水平数的增加,处理数(水平组合数)呈几何级数的规律增加,例如:水平 因素234567248163264128392781243729218741664256102440961638452512562531251562578125这里所列还只是一个重复的处理数目,采用经典试验设计实施局部控制将遇到空前的困难,因为成百上千乃至成千上万的处理数目,全部付诸实施的话,试验规模实在太大了。唯一可行的办法是从众多的水平组合中挑选一部分组合来进行试验,这就是部分重复试验。被选来做试验(即部分实施)的那一部分水平组合叫不完全组合。第十二章第二节讲到的综合试验的各个处理也只是方案中的一部分组合,但这部分组合是根据以往小区试验得出的预计试验结果较优的组合,其目的是进行示范,即检验小区试验结果大面积推广的可行性。而通常的多因素小区试验主要带科研性质,事先并没有多少附加知识,对各因素的主效应及其互作情况并不了解,所以,不完全组合的挑选就只有借助于正交表来进行。于是,我们将“正交试验”界定为:采用一种由数学领域的组合理论推导而成的正交阵列表来安排的部分重复试验(即挑选不完全组合),并进而对其部分实施的试验结果进行统计分析的一种多因素试验方法。可见,正交试验的产生不是偶然的,它是经典试验设计发展到一定阶段后的必然产物 ,从随机单位组法到拉丁方试验就已经孕育着正交试验的思想,再进一步发展成为正交试验自然是水到渠成的事情。二、正交表1、正交拉丁方将两个同阶拉丁方重叠起来后,如果其中一个拉丁方的每一个字母与另一个拉丁方的各个字母必相遇一次,而且只相遇一次,则称如此重叠起来的两个拉丁方互为正交拉丁方。如果3个或3个以上的同阶拉丁方重叠起来后,任意两个拉丁方均互为正交关系,则称它们为“两两正交”。现已知道,kk阶拉丁方(k6,k3)最多可以有k1个两两正交的拉丁方(公理!),由这样的k1个两两正交的拉丁方重叠起来就构成正交拉丁方完全系(OLSCS)。下面写出33、44、55的OLSCS:k1=2 k1=3 k1= 4A1B2C3A11B22C33D44A111B222C333D444E555B3C1A2B34A43D12C21B345C451D512E123A234C2A3B1C42D31A24B13C524D135E241A352B413D23C14B41A32D253E314A425B531C142E432A543B154C215D3212、正交表的构造和性质用OLSCS可构造出通式为L m2 (m m+1) 的正交表,如由33的OLSCS经过适当变换就可以得到正交表L 32 (m 3+1) 即L9(34),其构造过程如下:ABCD1234B1B2B3B1B2B31A1B1C1D1111111231232A1B2C2D221222A1A1B2C3A1C1D1C2D2C3D33A1B3C3D3313334564564A2B1C2D342123A2B3C1A2A2C2D3C3D1C1D25A2B2C3D1522317897896A2B3C1D262312A3C2A3B1A3C3D2C1D3C2D17A3B1C3D273132A、B、C C1、C2、C38A3B2C1D3832131、2、3 D1、D2、D39A3B3C2D193321L m2 (m m+1) 型正交表L9(34)的构造过程所得正交表记为L9(34),其中L为正交表的代号,源自Latin square的第一个字母,9为正交表的行数,一般用k表示,4为正交表的列数,一般不j表示,3指正交表各列水平数,一般用m表示,所以正交的通式为L k ( mj ),由OLSCS构造的L m2 (m m+1) 只是其中的一部分。类似地,我们可根据m =2、4、5、7、8的各阶OLSCS构造出相应的正交表(见教材附表14P356):L4(23)、L16(45)、L25(56)、L49(78)、L64(89)但没有m=6的相同水平正交表,因为其OLSCS不存在!正交表所具备的两个性质被称为“正交性”:第一, 任意一列各水平出现次数相等;第二, 任意一列的每一水平与其它任何一列的各水平相遇在同一行(水平组合)中的次数相等。按照正交表的这个特点,我们用它挑选的“不完全组合”,可以保证任意两因素的水平对子出现在同一水平组合(处理)中的次数相等,所以,也就叫做正交组合,其包含的处理数目就是挑选组合所用正交表的行数k。三、正交表的种类:1、相同水平的正交表:以上由OLSCS是构造的正交表是L k ( mj ) 型中的一部分。另有一些相同水平的正交表如L8(27)、L16(215)、L27(313)、L64(421) 等,其构造必须用组合数学中的有限域理论来定义水平运算规则后进行,该理论用于构造所有L k ( mj )型正交表只要求m为素数或素数幂,其通式不能写为L m2 (m m+1),而只能以L k ( mj )来表示。2、混合水平的正交表。由相同水平的正交表经过由水平对换取新的水平编号所得, 其通式为L m2 (mj1mj2)等等。以L8(27)L 8 (4124)为例:11、12、21、22 1、2、3、4列号1234567列号123451111111111111121112222212222312211223211224122221142221152121212531212621221216321217221122174122182212112842112四、正交表的表头设计指按试验预期的目的和要求确定各试验因素安排到正交表中的列位,从而决定正交组合内容的过程(属于构造不完全组合),也叫因素上列。以L8(27)的部分表头设计方案为例,用该表安排四因素试验的话,可以有两种典型的表头设计方案,即按A、B、C、D的顺序把它们依次安排到1、2、4、7列或1、2、4、6列,这样得到两种不完全组合的构造方案,内容虽不完全一样,但都是正交组合。只是前者有利于分析A、B、C、D四个因素的主效应(表头中主效应列名没有被混杂),后者有利于分析A因素的主效应和有A因素参与的三个一级互作效应(表头中A、AB、AC、AD效应列名没有被混杂)。因素1 2 345671A2B4C7D1A2B4C6D3ABABCACBC1111111114ABABCACBCD112221122CDBDAD1212312124ABABCACDAD122141221CDBDBC2112521115ABABCACDE212162122DECDCEBDBEAEAD221172212BC222282221这种因表头设计不同,对试验结果进行分析时侧重点不一样的现象是由正交表的结构决定的。因此,有关文献在提供正交表的同时,一般都附有相应的表头设计方案表或者是表头设计说明,供正交试验设计时使用。表头设计的三种情形:完全混杂 如以L8(27)安排5个因素(或者更多)时,每一列都至少有两个以上的列名,这就意味着分析试验结果时按正交表算出的各列效应值SS都是几个效应混杂在一块,“看不清”某一个主效应或一级互作效应究竟有多大。优点是试验效率高,本例部分实施程度为:825=1/4,能用有限的试验规模考察尽可能多的试验因素,从正交组合中优选出虽不一定是最优但却是较优的组合(“矮个子里头选将军”)。不允许混杂 如用L16(215)安排5 因素试验,每一列就只有一个列名,或者是主效应,或者是一级互作效应;意味着分析试验结果时按正交表算出的各列效应值SS都没有被混杂,有利于深入分析各因素间的相互关系,包括各因素的主效应和因素间的一级互作,并很容易找到或者是预测最优的水平组合。缺点是试验效率低,本例部分实施程度仅为16/25=1/2。部分混杂 此为传统的正交试验法所采用的表头设计,前面介绍“表头设计”这一术语时以L8(27)安排四因素的两种上列方法就属于这种情况。其特点是既可有限度的提高试验效率,又可部分地分析各因素的主效应或者是因素间的一级互作,有较大希望获得或者预测最优组合。五、正交设计的实施表头设计只是完成从多因素试验方案中挑选正交组合的任务,方案实施时还要设置重复并进行随机化分组,一般的作法是将正交组合视为单因素的不同处理实施局部控制,即按随机单位组法落实设计方案。如果将正交组合全部纳入实施局部控制的范围有困难的话,可考虑继续用正交表进行混杂或部分混杂设计。如果不愿设重复而倾向于多安排组合做试验的话,则可考虑继续用正交表进行旋转组合设计。第四章内容小结第一,以试验研究在科研中的地位验证假说为出发点,介绍了农业及生物领域试验研究的基本知识;第二,试验数据虽然是处理真值的反映,但因为受自然条件的制约,误差不可避免。而试验误差能不能视为服从常态分布(包括正态分布及t分布等)的随机变量来进行研究,关键在于试验研究方法是否符合试验设计原理;第三,由于试验条件的特殊性,农业及生物类试验研究过程中试验误差必须结合其产生来源实施控制,但从统计角度讲,可归纳为重复、随机化、局部控制;第四,在所介绍的四种经典试验设计类型中,完全随机设计虽只限于温室或试验室应用,但其试验数据可作为最简单的方差分析模型,由此衍生出其它各种试验设计种类的数据整理和ANOVA方法;第五,随机单位组设计是试验设计方法的重大进步,裂区设计也还是随机区组或拉丁方设计的某种“综合”。即由随机单位组法发展到拉丁方设计已经意味着新的突破,因为拉丁方蕴含着正交试验设计的思想;第六,正交设计的高明之处就在于它摆脱了经典试验设计只在试验单位随机分组上做文章的做法,而是把眼光放到试验方案付诸实施之前如何挑选正交组合上,因此,正交试验设计的含义必须从广义的试验设计角度去理解;第七,正交设计的最大优势是能够在对众多的因素效应没有任何附加知识的情况下提供一个筛选较优水平组合并搜索最优组合的捷径,所以正交试验曾一度被普及成为“优选法”。对探索性试验来讲,往往能获得事半功倍的效果;第八,正交设计使用正交表的决窍就在表头设计上,因素上列的方法不同,不光是所得正交组合内容不同,还会牵涉到数据分析时哪些效应能明确考察,哪些效应不明确(即被混杂);第九,决不是只有正交试验才使用正交表,正交表在经典试验统计中的功用和旋转组合设计中使用正交表一样,同样值得重视。
展开阅读全文