方差分析与正交设计C6

上传人:无*** 文档编号:111070379 上传时间:2022-06-20 格式:DOC 页数:68 大小:6.65MB
返回 下载 相关 举报
方差分析与正交设计C6_第1页
第1页 / 共68页
方差分析与正交设计C6_第2页
第2页 / 共68页
方差分析与正交设计C6_第3页
第3页 / 共68页
点击查看更多>>
资源描述
第五章 方差分析与正交设计1单因素方差分析在实际问题中,人们常常需要在不同的条件或不同的状态下,对所研究的对象进行比照试验,从而得到假设干组数据样本。方差分析就是一种分析、处理多组试验数据均值间差异显著性的统计分析方法。其主要任务是通过对数据的分析处理,搞清各试验条件以及它们所处的状态对试验结果又称试验指标的影响,以便有效地指导实践,提高经济效益或科研水平。1.1 根本概念例1 某灯泡厂用四种不同材料的灯丝生产了四批灯泡,除灯丝材料不同外,其他生产条件完全相同。今由每批灯泡中随机地抽取假设干个灯泡,测得使用寿命单位:h数据如表1所示,现在要求推断出灯泡使用寿命是否因灯丝材料不同而有显著差异。表1灯泡寿命灯丝12345678A1A2A3A416001500164015101610164015501520165014001600153016801700162015701700175016401640170016001680178017401800如果在一项试验中,只有一个因素变化,其他因素保持不变,我们称这种试验为单因素试验。因素所处的状态称为水平。本例考虑的是一个因素即灯丝,这个因素具有四个水平,即四个不同材料的灯丝,A1, A2, A3, A4。从表中的数据看到,即使对于同一种材料的灯丝,虽然生产条件都一样,但灯泡的使用寿命还是可以不相等的,这说明灯泡的使用寿命是一随机变量。现在用,表示四种材料的灯丝所生产的灯泡的使用寿命,这样就有四个总体。假设从这四个总体中分别随机地抽取容量为的样本,,, 1,2,3,4,我们应用这四个样本来推断四个总体之间有无显著差异。要判断不同灯丝材料的灯泡对使用寿命的影响问题,就是要区分使用寿命之间的差异是主要由抽样误差造成的还是由灯丝材料不同造成的。这一问题可以归结为判断四个总体是否具有相同的分布。另外,在方差分析中,总是假定各总体相互独立,且都服从正态分布。由于除因素外,试验的其他条件都认为相同,这样就可以假设每个总体的方差相同。因此推断四个总体是否具有相同分布的问题,就归结为检验四个具有相同方差的正态总体,其均值是否相等的问题。实际上,方差分析就是检验假设干个具有相同方差相互独立的正态总体,它们的均值是否相等的一种统计分析方法。前几章中我们曾介绍了检验两个正态总体均值间差异显著性的检验法。现在对多个正态总体,我们能否仍用检验法两两进行检验呢?结论是否认的。设想有十组数据,客观上它们来自同一正态总体,因而有相同的均值。在这种情况下,任取两组数据采用检验法检验其均值是否相等。设=0.05,那么接受假设认为两组均值相等的概率为1=0.95。但从十组数据中任取两组,共有=45种不同的取法,所以接受的概率为(0.95)450.099。客观上十组数据均值相等,而采用检验法两两检验时,犯第一类错误认为至少有两组均值不等的概率为0.901。由此可见,当组数增多时,采用检验法两两检验时,犯第一类错误的概率将大大增加,使我们判断的结果很不可靠。波兰数学家R.A.Fisher(1923)提出的方差分析法,可同时判断多组数据均值间差异的显著性。下面给出单因数方差分析的一般概念。设有个相互独立的正态总体, 1,2, ,。设,,是从第个总体中抽取的容量为的简单随机样本。由于1,2, ;1,2, ,与的差可以看成是一个随机误差。因此满足=+, 1而,且互相独立,其中1,2, ;1,2, 。要求检验假设= =。1.2 统计分析下面构造检验假设= =用的统计量。记, =。 2这是第个总体的样本均值,也叫做组平均值。称= 3为总平均值。是从个总体抽得的样本的总容量。由2,3两式可得=0。 由此得到=+。 4其中=,=。是所有观察资料与总平均值的差的平方和,称为总偏差平方和。它是描述所得全部数据离散程度的一个指标。由上式知,总偏差平方和可以分解为、两项之和。我们再来看、的意义。记 5是各均值的平均,叫做均值的总平均。令=,1,2, 。它是各总体的均值与理论总均值的差异。称为因素的第个水平的效应。易知个效应满足关系式=0。当假设= =成立时,由5式可得= =,从而=01,2, 。故假设也可写为= =0。式1用水平的效应表示,可以写成=+=+1,2, ;1,2, 此时=+=+。其中=是第个总体样本误差的平均,又=+=+=+。其中=表示所有样本误差的平均,从而有=+2=2。=+2=+2。由这两式可以看出,仅依赖于随机误差,除与随机误差有关外,还与各水平间的效应=有关。这就是引起波动的两个原因:一个纯粹是由随机误差引起的,另一个在一定程度上是由各总体均值之间的差异引起的。如何构造检验统计量呢?这可以从,的数学期望得到启发,因为(1),所以=1=。=+。记,。那么有,+。由此可见,不管对的假设如何,是的一个无偏估计,而仅当假设= =成立时,它才是的一个无偏估计,否那么它的期望值要大于。这说明比值,在假设不成立时,有偏大倾向。下面讨论的分布。当成立时,= =,此时,。于是由4式有=+2=+。对于,它有个线性关系, 1,2, ,所以它的秩为。对于,它含有一个线性关系=0,所以它的秩为。对于,其秩为1。由于+1=,故由Cochran定理知,当假设成立时,和相互独立,且,由此知。给定显著性水平,由分布的分位数知=。当的观察值时,拒绝假设,否那么认为试验结果与假设无显著差异。为应用方便起见,将上面讨论中所需的结果列成方差分析表,如表2。例2 检验例1 的四种灯丝材料对灯泡使用寿命是否有显著影响=0.05。解=7+5+8+6=26,计算得=44360.7, =151350.8=14786.9,=6879.58,=2.15。把计算结果整理列成下面的方差分析表表3 。表2方差来源平方和自由度均方和值因素的影响=误差=总和=表3方差来源平方和自由度均方和值因素的影响=44360.7=314786.92.15误差=151350.8=226879.58总和=195711.5=257828.46这里的自由度为3,22,假设给定显著性水平=0.05,查得临界值(3,22)=3.05。因为=2.154.8=(3,6),所以拒绝,即因素的不同水平对化验结果有显著影响。又由于当假设成立时,(2,6),查分布表得(2,6)=5.1。因为=25.85.1=(2,6),所以拒绝,即因素的不同水平对化验结果有显著影响。2.2 考虑交互作用的方差分析在以上讨论中,由于只对,两个因素各水平的组合进行了一次观察,所以不能了解,两因素之间是否存在交互作用的影响。上面假设均值=+,1,2, ;1,2, 。而现在要考虑,各水平的交互作用,很自然+,我们称=为因素的第个水平与因素的第个水平的交互效应即交互作用的影响。对两个因素和的各水平,,1,2, ;1,2, ,重复进行次观察,设其观察值为,1,2, ;1,2, ,=1,2, ,并假设1独立,1,2, ;1,2, ,=1,2, ;2=+。于是=0,=0,=0,1,2, ,=0,1,2, 。这样就得到两个因素有交互作用的方差分析模型为=+,=0,=0,=0,=0,iid,1,2, ;1,2, ,=1,2, 。因此要判断因素,的影响以及交互作用的影响是否显著,分别等价于检验假设= =0,= =0,=0,1,2, ;1,2, 。为了检验上述假设,类似地将总偏差平方和进行分解。=+=+。 5其中=,=,=,=。=,1,2, ,1,2, ,=,1,2, ,=,1,2, ,=。在平方和分解公式5中,除反映误差波动外,还反映了因素的各水平间效应的差异;除反映误差波动外,还反映了因素的各水平间效应的差异;除反映误差波动外,还反映了交互作用的差异所引起的波动;仅仅反映了误差的波动。可以计算得+,+,=+。令,。那么得+,+,+,。构造统计量:=,=,=。当假设不成立时,有偏大倾向,故可用检验假设;当假设不成立时,有偏大倾向,故可用检验假设;当假设不成立时,有偏大倾向,故可用检验假设。可以证明(。当成立时,且与独立,所以。当成立时,且与独立,所以。当成立时,且与独立,所以。将上面的结果列成有交互作用的方差分析表表5。表5方差来源平方和自由度均方和值的影响=的影响=交互影响=误差=总和=例2 在某橡胶配方中,考虑三种不同的促进剂,四种不同分量的氧化锌,同样的配方重复一次,测得300%的定伸强力如表6所示。试问氧化锌、促进剂以及它们的交互作用对定伸强力有无显著影响=0.01?表6 BA31,33343635,3639,3833,3436,3737,3938,4135,3737,3839,4042,44解 由表6数据可算得相应的方差分析,结果见表7所示。表7方差来源平方和自由度均方和值显著性=56.6228.3=19.4显著=132.2344.1=30.2显著=4.760.8=0.55不显著误差=17.512总和211.023由显著性水平=0.01,查分布表得(2,12)=6.9; (3,12)=6.0; (6,12)=4.82。所以在显著性水平=0.01下,促进剂种类影响和氧化锌总量的影响都是显著的,而它们之间的交互作用那么认为可以忽略。3 正交试验设计的直观分析试验设计是数理统计中的一个较大的分支,它的内容十分丰富,这里只介绍正交试验设计简称正交设计或正交试验。这种方法第二次世界大战后在日本全国普遍推广,据日本某些专家估计,“日本经济开展中至少有10%的功绩归于正交设计,可见其经济效益之大。在我国,正交设计也有很多应用,它的进一步推广将会在我国现代化建设中获得更加丰硕的成果。正交设计是利用“正交表进行科学地安排与分析多因素试验的方法。它的主要优点是,能在很多试验方案也称试验条件中挑选出代表性强的少数试验方案,并通过对这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素也称因子的信息。在2中介绍的两个因素的方差分析的计算已经比拟复杂,当因素及水平数较多时,试验次数是惊人的。例如,考虑5个因素4水平的试验,假设每个因素的水平搭配水平组合只做2次重复试验,就要做245=2048次试验,而且,对这么多试验数据进行统计分析计算,也将是非常繁重的任务。此时如果用正交设计来安排试验,那么试验次数会大大减少,而统计分析的计算也将变得简单。按“正交表来安排回归试验,也会使多元线性回归分析的计算变得更简单。对正交试验结果的分析,通常采用两种方法,一种是直观分析法或称极差分析法,另一种是方差分析法。在实际工作中两种方法都有用,本节讨论直观分析法。3.1 正交表下面的表1是一张正交表,把它记为L8(27)。表1列号试验号12345671234567811112222112211221122221112121212121221211221122112212112记号L8(27)中的“L代表正交表,L右下角的数字“8表示这个正交表有8行,即安排8次试验,括号内的数字“2表示集中只出现“1和“2两个数字,它们分别是因子的1水平和2水平的代号,数字2的右上角“7表示这张正交表有7列。正交表的列是用来安放因子和交互作用的,因此正交表L8(27)最多可安排7个二水平因子的试验。常用的正交表有L4(23),L8(27),L16(215),L32(231),L9(34),L27(313),L16(44)等,它们的含义与L8(27)类似。正交表有如下两个性质:1每列中不同水平出现的次数相等。例如L8(27)中的1水平和2水平在各列中各出现4次。2任意两列,将同一横行的两个数字看成有序数对时,每种数对出现的次数相等,例如表L8(27)中,可能的次序对为(1,1), (1,2), (2,1), (2,2),它们在任意两列中各出现两次。凡满足上述两条性质的表称为正交表。3.2 正交试验及其结果的分析根据试验指标即表示试验结果特性的值,可把正交试验设计分为单一个指标试验设计与多指标试验设计。下面通过例子说明如何用正交表进行单指标正交设计,以及对试验结果进行分析。例1 合成氨最正确工艺条件试验。数据以往生产积累的经验,决定选取的试验因素与水平如表2所示。假定各因素之间无交互作用。试验目的是提高氨产量,即要找到最高产量的最优的水平组合方案。表2 例1的因素与水平表因素水平反响温度反响压力大气压催化剂种类1460250甲2490270乙3520300丙解 首先,选择适宜的正交表。本例是一个3水平的试验,因此要选用Ln(3t)型正交表。本例共有3个因素,不考虑因素之间的交互作用,所以要选一张t3的表,而L9(34)是满足条件t3的最小的Ln(3t)型表,应选用正交表L9(34)安排试验。选定正交表后,接着进行表头设计。本例不考虑因素之间的交互作用,只需将各因素分别填写在所选用的正交表的上方与列号对应的位置上,一个因素占有一列,不同因素占有不同的列,就得到表头设计见表3。表3 例1的表头设计因素空列列号1234未放置因素或交互作用的列称为空白列空列。空白列在正交设计的方差分析中也称为误差列,它有着重要作用,一般要求至少有一个空白列。完成表头设计后,就可以判定试验方案。把表中各列的数字“1、“2、“3分别看成是该列所填因素在各个试验中的水平数,而正交表的每一行就是一个试验方案。于是,本例得到9个试验方案。如:第六号试验方案:A2B3C1。这就是用温度490、压力300大气压、甲种催化剂三种水平组合进行试验。下面用正交表来分析试验结果。按正交表的各试验号中规定的水平组合进行试验。本例总共要进行9个试验,将试验结果数据, , (单位:t)填写在表的最后一列中。例1的试验方案及试验结果见表4 。表4 例1的试验方案及试验结果分析因素列号试验号空白产量指标(t)12341231(460)111(250)2(270)3(300)1(甲)2(乙)3(丙)123=1.72=1.82=1.804562(490)22123231312=1.92=1.83=1.987893(520)33123312231=1.59=1.60=1.815.345.735.005.235.255.595.305.555.225.365.395.32=16.071.7801.9101.6671.7431.7501.8631.7671.8501.7401.7871.7971.7730.730.360.330.07因素主次优方案A2 B3 C2引进以下记号以计算极差和确定因素的主次顺序。=第列上水平号为的各试验结果之和。=,其中为第列上水平号出现的次数;表示第列的因素取水平时,进行试验所得试验结果的平均值。=。称为第列的极差或其所在因素的极差。也可定义为=。但对于水平数不等的试验,就只能用后者。对于本例,有=+=1.72+1.82+1.80=1.780;=+=1.92+1.83+1.98=1.910;=+=1.59+1.60+1.82=1.667;=max,min,=5.735.00=0.73。其它的,的计算过程就不写出来了,它们的计算结果列在表4中。注意:如果第列放置因素,为了方便,有时也把,分别写成,,其它记号如,作类似的理解。一般地说,各列的极差是不相等的,这说明各因素的水平改变时对试验结果的影响是不相同的。极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那一列的因素,就是因素的水平改变对试验结果影响最大的因素,也就是最主要的因素。对于本例有。因此,它的各因素的主次顺序为主次: 现在,可以根据分析结果确定最优试验方案了。挑选因素的优水平与所要求指标有关,假设指标越大越好,那么应该选取使指标大的水平,即各列,或,中最大的那个水平;反之,假设指标越小越好,那么应取使指标最小的那个水平。本例的试验目标是提高合成氨的产量,指标越大越好,所以应该挑选每个因素的,中最大的那个水平。由于,故得最优方案为A2B3C2。即反响490,反响压力300大气压,乙种催化剂。我们通过分析计算得到的最优方案A2B3C2,并不包含在正交表中已做过的9个试验方案之中。这正表达了正交设计的优越性。但是,实际上它是不是真正的最优方案呢?这可以通过进一步的试验来验证,我们也可以作进一步的理论计算来证实。3.3 有交互作用的正交试验设计分析前面讨论的正交试验设计和对试验结果的分析,都是在因素之间没有或不考虑交互作用的情况下进行的。实际上,在许多试验中,因素的交互作用不但存在,而且不能忽略。在这种情况下,对多因素的正交试验的表头设计还必须另外借助两列间的交互作用表,许多正交表的后面都附有相应的交互作用表。表5就是正交表L8(27)所对应的交互作用表。表5 L8(27)两列间交互作用列表列号列号12345671322135674476157452366543217用正交表安排有交互作用的试验时,把交互作用看成一个新的因素,它要在正交表上占有列,称为交互作用列。交互作用列不能随意安排在任意列上,应该通过查交互作用表来安排。从表5就可以查出正交表L8(27)中任何两列的交互作用列。例如,要查第2列与第6列的交互作用列,先在表6-25的对角线上查出列号2与6,然后从2向右横看、从6向上竖看,交叉数字为4就是它们的交互作用列的列号。即是说,用L8(27)安排试验时,如果因素被安排在第2列,因素被安排在第6列,那么,交互作用因素就只能安排到第4列上,此列不能再安排其它因素,以防止发生效应之间的“混杂。在分析试验结果时,仍然作为一个单独因素,同样计算它的极差,极差的大小反映和的交互作用的大小。下面举例说明有交互作用的试验设计与试验结果的分析。例2 工件的渗碳层深度要求为10.25,要通过试验考察的因素与水平如表6所示,还要考察交互作用、。表6 例2 的因素与水平表因素水平催化剂温度保温时间h工件重量甲乙7008002311.5试验目的是确定这4个因素及2个交互作用对渗碳指标的影响的重要性的主次顺序,并找到最优的生产方案。解 首先,选定适宜的正交表。这是一个4因素2水平试验,4个因素加上2个交互作用、,因此所选的2水平正交表至少要有6列。满足这种条件的2水平正交表中以L8(27)为最小,因此选用正交表L8(27)安排试验。然后进行表头设计。把因素、分别放在表L8(27)的第1、2列上,查 L8(27)两列间的交互作用表,可知交互作用占用第3列,因此第3列不能安排因素或其它因素,否那么第3列的极差就分不清楚是因素的作用还是的作用,这便产生了效应“混杂。现将因素放在第4列,查L8(27)两列间的交互作用表,可知交互作用占用第6列,因此第6列不能再安排别的因素。最后,因素可安排在第5列或第7列上,现安排在第5列上,于是第7列成为空白列。这样,便得到不会有因素与交互作用“混杂的表头设计,如表7所示。表7 例2 的表头设计因素空列列号1234567下面制订试验方案与进行试验。完成了表头设计以后,只要把表L8(27)安排有因素的第1、2、4、5列上的数字“1、“2分别看成是该列所安排的因素在各个试验中的水平数,从而正交表的每一行就确定一个试验方案,于是得到本例的8个试验方案。注意,在完成了表头设计以后,交互作用所在列与空白列一样,对确定试验方案不起任何作用,因为那些列的数字“1、“2不代表任何实际水平。按正交表规定的试验方案进行试验,测定试验结果。试验方案与试验结果见表8。下面分析试验结果,计算极差,确定因素的主次顺序。由于渗碳层深度越接近1越好,为了便于讨论,把试验指标变换为1=,从而问题转化为越小越好。用(1,2,8)来计算, , 计算, 与第列放置什么因素或交互作用无关,所以计算,的公式与无交互作用情形相同。计算所得结果以及根据极差由大互小所确定的因素的主次顺序见表8。最后,确定最优方案。如果不计交互作用,注意到指标是越小越好,很容易得到最优方案应该是A1B2C1D1,但是,由于交互作用是影响试验结果的最重要因素,是挑选水平组合的最主要依据,所以不能不计。可是,没有实际水平,说它取哪个水平是没有意义的,因而不能按,值的大小来确定,应该按因素,的水平搭配的好坏来确定。怎样看出两因素水平搭配的好坏呢?通常把两因素各种水平搭配下对应试验结果数据之和列成的表格称为搭配表也称为二元表,表9便是本例的,两因素的搭配表。表8 例2 的试验方案与结果分析因素列试验号 号空列渗碳层深度()=1123456711(甲)1(700)11(2)1(1)110.850.1521112(3)2(1.5)220.750.25312(800)211221.030.03412222110.980.0252(乙)1212121.090.09621221211.160.16722112210.810.19822121120.920.080.450.650.670.460.420.340.520.520.320.300.510.550.630.450.070.330.370.050.130.290.07因素主次 优方案A1B2C2D1表9 例2 因素,的水平搭配表D11=+=0.15+0.25=0.40D12=+=0.03+0.02=0.05D21=+=0.09+0.16=0.25D22=+=0.19+0.08=0.27由于本例的指标越小越好,根据正交表的综合可比性,表中最小值所对应的水平搭配就是因素,的最优水平搭配,即最好的搭配是A1B2。由于交互作用比因素重要,我们也列出因素,的水平搭配表见表10。表10 例2 的因素,水平搭配表D11=+=0.15+0.09=0.24D12=+=0.25+0.16=0.41D21=+=0.03+0.19=0.22D22=+=0.02+0.08=0.10与因素,找最优水平搭配的道理一样,由表10得到因素,的最优水平搭配为B2C2。综上所述,不考虑交互作用时得到的最优方案为A1B2C1D1,考虑交互作用时得到的最优方案为A1B2C2D1。这两个方案一致之处在于因素的水平选取上,在有交互作用时,这种矛盾现象是经常发生的。此时,因素取哪一个水平好呢?一般来说,次要因素应该服从主要因素交互作用、分别都看作是因素,本例交互作用比因素重要,因此应该选择由因素,的优水平搭配所确定的水平。于是,最后确定的最优方案为A1B2C2D1。即甲种催化剂,温度800,保温时间3h,工件重量1。当因素取3水平或3水平以上时,交互作用的分析比拟复杂,不便于应用直观分析法极差分析法,通常都用方差分析法。4 正交试验设计的方差分析前面介绍了用正交表安排多因素试验的方法,并对试验结果进行了极差分析。极差分析方法的优点是方法简单、直观,计算量较少,便于普及和推广,对于生产实际中的一般问题用极差分析法能够得到很好解决。但极差分析法不能估计试验过程中以及试验结果测定中必然存在的误差的大小,因而不能真正区分各因素各水平所对应的试验结果的差异究竟是由于水平的改变所引起的,还是由于试验误差所引起的。而且,对影响试验结果的各因素的重要程度,极差分析法不能给出精确的数量估计,也不能提供一个标准来考察、判断因素对试验结果的影响是否显著。特别,对于水平数大于等于3且要考虑交互作用的试验,极差分析法不便于使用。方差分析能弥补极差分析法的这些缺乏。4.1 不考虑交互作用的正交试验的方差分析利用正交表对试验结果进行方差分析的思想与步骤类似于两个因素全面试验中的方差分析:先将数据试验结果的总偏差平方和分解为各因素以及误差的偏差平方和,然后求出值,再应用检验法。假设用正交表安排试验,总的试验次数为,试验结果为, , , 那么数据的总偏差平方和为=。其中,。由一个因素的方差分析知道,因素所引起的数据的偏差平方和即组间平方和为=。其中,为因素的水平数;为因素的水平所对应的试验结果的平均值。用正交表安排试验时,每一个因素的任一个水平的试验次数都是相等的。设因素的每一个水平的试验次数为,那么记号,与前节的含义相同=;=;=。于是,可表示为=。假设因素安排在正交表的第列上,记=,且称为第列所引起的数据的偏差平方和简称为第列平方和,于是有=。特别地,对于2水平的正交试验,计算的公式可简化为=。假设用正交表安排试验,可以证明有如下平方和分解公式:=。也就是说,我们用正交表将总偏差平方和分解为各列偏差平方和之和,且的自由度 =1;的自由度 =1。例1 苯酚合成工艺条件试验。某化工厂在原有根底上要对苯酚的合成条件做进一步的研究,目的在于提高苯酚的产率。试验考察的因素与水平为不考虑交互作用:反响温度 =300,=320;:反响时间min =20,=30;:压力 =200,=250;:催化剂种类 =甲,=乙;:NaOH溶液用量L =80,=100。解 由于各因素皆为2水平,共有5个因素,可选用正交表L8(27)。表头设计、试验方案、试验结果及,的计算结果见表1。表1 例1的试验与计算表因素列试验号 号试验结果12345671234567811112222112211221122221112121212121221211221122112212112=83.4=84.0=87.3=84.8=87.3=88.0=92.3=90.4339.5358.0342.7354.8350.1347.4350.3347.2348.4349.1351.6345.9348.5349.0=697.584.989.585.788.787.586.987.686.887.187.387.986.587.187.318.512.12.73.10.75.70.542.78118.3010.9111.2010.0614.0610.031=67.349本例是用正交表L8(27)安排试验,于是有:=;=()2=。各列的计算结果见表1。由正交表的平方和分解分式及本例的表头设计,得=+。其中,均为空白列的偏差平方和。由于空白列的偏差平方和不是由任何因素所引起的,故是误差所引起的,因此误差平方和为所有空白列的偏差平方和之总和,本例为=+且自由度有=+,于是又有=+。要进行方差分析,还必须把试验结果理解为理解为随机变量(1,2,8),并假定它们服从正态分布。在无交互作用时,假定, 满足下面模型。=+=+=+=+=+=+=+=+=0, , iid ,从而, 相互独立其中,分别为因素的水平,的效应(1,2),它们与及均是未知参数。检验,各因素对试验结果有无显著影响,分别等介于对以下假设:=0,:=0,:=0,:=0,:=0。下面作出显著性检验。我们已指出有=+。还可以证明有以下结论:1,相互独立,且();2当成立时,();当成立时,();当成立时,();当成立时,();当成立时,()。其中称为或因素的自由度。有=因素的水平数1。同理,可知,的含义及计算公式。称为(或误差)的自由度,它的另一个计算公式为=各因素的自由度之和=1各因素的自由度之和。由此得到检验的统计量为=(,)其中,=/;=/。一般=/称为第列的均方和。于是,对于给定的显著性水平,由样本值, , 算出统计量的观测值,那么检验假设的法那么为:假设(,),那么拒绝,认为因素对试验结果的影响是显著的;假设(,),那么接受,认为因素对试验结果的影响不显著。类似可得到检验,的法那么。但是,有些因素对试验结果的影响明显地不显著。应该把这些因素所在列的并入误差平方和中。通常是比拟与的大小,如果,但相对于其它一些列的偏差平方和来说小得多的少数一些列的也并入误差平方和中,然后再对其它因素用=(,)来作检验:假设计算出的观测值(,),那么以显著性水平推断此因素对试验结果的影响显著,否那么推断此因素对试验结果的影响不显著。在例1中得到=+=0.911+0.031=0.942;=+=1+1=2;=0.061(1,3)=34.12,故因素对试验结果的影响是高度显著的。类似可得因素的影响是高度显著的,而因素的影响是显著的。对因素,由于=3.6(1,3)=4.54,故因素对试验结果无显著影响。将以上分析计算列成方差分析表表2。表2 例1的方差分析表方差来源平方和自由度均方和值显著性42.781142.781128.1* *18.301118.30154.8* *1.20111.2013.60.06110.0614.06114.06112.2*0.94220.4711.00330.334下面来确定最优方案。在无交互作用的情形,对试验结果影响显著的因素应该选最好的水平,由于,故因素的水平比好。在本例中,指标越大越好。类似可得因素的水平比好;对于因素,水平比好。对于作用不显著的因素,可根据提高效率、降低消耗、便于生产等多方面考虑任取一个水平。本例对作用不显著的因素,,可选,,故确定的最优工艺条件为,即温度320、时间30min、NaOH溶液80L,大气压200及甲种催化剂。我们计算得出的最优方案不包含在正交表排出的试验方案中,按正交表的安排在已做过的8个试验中,以第7号试验结果为最好,可将第7号试验方案与最优方案作比照验证试验。4.2 考虑交互作用的正交试验的方差分析我们通过例子来说明。例2 某纺织厂在梳棉机上纺粘棉混纺纱,为了降低棉结粒数,想通过试验确定有关因素的最优方案。试验要考察的因素与水平为:金属针布产地 =甲地,=乙地;:产量 =6,=10;:速度r/min =238,=320。还要考察3个因素之间可能存在的一级交互作用,。解 选择正交表、表头设计、明确试验方案及进行试验等这些步骤都与前述类似,所得结果见表3。为了便于计算,我们把试验结果进行了如下简化:=100(0.30) (1,2,8)。由于数据经过线性变换前方差分析的结论不变,故对正交试验的方差分析也是如此。表3 例2的试验与计算表因素列试验号 号棉结粒数=100(0.30)1234567123456781(甲)11122乙)221(6)12(10)21122112222111(238)2(320)1212121212212112211221122121120.300.350.200.300.150.500.150.4005-100-1520-1510-5010-150-5-403520-25-505-10= 53.12578.1253.125703.125253.1253.12528.125利用简化数据(1,2,8)计算,,计算,与第列安排什么因素或什么交互作用无关,所以计算,的公式与无交互作用的情形完全相同,具体计算结果见表3。下面对例2进行方差分析。为了进行方差分析,我们把试验结果理解作随机变量,并记作(1,2,8),假定它们满足以下模型:=+=+=+=+=+=+=+=+=0=0, , iid 从而, 相互独立其中,,均是未知参数。称为理论总均值;,分别为,的效应(1,2),它们的估计值计算方法与无交互作用的情形相同;,分别表示与、与、与的交互效应,它们的估计值计算方法稍后再讨论。检验因素,及交互作用,对试验结果有无显著影响,分别等价于对以下假设:=0,:=0,:=0,:=0(1,2;=1,2),:=0(1,2;=1,2),:=0(1,2;=1,2)。作显著性检验。前面已指出,正交试验的总偏差平方和分解公式为=,对本例有=+。其中,=,=,=,=,=,=,=。而且有=1。还可以证明有以下结论:1,相互独立,且();2当成立时,();当成立时,();当成立时,();当成立时,();当成立时,()。当成立时,()。由此得到检验假设的统计量为=(,)于是,对于给定的显著性水平,由样本值, , 算得统计量的观测值,检验的法那么为:假设(,),那么拒绝,认为在显著性水平下,因素对试验结果的影响是显著的;假设(,),那么接受,认为在显著性水平下,因素对试验结果的影响不显著。类似地可以得到检验其它假设包括交互作用的假设的法那么。但要注意,假设有,那么应该把这些并入误差平方和之中而成为,然后用=(,)去检验那些没有并入之中的的因素或交互作用的显著性把交互作用看成因素。对于本例,有=,=28.125=,=28.125=,故应该把,并入之中,得=+=28.125+3.125+3.125+3.125=37.500,而相应的自由度为 =+=4。剩下要检验的假设为,,于是=8.33;=75.00;=27.00。查分布表,得(,)的值为(1,4)=21.2;(1,4)=7.71。把,与查得的(,)值相比拟,就可以得出各因素及各交互作用对试验结果影响是否显著的结论,见表4。表4 例2的方差分析表方差来源平方和自由度均方和值显著性3.12513.12578.125178.1258.33*()703.1251703.12575.00* *3.12513.12
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!