资源描述
混合线性模型的应用 介绍混合线性模型的结构,固定效应项和随机效应的含义。对具有内部相关性的资料,宜选用混合线性模型进行配合。方法:用一个具有聚集性结构的例子和一个重复测量的例子说明混合线性模型的方法和步骤。结构 :分析了资料的层析结构,识别不同层次上的协变量,讨论了模型中固定效应矩阵和随机效应矩阵的结构,使模型参数估计值更易于理解和解释。由于混合线性模型克服了一般线性模型对反应变量必须具有独立和等方差的要求,从而扩大了线性模型的应用范围。对于具有聚集性质的资料及重复测量资料具有很好的拟合效果。 结论 这一模型计算较复杂,应用SAS/STAT软件 包中的proc mixed 过程能很好的解决计算问题。 线性模型:独立正态等方差混合线性模型保留了传统模型的假定条件1,但对2、3 不作要求,从而扩大了传统线性模型的适用范围。在传统线性模型中。假定自变量X是没有随机误差的,即对Y的作用效应是固定的。 1混合线性模型的结构 为了减少混合线性模型中方差协方差矩阵的参数的个数,统计学家提供了一些方差协方差矩阵的系统结构模式供实际工作应用。常见的几种协方差结构有: (1)简单结构(simple),协方差矩阵中含1个参数 (2)复合对称结构(CS),协方差矩阵中含2个参数 (3)一阶自回归结构(AR(1)),协方差矩阵中含2个参数;(4)循环相关结构(Toeplitz),协方差矩阵中含有t个参数(t为矩阵维数);(5)带状主对角结构(UN(1),协方差矩阵中含t个参数;(6)空间幂相关结构(SP(POW),协方差矩阵中含有2个参数;(7)独立结构(UN),又称无结构协方阵。 混合线性模型有时又称多水平线性模型或层次结构线性模型。重复测量资料也属于混合线性模型但重复测量资料与多水平模型不同。第一:在多水平线性模型第一层次上的观察点个数可以不等,但重复测量资料第一层次上的观察点个数(即各观察对象在各时间点上的观察值个数)是相等的(假定无缺失值)。第二,多水平线性模型的方差协方差结构多为复合对称结构或无结构类型,但重复测量资料还具有多种其他形式,上面介绍的7种方差协方差结构就是其中的一部分。这两种类型的资料都可用SAS软件包中的proc mixed 进行配合。 用实例说明:混合效应线性模型 2.1学生成绩的性别分析 31名学生某学科期末考试成绩见表1. 研究目的:分析考试成绩的性别差异。考虑到学生成绩可能受生源地区的影响把地区作为随机效应因素纳入模型进行分析。 2.1.1 模型(1):假定考试得分满足正态、独立、等方差,把性别地区都作为固定效应,用一般模型分析。其固定效应设计矩阵X为一个31*5的矩阵,其结构形式见表2.性别为分类变量。 一般线性模型相应的参数估计值列于表4 相应的条件平均值预报方程为: 2.1.2模型(2):从多水平模型考虑,这是一个两水平模型资料。第一水平是学生,第一水平的反应变量是考试成绩,在第一水平上的协变量有一个:性别。第二水平是地区,同一地区内学生成绩间存在相关性,在这一水平上无协变量。把性别作为固定效应变量,地区设为随机效应变量,用混合线性模型公式2分析。相应的固定效应设计矩阵X和随机效应设计矩阵Z的结构列于表5。 效应的一般线性模型分析这一资料,可能造成错觉。固定效应变量性别对学生考试影响的参数估计值为9.9110,具有统计学意义。男生的平均成绩预报值为69.40,女生的平均成绩预报值为69.40+9.91=79.31分。这一预报值是控制地区变异后的结果,不同于模型(1)中的条件平均预报报。 2.2 例2:两种手术方案共27例肝病人(方案A14例,方案B13例),在手术当天、手术后2天、5天、10天及20天检查血中前白蛋白含量。同时记录病人年龄及术后保留肝容积2个指标。资料见表8。 该资料具有特点(1)重复测量资料(2)具有协变量,且各个时间点的距离不等。记录有可能与前白蛋白有关的因素:手术方案,年龄,手术前的前白蛋白含量及保留肝容积。 该资料也可以看成是一个3水平资料。第一水平位各时间点的测量值,第二水平位病人,第三水平为手术方案。把时间作为第一水平(测量值水平)上的协变量,在第二水平(病人水平)上有2个协变量:年龄及术后保留肝容积。手术前白蛋白含量也可作为协变量处理。在第三水平(手术方案水平)上无协变量。 配合混合线性模型的步骤如下: 小结混合线性模型保留了一般线性模型的Y具有正态性假定条件,但放弃了独立性和方差齐性的假定。 SAS 程序 /*程序1:建立例题1数据集,配合一般线性和混合效应线性模型*/ Data aaa; Input student gender $ area $ scores ;datalines; 1 m A 56.3 2 F A 84.2 3 m A 56.8 4 m A 87.4 5 m B 70.1 6 F B 69.8 31 m A 78.5 ; /*fixed-effects model with GLM procedure*/ proc glm data=aaa;class area gender;model score=area gender;run;proc mixed data=aaa;class area gender;model score=area gender/s;run; /*fixed effect model*/proc mixed data=aaa noclprint covtest ;class area gender;Model scores=gender/solution;Random intercept/subject=area G;Run; /*程序2:建立例2资料的SAS数据集及配合混合效应线性模型*/Data pad;Input pnt plan $ age h_v pad0 pad2 pad10 pad20;Cards;1 a 30 300 205 129 117 103 402 a 43 580 77 171 220 159 105 3 a 47 704 245 172 177 186 145 27 b 59 850 200 230 250 240 208; data pad_2;Set pad;Array t4 pad2 pad5 pad10 pad20;Do i=1 to 4;If i=1 then time=2;if i=2 then time=5;If i=3 then time=10;if i=4 then time=20;y=ti;Timepnt=time;output;end;Drop I pad2 pad5 pad10 pad20;run; /*general linear model :model1*/ Proc mixed data =pad_2 covtest method=ML; Class plan pnt timepnt; Model y=plan time time*time h_v pad0/htype=3 s;run; Titleestablish a covariance structure for fitting mixed model ; Proc mixed data=pad_2 covtest method=ML; Class plan pnt timepnt; Model y=plan time time*time h_v pab0/htype=3 s; Repeated timepnt/type=simple subject =pnt R;run; Titlemixed model:model 2; Proc mixed data=pad_2 covtest method=ML; Class plan pnt timepnt; Model y=plan time time *time h_v pad0/htype=3 s; repeated timepnt/type=ar(1)subject=pnt group=plan;run; Titlemixed:finnal model with intercept;Proc mixed data=pad_2 covteat method=ML;Class plan pnt timepnt;Model y=plan time time*time h_v pab0/htype=3 s;Repeated timepnt/type=AR(1) subject=pnt R;run;Titlemixed:finnal model without intercept;Proc mixed data=pad_2 covtest method=ML;Class plan pnt timepnt; Model y=plan time time*time h_v pab0/htype=3 s noint;Repeated timepnt/type=AR(1) subject=pnt R;run;Titlewithout h_v nor intercept ;Proc mixed data=pad_2 covteat method=ML;Class plan pnt timepnt;Model y=plan time time*time pab0/htype=3 s noint;Repeated timepnt/type=AR(1) subject=pnt(plan);run;
展开阅读全文