资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,多元线性回归与相关分析,第一节 多元线性回归分析,第二节 多元线性相关分析,第一节 多元线性回归分析,一、多元回归方程,二、多元回归的假设测验,三、最优多元线性回归方程的统计选择,四、自变数的相对重要性,一、多元回归方程,多元回归或复回归,(multiple regression),:依变数依两个或两个以上自变数的回归。,(,一,),多元回归的线性模型和多元回归方程式,若依变数,Y,同时受到,m,个自变数,X,1,、,X,2,、,、,X,m,的影响,且这,m,个自变数皆与,Y,成线性关系,则这,m,+1,个变数的关系就形成,m,元线性回归。,一个,m,元线性回归总体的线性模型为:,其中, ,N,( 0,,,),。,一个,m,元线性回归的样本观察值组成为:,(101),(102),一个,m,元线性回归方程可给定为:,b,0,是,x,1,、,x,2,、,、,x,m,都为,0,时,y,的点估计值;,b,1,是,b,y,1,23,m,的简写,它是在,x,2,,,x,3,,,,,x,m,皆保持一定时,,x,1,每增加一个单位对,y,的效应,称为,x,2,,,x,3,,,,,x,m,不变,(,取常量,),时,x,1,对,y,的,偏回归系数,(partial regression coefficient),。,(103),(,二,),多元回归统计数的计算,(10,2),用矩阵表示为:,即,Y,=,Xb,+,e,(104),其中,b=A,-1,B,(,三,),多元回归方程的估计标准误,Q,y,/12,m,称为,多元离回归平方和或多元回归剩余平方和,,它反映了回归估计值和实测值,y,之间的差异。,最小,自由度:,=,n-,(,m,+1),(105),s,y,/12,m,(,106,),二、多元回归的假设测验,(,一,),多元回归关系的假设测验,测验,m,个自变数的综合对,Y,的效应是否显著。若令回归方程中,b,1,、,b,2,、,、,b,m,的总体回归系数为 、 、,、 ,则这一测验所对应的假设为,H,0,:,0,对,H,A,: 不全为,0,。,由于多元回归下,SS,y,可分解为,U,y,/12,m,和,Q,y,/12,m,两部分,,U,y,/12,m,由,x,1,、,x,2,、,、,x,m,的不同所引起,具有,=,m,;,Q,y,/12,m,与,x,1,、,x,2,、,、,x,m,的不同无关,具有,=n-(m+1),,由之构成的,F,值:,(10,8,),(,二,),偏回归关系的假设测验,偏回归系数的假设测验,就是测验各个偏回归系数,b,i,(,i,=1,,,2,,,m,),来自,=0,的总体的概率,所作的假设为,H,0,:,=0,对,H,A,: ,0,,测验方法有两种。,1,t,测验,服从 的,t,分布,可测验,b,i,的显著性。,(109),=,s,y,/12,m,(1010),(1011),2. F,测验,(1012),就是,y,对,x,i,的偏回归平方和, 。,(1013),三、最优多元线性回归方程的统计选择,剔除不显著自变数的过程称为,自变数的统计选择,,所得的仅包含显著自变数的多元回归方程,叫做,最优,的,多元线性回归方程。,逐步回归,(stepwise regression),:为了获得最优方程,回归计算就要一步一步做下去,直至所有不显著的自变数皆被剔除为止。,自变数统计选择的具体步骤为:,第一步:,m,个自变数的回归分析,一直进行到偏回归的假设测验。,第二步:,m,-1,个自变数的回归分析,也是一直进行到 偏回归的假设测验。,第三步:,m,-2,个自变数的回归分析,又一直进行到偏回归的假设测验。,如此重复进行,直至留下的所有自变数的偏回归都显著,即得,最优多元线性回归方程。,四、自变数的相对重要性,偏回归系数,b,i,本身并不能反映自变数的相对重要性,其原因有二:,b,i,是带有具体单位的,单位不同则无从比较;,即使单位相同,若,X,i,的变异度不同,也不能比较。,通径系数,(path coefficient,,记作,p,i,),:,即,对,b,i,进行标准化,在分子和分母分别除以,Y,和,X,i,的标准差,从而消除单位和变异度不同的影响,获得一个表示,X,i,对,Y,相对重要性的统计数。,通径系数,p,i,统计意义是:,若,X,i,增加一个标准差单位,,Y,将增加,(,p,i,0),或减少,(,p,i,0),p,i,个标准差单位。,(1014),第二节 多元线性相关分析,一、多元相关,二、偏相关,一、 多元相关,多元相关或复相关,(multiple correlation),:在,M,=,m,+1,个变数中,,m,个变数的综合和,1,个变数的相关。,偏相关,(partial correlation),:在其余,M,-2,个变数皆固定时,指定的两个变数间的相关。,(,一,),多元相关系数,在,m,个自变数和,1,个依变数的多元相关中,多元相关系数记作,R,y,12,m,,读作依变数,y,和,m,个自变数的多元相关系数。,R,y,12,m,=,(,1015,),多元相关系数为多元回归平方和与总变异平方和之比的平方根。,R,y,12,m,的存在区间为,0,,,1,。,(,二,),多元相关系数的假设测验,令总体的多元相关系数为 ,则对多元相关系数的假设测验为,H,0,: 对,H,A,: ,,F,测验,:,其中的,=,m,,,=,n,-(,m,+1),,,R,2,为 的简写。,(,10,16,),二、偏相关,(,一,),偏相关系数,偏相关系数,:表示在其它,M,-2,个变数都保持一定时,指定的两个变数间相关的密切程度。,偏相关系数以,r,带右下标表示。如有,X,1,、,X,2,、,X,3,3,个变数,则,r,12,3,表示,X,3,变数保持一定时,,X,1,和,X,2,变数的偏相关系数;,若有,M,个变数,则偏相关系数共有,M,(,M,-1)/2,个。,偏相关系数的取值范围是,-1,,,1,。,偏相关系数解法是:由简单相关系数,r,ij,(,i,,,j,=1,,,2,,,,,M,),组成的相关矩阵:,求得其逆矩阵:,令,x,i,和,x,j,的偏相关系数为,r,ij,,解得 后即有,r,ij,(,1018,),矩阵以主对角线为轴而对称,即,r,ij,=,r,ji,。逆阵,R,-1,中,的元素也是以主对角线为轴而对称的 。,(,二,),偏相关系数 的假设测验,可测验,H,0,:,= 0,对,H,A,: ,0,。该测验的,t,具有 。,27,可编辑,感谢下载,
展开阅读全文