统计建模多元回归分析

上传人:jian****019 文档编号:245719423 上传时间:2024-10-10 格式:PPT 页数:26 大小:297KB
返回 下载 相关 举报
统计建模多元回归分析_第1页
第1页 / 共26页
统计建模多元回归分析_第2页
第2页 / 共26页
统计建模多元回归分析_第3页
第3页 / 共26页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,回归分析,回归分析,在许多科研问题中,经常遇到一些同处于一个,统一体,中的变量,这些变量之间往往是相互依赖和相互制约的,根据实际问题的要求,我们往往需要找出描述这些变量之间依存关系的数学表达式(数学模型).,(regression analysis),一、什么是回归分析,变量之间的相互关系大致可分为两类:,(1)确定关系-函数关系.,(2)不确定关系-相关关系.,在许多实际问题中,由于生产或试验过程不可避免存在着误差的影响,使得变量之间的关系具有某种程度的,不确定性,并且不能用函数表示,这些变量其实是随机变量或至少其中有一个是随机变量.,为确定随机变量与随机变量(或非随机变量)之间的相依关系,需采用统计分析方法总结出隐藏在随机性后面的统计规律性(统计模型).这类统计规律称为,回归关系,.,有关回归关系的计算方法和理论统称,回归分析,(regeression analysis).,回归分析的目的是寻求一个随机变量,Y,(因变量)对一组随机变量,X,1,X,2,X,p,(自变量)的统计依赖关系.,二、回归分析的目的,一般来说,可通过直观的方法(如散点图)进行粗略判断.如只有一个自变量,则称为,一元回归分析,;如自变量个数多于一个,则称为,多元回归分析.,三、变量的确定及要求,将一个需要预测的变量作为,因变量,它的取值是可观测的但不可控制的 ;将被认为对因变量的取值,具有显著影响,的哪些变量作为,自变量,.,通常情况下,自变量的取值能得以控制,称为可控变量.,例如,我们希望通过一些,易测,的,指标,去预测正常儿童的心象面积,由于心象面积是一个,不易检测,的,指标,,是一个需要预测的变量,根据专业知识,认为性别、年龄、身高、体重、胸围可能对心象面积都有影响。,因变量(Y)-,心象面积;,自变量,-,性别(,X,1,)、年龄(,X,2,)、身高(,X,3,)、体重(,X,4,)、胸围(,X,5,)。,四、回归分析的基本原理,回归分析的实质是根据隐含统计规律性的观测值,求出因变量对自变量的具体表达式,y,=,f,(,x,1,x,2,x,p,).,一般,自变量,X,1,X,2,X,p,是,可控变量,控制它们取特殊值,x,1,x,2,x,p,时,对不同个体,Y,的取值依然不同(随机性),Y,依然是随机变量,记为,Y,(,x,1,x,2,x,p,).,Y,虽然不能完全确定(随机变量),但却有一个确定的,条件分布,p(,Y,x,1,x,2,x,p,),从而有一个确定,条件均值,E(,Y,x,1,x,2,x,p,),它是,x,1,x,2,x,p,的函数.,是否可用,y,=E(,Y,x,1,x,2,x,p,)作为,Y,对,X,1,X,2,X,p,的回归方程?,定义1,(均方误差)设(,Y,X,1,X,2,X,p,)具有联合分布且二阶矩存在,f,(,X,1,X,2,X,p,)是随机变量,X,1,X,2,X,p,的函数,则称,E,Y,-,f,(,X,1,X,2,X,p,),2,为,f,(,X,1,X,2,X,p,)对,Y,的,均方误差,(,mean square error,).,均方误差从平均意义上反映了函数,f,(,X,1,X,2,X,p,),与,随机变量,Y,之间差别的大小,它可作为回归函数好坏的判断标准.如果某个函数与,Y,的均方误差最小,我们有理由认为在均方误差最小标准下将它作为回归函数进行预报是最好的.,E,Y,-,f,(,X,1,X,2,X,p,),2,定义2,在定义1的条件下,函数,E,(,Y,X,1,X,2,X,p,)是所有,X,1,X,2,X,p,的函数中均方误差最小的函数,即对任意给定的函数,f,(,X,1,X,2,X,p,),总有,E,Y,-E(,Y,X,1,X,2,X,p,),2,成立.,定义2揭示用,E,(,Y,x,1,x,2,x,p,)去预报,Y,在,均方误差最小,标准下是最好的,因此,y,=,E,(,Y,x,1,x,2,x,p,),就是我们寻找的回归函数.,在,(,Y,X,1,X,2,X,p,)的联合分布为,多元正态分布,时,E,(,Y,x,1,x,2,x,p,)为,x,1,x,2,x,p,的线性函数,此时的回归函数为,y,=,a,0,+,a,1,x,1,+,a,2,x,2,+,a,p,x,p,我们称它为,多元线性回归方程,.,五、多元线性回归模型,设,p,个自变量,X,1,X,2,X,p,的取值为,x,1,x,2,x,p,时,随机,Y,变量满足,其中,a,0,,,a,1,,,a,2,,,a,p,,,2,均为未知常数,,a,0,a,1,a,2,a,p,称为“,偏回归系数,”;,2,称为随机误差的,方差,。,称上式为,p,元正态线性回归模型.,对,p,元线性回归模型我们要解决如下问题:,1.根据样本观测值去估计未知参数,a,0,a,1,a,2,a,p,2,从而建立,Y,与,X,1,X,2,X,p,间的关系式(,回归方程,);,2.对回归方程的回归效果进行统计检验;,3.检验各变量,X,1,X,2,X,p,分别对指标(,Y,)是否有显著影响.,按最小二乘估计的原理估计未知参数.,实际问题:,已知,29,例儿童的血红蛋白,(,hemoglo,g,),与钙,(,Ca,g,)、,镁,(,Mg,g,)、,铁,(,Fe,g,)、,锰,(,Mn,g,)、,铜,(,Cu,g,),的含量如表,试建立一个钙、镁、铁、锰、铜预测血红蛋白的数学模型,。,1 54.89 30.86 448.70 .012 1.010 13.50,2 72.49 42.61 467.30 .008 1.640 13.00,3 53.81 52.86 425.61 .004 1.220 13.75,编号 钙 镁 铁 锰 铜 血红蛋白,29 47.31 28.55 294.70 .005 .838 7.00,多元线性回归,数学模型,1.,单击 “开始”,“程序”,SPSS for windows SPSS10.0 for windows type in data ,OK,单击,“Variable View,”(在第一列输入钙、镁、铁、锰、铜、血红蛋白 ;单击,“Data View”。,SPSS,软件的实现与结果分析,2.,SPSS,输入,数据,格式,:29,行,6,列,2.,程序选项,Analyze Regression,Linear,引入回归分析的因变量:,引入回归分析的自变量,:,血红蛋白,.,钙、镁、铁、锰、铜,.,在多元回归方法,(Method),中选:强迫引入法,(Enter),单击,Statistics;,选项如下,图 ;,单击,Continue Plots ,点击,Plots,获得分析资料的正态性检验图形。,单击,Continue OK。,2.方差分析表,1.模型摘要,主要结果,3.回归系数表,结论:,回归效果检验对应的统计量,F=19.552,P.000,认为利用钙、镁、铁、锰、铜预测血红蛋白有实际意义。,预测血红蛋白的数学模型:,R,2,=0.810,较大,认为回归方程有意义.,从偏回归(回归系数)效果检验来看,镁、锰、铜对应的概率值大于,0.10,说明偏回归效果不显著,故需作进一步分析讨论(,逐步回归,)。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!