第四章_回归与相关分析2009.1

上传人:痛*** 文档编号:244170477 上传时间:2024-10-03 格式:PPT 页数:45 大小:677.50KB
返回 下载 相关 举报
第四章_回归与相关分析2009.1_第1页
第1页 / 共45页
第四章_回归与相关分析2009.1_第2页
第2页 / 共45页
第四章_回归与相关分析2009.1_第3页
第3页 / 共45页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章,回归与相关分析,生物统计分析,变异,2,期望,方差,S,2,平均数,总体,样本,指标,因素,误差,函数关系 有精确的数学表达式,(确定性的关系),直线回归分析,曲线回归分析,一元回归分析,简单相关分析,直线相关分析,因果关系,(,回归分析),变量间的关系,多元非线性回归分析,多元线性回归分析,相关关系,平行关系,(相关分析),多元相关分析,复相关分析,偏相关分析,多元回归分析,非确定性的关系,相关变量间的关系一般分为两种,:,一种是因果关系,即一个变量的变化受另一个或几个变量的影响。,如仔猪的生长速度受遗传特性、营养水平、饲养管理条件等因素的影响,子代的体高受亲本体高的影响;,另一种是平行关系,它们互为因果或共同受到另外因素的影响。,如黄牛的体长和胸围之间的关系,同胞间的身高或体重,X,Y,1,Y,2,Y,3,结果,原因,X,Y,Y,X,1,X,2,X,3,原因,结果,统计学上采用相,关分析,(correlation analysis),研究呈,平行关系,的相关变量之间的关系。,任务是找出表征这种相关关系密切程度的参数,即相关系数,统计学上采用,回归分析,(,regression analysis,)研究呈,因果关系,的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。,任务是找出这种关系的方程或关系模型,用于预测、优化和控制,相关分析与回归分析概念不同,功能不同,然而二者之间有着密切的信息关系,1,直线回归与相关,设,x,为回归变量,,y,为响应变量或因变量,,x,每取一个确定值,x,i,y,有许多观察值与之对应,(y,i1,,,y,i2,,,,,y,in,),,即,y,在,x,x,i,处为一统计总体,有它的均值 和方差,2,,服从,N,(,,,2,),叫做,y,在,x,i,处的条件期望值,表示为,:,y,关于,x,的回归散点图,1-1,回归的概念,从数学上看,在,x,=,x,i,处,,x,i,与一个总体,N,(,2,),的,y,值对应,不是一一对应关系,即不是函数关系;然而,x,i,与 是一一对应关系如果,x,i,与,间存在函数,y,=,f,(,x,),关系,则称它为,y,关于,x,的回归方程回归方程描述了,y,关于,x,的平均变化规律,1-2,直线回归模型,如果,y,关于,x,的回归方程,y,=,f,(,x,),是,则称其为,y,关于,x,的一元线性回归方程,或称为直线回归方程,0,称回归截距,,称为回归系数,是,x,每加一个单位时,y,平均增加的单位(,0,)或减少(,0,)的单位数,.,Y,1,单位,单位,0,X,设,与,X,有线性回归关系,,即,独立观察了,n,个点(,i,,,i,),在,i,处的观察值为,(,i,=1,2,n,),其中,i,是随机误差,相互独立且服从,N,(,0,,,2,),一般线性回归模型,中心化回归模型,标准化线性回归模型,其中,首先能表明,是经过点 的;,进一步表明回归方程是表达,y,随着,x,而平均变化的规律;,其次,标准化模型克服了量纲对回归系数的影响,1,单位,单位,0,Y,X,(,),变化的优点,:,1-3,参数估计及其统计性质,简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小,.,这里的,“,二乘,”,指的是用平方来度量观测点与估计点的远近(在古汉语中,“,平方,”,称为,“,二乘,”,),,“,最小,”,指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小,.,另外,可用最小二乘法估计参数,0,和,一般直线回归方程,中心化直线回归方程,标准化直线回归方程,在 处,,由于正态变量的线性组合仍然服从正态分布,故,b,0,,,b,服从正态分布:,b,0,,,b,均是,y,i,的线性组合:,BL,(Least Squares),最小二乘,BLUE,(Best Linear Ubiased Estimator),最佳线性无偏估计,BLUP,(Best Linear Ubiased Prediction),最佳线性无偏预测,回归方程的统计性质:,在 处:,说明在回归分析中,,n,愈大、,SS,x,愈大(,x,i,愈分散),则回归精度愈高。,易于进行预报。,SS,x,SS,x,1-4,回归平方和与剩余平方和,1,、直线回归的变异来源,的分解图,P,(,x,y,),从上图看到:,上式两端平方,然后对所有的,n,点求和,则有,由 于,所 以,所以有,反映了由于,y,与,x,间存在直线关系所引起的,y,的变异程度,称为回归平方和,记为,SS,R,(,U,),反映了,y,的总变异程度,称为,y,的总平方和,记为,SS,y,反映了除,y,与,x,存在直线关系以外的原因,包括随机误差所引起的,y,的变异程度,称为离回归平方和或剩余平方和,记为,SS,r,(,Q,e,),总变异又可表示为,1.,2,的无偏估计为,2.,回归 存在与否,关键在于,H,0,:,=0,是否成立若,H,0,成立,则回归直线不存在,否则就存在。,说明:,1-5,回归直线的有关假设检验,1,、建立假设,无效假设,H,O,:,=0,,,备择假设,H,A,:,0,。,2,、计算检验统计量,3,、显著性推断,根据,df,1,=1,df,2,=,n,-2,查表,得到临界,F,值,并作出显著性推断。,1-5-1,回归直线的显著性检验,1-5-2,b,的显著性检验,1,、建立假设,无效假设,H,O,:,=0,,,备择假设,H,A,:,0,。,2,、计算检验统计量,3,、显著性推断,根据,df,=,n,-2,查表,得到临界,t,值,并作出显著性推断。,的置信区间为:,F,检验和,t,检验是等价的:,1-5-3,利用相关系数检验方程的显著性,,,在概率论中,两个随机变量,x,与,y,之间线性关系密切的程度用相关系数,来刻画:,协方差,是,的,最大似然估计,并称它为,x,与,y,的简单相关系数,直线回归与简单相关的关系:,愈接近,1,,愈小,回归效果愈好,决定系数,可从回归方程的显著性检验,得到相关系数在无效假设 下的检验:,r,的标准差为:,r,叫做,r,在,水平上的显著临界值。,若,,则接受,1-5-4 b,0,的假设检验,的置信区间为,:,的,回归直线过原点,回归直线不过原点,若回归直线过原点,的置信区间为,:,的,的,t,检验为,1-6,回归分析举例,例,4.1,现有,10,头动物体重与饲料消化量的数据,试建立饲料消耗量对体重的回归方程,解,:,(,1,)计算基本统计量,(,2,)计算相关系数,r,,用它检验回归方程的显著性,查,r,显著值(,P350,,附表,11,):,自由度用,df,n,2,10,2,8,,变数的个数为,2,(,x,y,),表中显示:,r,0.01,0.765,;,直线回归方程极显著地存在。,(,3,),由于回归直线显著存在,进而估计,b,0,和,b,,获得回归方程,的估计为:,(4),如果 有生物学意义或需知道回归直线是否过原点,就需检验,t,0.01(8),=3.355,说明回归直线不过原点。,(,5,):若,b,有专业意义,除了点估计 之外,尚需作,的 置信区间,1-7,预测与控制,当 显著时,可用于预测、控制等,但必须注意,运用时,x,的取值范围只能在拟合回归方程时所用样本的范围内,不能外推。,y,0,和 的 区间预测分别为:,1-7-2,控制,控制问题是预测问题的反问题,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!