概率论与数理统计91

上传人:t****d 文档编号:243338313 上传时间:2024-09-21 格式:PPT 页数:46 大小:1.53MB
返回 下载 相关 举报
概率论与数理统计91_第1页
第1页 / 共46页
概率论与数理统计91_第2页
第2页 / 共46页
概率论与数理统计91_第3页
第3页 / 共46页
点击查看更多>>
资源描述
Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to Edit Master Title Style,Click to edit master text styles,Second level,Third level,Fourth level,Fifth level,*,2,第九章 回归分析,一元线性回归分析,多元线性回归分析简介,2,3,在现实问题中处于同一个过程中的一些变量往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两类,.,一类是,确定性关系,,即数学上的函数关系,.,引 言,例如,:,在匀速直线运动中,当速度 给定时,路程 与 运动时间,的,关系,.,圆的面积 与半径 之间的关系,.,3,4,另一类是,非确定性关系,,,又叫,相关关系,.,例如,:,小麦亩产量 与施肥量 ,小麦品种 ,浇水量之间的关系,.,4,变量之间的关系,确定性关系,相关关系,确定性关系,身高和体重,相关关系,相关关系的特征是,:,变量之间的关系很难用一,种精确的方法表示出来,.,5,确定性关系,和,相关关系,的联系,由于存在测量误差等原因,确定性关系在实际,问题中往往通过相关关系表示出来,;,另一方面,当对,事物内部规律了解得更加深刻时,相关关系也有可,能转化为确定性关系,.,回归分析,处理变量之间的相关关系的一,种数学方法,它是最常用的数理统计方法,.,线性回归分析,非线性回归分析,回,归,分,析,一元线性回归分析,多元线性回归分析,6,7,研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为,回归分析,.,只有一个自变量的回归分析叫做,一元回归分析,多于一个自变量的回归分析叫做,多元回归分析,自变量与因变量呈直线相关的回归称为,线性回归,自变量与因量不呈直线相关的回归称为,非线性回归,7,8,利用回归分析这种统计方法,可以从一个(或几个)可控变量的取值去估计作为因变量的随机变量的取值,.,具体地说,回归分析主要包括三个方面的内容:,提供建立有相关关系的变量之间的数学关系式(通常称之为,经验公式,)的一般方法;,判别所建立的经验公式是否有效,并从影响随 机变量的诸变量中判别哪些变量的影响是显著 的,哪些是不显著的;,利用所得的经验公式进行,预测和控制,.,8,9,1,散点图与经验公式,在一元回归分析里,我们要考虑的是,随机变量 与一普通变量 之间的关系,.,对有一定联系的两个变量:与 ,在观测中得到若干对数据,的基础上,用什么方法来获得这两个变量之间(对)的经验公式呢?为说明问题,先看一个例子,.,1,一元线性回归分析,一 一元线性回归模型,9,例,1,在某种产品表面进行腐蚀刻线试验,得腐蚀时间 与腐蚀深度 相对应的一组数据如下表:,时间,5,10,15,20,30,40,50,60,70,90,120,深度,6,10,10,13,16,17,19,23,25,29,46,我们希望由此找出两个变量之间的关系式.,10,分别对应到平面上的,11,个点(如图,9-1,),并称这张图为,散点图,.,11,散点图给了我们很多启示.首先,这些点虽然是杂乱的,但大体上分布在某条直线的周围.也就是说,腐蚀时间与腐蚀深度大致成线性关系: (1.1)这里,在 上加“”是为了区别于 的实际值 .,至此,在散点图的启示下,经验公式的形式已完全确定,即是线性的,.,因此,只需要确定,.,通常 称为,回归系数,关系式 称为,回归直线,.,12,一元线性回归问题,建立回归模型,一元线性回归模型,13,2,一元线性回归系数,a,b,的最小二乘估计,要求出回归直线,只需求出 .从散点图来看,要求出 是不困难的,在散点图上画一条直线,使得直线总的来看最“接近”全部点,问题是如何将这种思想精确化和数量化.,设给定 个不全相同的点 ,对平面上任一条直线我们用数量 (1.3)来刻画点 到直线 的远近程度.于是 (1.4)便定量地描述了直线距离这 个点的总的远近程度.,14,这个量是随着不同的直线而变化的,也就是说,是随,不同 而变化的,它是 的二元函数,记为,(1.5),于是,要找一直线,使得该直线总的来看最“接近”这个点的问,题,就转化为求二元函数 的最小值问题,由于是个平,之和,所以求 最小值点的方法习惯上称为,最小二乘法,.,回归系数的最小二乘估计与最大似然估计有什么不同,?,它们的结果是否相同,?,15,的最小值点,通常利用微积分中的极值原理,即解方程组,整理得,正规方程组,16,故正规方程组有唯一的一组解,.,解得,的最小二乘估计值为,17,回归方程,回归直线,18,例,2,(,续例,1),设在例,1,中的随机变量符合一元线性回归模型的条件,求关于的经验回归方程,.,解:,3,参数 的估计,定理一,在一元线性回归模型中, ,所,以,.,19,其中,表示观测数,据 与回归直线上对应点 的纵坐标之差 的,平方和,.,称为,剩余平方和,.,称 为 处的,残差,,所,以又称 为,残差平方和,.,说明,由定理一可知,的无偏估计为,.,20,4 的分布,定理,二,在一元线性回归模型中,(1),(2),(3),(4),相互独立,.,21,三 线性回归效果的显著性检验,下面介绍三种常用的检验方法,它们本质上是相同的,.,1,检验法,22,给定显著性水平,检验法则为,若,则拒绝,认为回归效果显著,;,若,则拒绝,认为回归效果不显著,;,23,2,检验法,可以证明当,为真时,若,则拒绝,认为回归效果显著,;,若,则拒绝,认为回归效果不显著,;,给定显著性水平,检验法则为,:,24,3,相关系数 检验法,若,则拒绝,认为回归效果显著,;,若,则拒绝,认为回归效果不显著,;,给定显著性水平,检验法则为,:,25,例,3,用 检验法及相关系数检验法检验例,1,中的线性回归效果是否显著,.(,取,),解:,26,(2),相关系数检验法,所以拒绝,认为回归效果显著,.,同理可用,检验法,27,四,利用一元线性回归方程进行预测和控制,所谓,预测,,就是对固定 的的情况下预测 的观测值,.,所谓,控制,,就是通过控制 的值,以便把的 取值控制在指定的范围内,.,预测(预报)与控制实际上是一个问题的两个方面,问题的一方面解决之后,另一方面也就随之解决了,.,28,1,预测,点预测,区间预测,29,作为 的预测值,即,(,2,)区间预测,所谓区间预测就是求 的区间估计,.,因为可以证明,(,1,)点预测,30,所以,对于给定 的及置信度,的预测区间即置信区间为,:,在线性回归确定后,影响预测精度的主要因素有哪些,?,31,例,4,(,例,1,续,),讨论腐蚀深度的预测问题,.,现测得腐蚀时间为,75,秒,试求腐蚀深度的预测区间,.( ),解:,32,2,控制,控制,是预测的反问题,即要求 以概率 落于某区间,时,应控制 在什么范围,.,这相当于求出相应的,使得当 或 时,以概率 落于,某区间,.,这里,我们只讨论 很大的情形,.,令,33,解出 ,得,当 时,控制区间为,当 时,控制区间为,34,例,5,(,例,1,续,),讨论腐蚀时间的控制问题,.,若要求腐蚀,深度在之 间,问腐蚀时间应如何控制,?,解:,35,五,可线性化的非线性回归问题,在许多实际问题中,变量之间的关系可以不是线性相关关系,而是某种非线性相关关系,.,但在某些情况下,我们可以通过一些适当的,变量变换,将变量间的关系化为线性的形式,.,下面通过例子来说明解决的方法,.,首先,介绍几种常见的可转化为一元线性回归的模型,.,情形,1.,情形,2.,本 节 完,36,身高,143,145,146,147,149,150,153,154,腿长,88,85,88,91,92,93,93,95,身高,155,156,157,158,159,160,162,164,腿长,96,98,97,96,98,99,100,102,练习,1,测得,16,名女子的身高和腿长如下,(,单位,:cm):,试研究这些数据之间的关系,.,37,练习,2,某工厂在分析产量与成本关系时,选取十个生,产小组作样本,收集到如下数据,:,产量,x,(,千件,),40,42,48,55,65,成本,y,(,千元,),150,140,152,160,150,产量,x,(,千件,),79,88,100,120,140,成本,y,(,千元,),162,175,165,190,185,(1),求,y,对,x,的线性回归方程,ax,+,b,;,(2),检验回归方程的显著性,(,检验水平为,0.05);,(3),求回归系数的,95%,置信区间,;,(4),取,x,0,=90 ,求,y,0,的预测值及,95%,的预测区间,.,38,于是,可得,的 估计值为,解,:,39,从而回归方程为 :,40,解:,(1),用 检验法检验,.,由例,1,可知,所以拒绝,认为回归效果显著,.,41,解:,根据例,2,知回归方程为 ,把 代入回归直线方程,得,42,要求腐蚀深度在 之间,近似地有,即腐蚀时间应控制在,解:,43,一元线性回归分析小结,1.,回归分析的任务,2.,一元线性回归的步骤,3.,可化为一元线性回归的问题,研究变量之间的相关关系,(1),推测回归函数,; (2),建立回归模型,;,(3),估计未知参数,; (4),进行假设检验,;,(5),预测与控制,.,关键,:,选择适当的,变量代换,.,44,(1),数学模型,(2),线性回归方程,4.,一元线性回归,45,(3),线性假设的显著性检验,46,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!