资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,回归分析,1,、两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题,1,:现实生活中两个变量间的关系有哪些呢?,相关关系:,对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。,思考,:相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系,函数关系是一种理想的关系模型,相关关系在现实生活中大量存在,是更一般的情况,.,问题,2,:对于线性相关的两个变量用什么方法来刻划之间的关系呢?,2,、最小二乘估计,最小二乘估计下的线性回归方程:,对一作直线运动的质点的运动过程作了,8,次观测,得到下表,试估计,x=9s,时的位置,y,的值。,时刻,x/s,1,2,3,4,5,6,7,8,位置观测值,y/cm,5.54,7.52,10.02,11.73,15.69,16.12,16.98,21.06,例如:,i,1,2,3,4,5,6,7,8,x,i,1,2,3,4,5,6,7,8,4.50,y,i,5.54,7.52,10.02,11.73,15.69,16.12,16.98,21.06,13.08,x,i,y,i,5.54,15.04,30.06,46.92,78.45,96.72,118.9,168.5,560.1,x,i,2,1,4,9,16,25,36,49,64,204,根据线性回归的系数公式,可以得到,a=3.5361,b=2.1214,得到线性回归方程,=3.5361+2.1214,x,当,x,=9,时,可以估计其位置值为,22.6287.,3,、,回归分析的基本步骤,:,画散点图,求回归方程,预报、决策,数学必修,统计,画散点图,了解最小二乘法的思想,求回归直线方程,用回归直线方程解决应用问题,4,、,线性回归模型,其中,a+bx,是确定性函数,,是随机误差,注:,产生的主要原因:,(1),所用确定性函数不恰当;,(2),忽略了某些因素的影响;,(3),观测误差,.,思考,:在时刻,x=9s,时,质点运动位置一定是,22.6287cm,吗?,称为,线性回归模型,.,应该考虑下面两个问题,:,1),模型是否合理,;,2),在模型合理的情况下,如何估计,a,b.,探究,在模型合理的情况下,如何估计,a,b,?,线性,回归方程,1,)称为样本点的中心,.,2,)称为回归截距,;,称为回归系数,.,称为回归值,.,3,)的意义是:以 为基数,,x,每增加,1,个单位,,y,相应地平均增加 个单位,.,例题,1.,一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了,10,次试验,测得数据如下:,零件数(,x,),个,10,20,30,40,50,60,70,80,90,100,加工时间,y,62,68,75,81,89,95,102,108,115,122,(1)y,与,x,是否具有线性相关?,(2),若,y,与,x,具有线性相关关系,求回归直线方程,.,(3),预测加工,200,个零件需花费多少时间?,分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断,x,与,y,是否具有线性相关才可以求解后面的问题,.,作散点图如下:,不难看出,x,y,成线性相关,.,解,(,1,)列出下表:,i,1,2,3,4,5,6,7,8,9,10,x,i,10,20,30,40,50,60,70,80,90,100,y,i,62,68,75,81,89,95,102,108,115,122,x,i,y,i,620,1360,2250,3240,4450,5700,7140,8640,10350,12200,问题,:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义,.,在怎样的情况下求得的回归直线方程才有实际意义,?,即建立的线性回归模型是否合理,?,探究,怎样判断模型是否合理呢,?,散点图只是形象地描述点的分布情况,它的“线性”是否,明显只能通过观察,要想把握其特征,必须进行定量的研究,相关系数,1.,计算公式,2,相关系数的性质,(1)|r|1,(2)|r|,越接近于,1,,相关程度越强;,|r|,越接近于,0,,相关程度越弱,注,:,b,与,r,同号,问题:达到怎样程度,,x,、,y,线性相关呢?它们的相关程度怎样呢?,建构数学,负相关,正相关,相关系数,正相关;负相关通常,,r,-,1,-,0.75-,负相关很强,;,r,0.75,1,正相关很强,;,r,-0.75,-0.3-,负相关一般,;,r,0.3,0.75,正相关一般,;,r,-,0.25,0.25-,相关性较弱,;,相关系数,r,的绝对值与,1,接近到什么程度才表明利用,线性回归模型比较合理呢,?,对,r,进行,显著性检验,检验方法步骤如下,:,1.,提出统计假设,H,0:,变量,x,y,不具有线性相关关系,;,2.,如果以,95%,的把握作出推断,那么可以根据,1-0.95,(,其中,1-0.95=0.05,称为检验水平,),3.,计算样本相关系数,r,有线性相关关系,=0.05,与,n-2,在附录,1,中查出一个,r,的临界值,4.,作出统计推断,:,若,|r|,则否定,H,0,表明有,95%,的把握认为,x,与,y,之间具有线性相关关系,;,若,|r|,则没有理由拒绝原来的假设,H,0,即,就目前数据而言,没有充分理由认为,y,与,x,之间,例题,:,下表是随机抽取的,8,对母女的身高数据,试根据这些数据探讨,y,与,x,之间的关系,.,母亲身高,x/cm,154,157,158,159,160,161,162,163,女儿身高,y/cm,155,156,159,162,161,164,165,166,
展开阅读全文