两个变量间的线性相关及回归方程的求法专题

上传人:tia****g98 文档编号:137898882 上传时间:2022-08-19 格式:DOC 页数:12 大小:524.51KB
返回 下载 相关 举报
两个变量间的线性相关及回归方程的求法专题_第1页
第1页 / 共12页
两个变量间的线性相关及回归方程的求法专题_第2页
第2页 / 共12页
两个变量间的线性相关及回归方程的求法专题_第3页
第3页 / 共12页
点击查看更多>>
资源描述
两个变量间的线性相关及回归方程的求法专题一、如何认识两个变量间的相关关系相关关系我们可以从以下三个方面加以认识:(1)相关关系与函数关系不同函数关系中的两个变量间是一种确定性关系例如正方形面积S与边长x之间的关系就是函数关系即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系例如人的身高与年龄;商品的销售额与广告费等等都是相关关系(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系然而学会新词并不能使儿童马上长高,而是涉及到第三个因素年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度二、如何判断两个变量线性相关关系1、利用变量相关关系的概念利用变量相关关系的概念判断时,一般是看当一个变量的值一定时,另一个变量是否带有确定性,两个变量之间的关系具有确定关系函数关系;两个变量之间的关系具有随机性,不确定性相关关系。例1、在下列各个量与量的关系中:正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的收入与支出之间的关系;某户家庭用电量与水费之间的关系。其中是相关关系的为 解析:正方体的体积与棱长之间的关系是确定的函数关系;某户家庭用电量与水费之间无任何关系。中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性。点评:解题的关键是首先分析两个量是否有关系,然后判断这种关系是确定性的关系还是随机的不确定性的关系。变式练习1:下列关系中是带有随机性的相关关系的有_。光照时间与果树的亩产量的关系;圆柱的体积与底面直径的关系;自由下落的物体的质量与落地时间的关系;学生的数学成绩与物理成绩。2、利用散点图通过散点图观察它们的分布是否存在一定的规律,直观地判断。例2下面的4个散点图中,两个变量具有相关关系的是( )A B C D 解析:由图可知是一次函数关系,不是相关关系;的所有点在一条直线附近波动,是线性相关关系;不具有相关系;在某曲线附近波动是非线性相关关系,所以两个变量具有相关关系的是,故选C.点评:在考虑两个变量的关系时,可以用画散点图的方法形象直观地反映各对数据的密切程度。变式练习2:以下是某地搜集到的不同楼盘新房屋的销售价(单位:千元)和房屋面积(单位:平方米)的数据:房屋面积(平方米)11511080135105销售价格(万元)24821619429222试判断新房屋的销售价(单位:千元)和房屋面积(单位:平方米)之间是否具有相关关系?3、利用表格通过观察分析表格中的有关数据,看这些数据是否呈现一定的规律性。 例3、下表是随机抽取的9名15岁的男生的身高与体重,判断所给的两个变量之间是否存在相关关系。编号123456789身高(cm)165157155175168157178160163体重(kg)524445555447625053解析:由表格不难看出,同一身高157cm对应着不同的体重44kg和47kg,因此体重不是身高的函数关系。将表格中的数据按身高由小到大重新排列,如下表所示,我们不难发现,随着身高的增长,体重基本上呈增加的趋势,因此身高与体重存在着相关关系。编号326891547身高(cm)155157157160163165168175178体重(kg)454447505352545562点评:这类题目一般是按一定的次序重新排列数据,再看这些数据是否具有规律性。变式练习3:下表是某地的年降雨量与平均气温,判断两者是否具有相关关系?年份2002200320042005200620072008年平均气温()年降雨量()813574701432507677748变式练习答案与提示:1、。2、画出散点图,可以看出新房屋的销售价(单位:千元)和房屋面积(单位:平方米)呈现一定的规律,所以新房屋的销售价(单位:千元)和房屋面积(单位:平方米)具有相关关系。3、因为研究的是某地的年降雨量与平均气温,所以按年平均气温从低到高重新排列如下表:年份2008200420062007200520032002年平均气温()年降雨量()748701507677432574813从表中的数据看某地的年降雨量与平均气温不具有相关关系。三、回归分析对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法两个变量具有相关关系是回归分析的前提(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析 (3)通过散点图的观察,一般地,若图中数据大致分布在一条直线附近,那么这两个变量近似成线性相关关系(4)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义四、回归直线方程1、求回归直线方程的步骤:第一步:列表,;第二步:计算,;第三步:代入公式计算,的值;第四步:写出直线方程。2、范例剖析例1 测地某地10对父子身高(单位:英寸)如下:父亲身高()60626465666768707274儿子身高()63.665.26665.566.967.167.468.370.170如果与之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归直线方程。为了使计算更加有条理,我们通过制作表格来先计算出,和;再计算出,再利用公式和来计算回归系数,最后写出回归直线方程。解析:先将两个变量的数字在表中计算出来,如下表所示:序号16063.636004044.96381626265.238444251.044042.43646640964356422446565.542254290.254257.556666.943564475.614415.466767.144894502.414495.776867.446244542.764583.287068.349004664.89478197270.151844914.015047.2107470547649005180668670.14479444941.9344842.4由上表可得,。代入公式得,故所求回归直线方程为。当时,所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸。评注:注意回归直线方程中一次项系数为,常数项为,这与一次函数的习惯表示不同。例2 有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化。下面是实验的步骤:机床运转的速度(转/秒)每小时生产二级品的数量(个)851281491611(1)作出散点图;(2)求出机床运转的速度与每小时生产二级品数量的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒? 分析:散点图形象地反映了各对数据的密切程度,通常在尚未判断两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求其回归直线方程。解析:(1)散点图如下图所示:(2)易求得,0.7286,0.8571,所求回归直线方程为。(3)依题意,要使,只要0.72860.857110,解得14.9013,即机床的运转速度不能超过14.9013转/秒。评注:利用最小二乘法求线性回归直线方程有着广泛的应用,请同学们联系实际,熟练掌握。3、知能展示1为了研究三月下旬的平均气温()与四月二十号前棉花害虫化蛹高峰日()的关系,某地区观察了1996年至2001年的情况,得到下面的数据:年份19961997199819992000200124.429.632.928.730.328.9(天)19611018据气象预测,该地区在2002年三月下旬平均气温为,试估计2002年四月化蛹高峰日为哪天。2某地区第一年到第六年的用电量与年次的统计数据如下表: 用电单位:亿度年次123456用电量10.411.413.114.214.815.7 (1)与是否具有线性相关关系? (2)如果与具有线性相关关系,求回归直线方程。答案: 1提示:估计该地区2002年4月12日或13日为化蛹高峰日。 2(1)线性相关;(2)五、相关性和最小二乘估计易错点例析根据统计数据作出散点图,判定两个变量且有线性相关关系,然后利用最小二乘法求出回归直线方程,并利用回归方程进行预测和估计,这是一个完整的双变量统计的过程。在这一统计分析过程中,有以下几点易于出错,初学者要特别注意。一、把函数关系当作相关关系例1、下列两变量中具有相关关系的是()(A)正方体的体积与边长;(B)匀速行驶的车辆的行驶距离与时间;(C)人的身高与体重;(D)人的身高与视力错解:选(A)或(B)。分析:函数关系的两个变量之间是一种确定的关系,而相关关系的两个变量之间是一种不确定的关系,因此,不能把相关系等同于函数关系。本例中,(A)和(B)都是函数关系,(D)则无相关关系。正解选(C)。例2、下列各关系中,不属于相关关系的是()(A)名师出高徒(B)球的表面积与体积(C)家庭的支出与收入(D)人的年龄与体重错解:选(A)。分析:函数关系是一种因果关系,但相关关系不一定是因果关系。有名的老师能教出高明的徒弟,通常情况下,高水平的老师有很大的趋势教出高水平的学生,但是,高水平的老师所教的学生不一定都是高水平的,也就是说,他们之间没有困果关系的,但有相关关系。正解选(B),球的表面积与体积之间是函数关系。二、把不相关或非线性相关当作线性相关例3下表是某地的年降雨量与年平均气温,能否根据这些数据估计年平均气温为13.69时的年降雨量?年平均气温()12.5112.8412.8413.6913.3312.7413.05年降雨量(mn)748542507813574701432错解:按照最小二乘法可求出这两个变量之间的线性回归方程,进而计算出估计值;分析:以x轴为年平均气温,y轴为年降雨量,作出相应的散点图如下:可以发现图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要用回归直线进行拟合,用最小二乘法公式求得回归直线也是没有意义的。例4某机构曾研究温度对某种细菌的影响,在一定温度下,经x单位时间,细菌的数量指数为y,数据如下:(1,2) (2,5) (3,10) (4,17) (5,26)(6,37) (7,50) (8,65) (9,82) (10,101)问:关于这两个变量的关系,你能得出什么结论?错解:判断两个变量是线性相关,按最小二乘法的步骤,求出线性回归方程;分析:事实上我们观察可以发现2121,5221,10321,,17421,,26521,因此,我们可以认为x与y之间的关系是y=x2+1,并非是线性相关关系。避免这类错误的方法很简单,那就是根据已经数据作出散点图,进行曲线拟合,从而判断两个变量是线性相关还是非线性相关或不相关。 三、把估计值当作实际值例5一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁)3456789身高()94.8104.2108.7117.8124.3130.8139.0由此她用最小二乘法求出了身高y与年龄x的回归直线方程,并预测儿子10岁时的身高,则下列的叙述正确的是( )(A) 儿子10岁时的身高一定是145.83(B) 儿子10岁时的身高在145.83以上(C) 她儿子10岁时的身高在145.83左右(D) 她儿子10岁时的身高在145.83以下错解:(A)分析:显然,年龄与身高之间是一种相关关系,利用最小二乘法求出的回归方程是对两个变量的最佳线性拟合,我们可以利用回归方程对数量变化做出预测,但这只是估计事物发展的一个最可能出现的结果,并非一定出现。实际上,身高并非只由年龄一个因素决定,儿子10岁时的身高比预测值有误差也是正常的,正确答案为(C)。四、计算失误例6已知回归直线的回归系数b的估计值是1.23,5,4,则回归直线的方程是( ) (A)=1.23x4 (B)=0.9425x+1.23 (C)=1.23x+0.08 (D)=0.08x+1.23错解:(B)分析:回归直线方程为bxa,其中b是回归系数,而一次函数的习惯写法为yaxb,错解把它们混淆了。对回归方程bxa有ab,即ba,因此回归直线一定经过点(,)。正确答案为(C)。例7为分析初中升学的数学成绩对高一学生学习情况的影响,在高一年级学生中随机抽取了10名学生,他们的入学成绩与期末考试成绩如下表:学生编号12345678910入学成绩63674588817152995876期末成绩65785282928973985675(1) 若变量与之间具有线性相关关系,求出回归直线的方程;(2) 若某学生的入学成绩为80分,试估计他的期末成绩错解: (1)故所求线性回归直线方程是(2)某学生入学成绩为80分,代入上式可求得。显然这是不符合实际的。分析:错解求出a、b后,把回归直线方程公式中bxa的a、b位置互换了;事实上,回归方程应为,把这个学生的入学成绩80代入这个方程可出,即这个学生期末成绩的预测分值约为84分。一般地,用最小二乘法求回归直线方程的步骤为:第一步:列表;第二步:列表计算;第三步:代入公式计算的值;第四步:写出直线方程。其中的数据计算往往要借助计算器或计算机来完成,因此在数据输入时也细心核对,防止出错。 变量间的相关关系练习一一选择题1以下两变量之间具有相关关系的是( )A正方形的体积与边长 B,人的身高与体重 C匀速行驶车辆的行驶路程与时间 D,球半径与表面积。2西瓜藤的的长短与西瓜的产量( )A确定性关系 B,相关关系 C,函数关系 D,无任何联系。3下列说法正确的是( )A任何两个变量都具有相关关系 B,光照时间和果树的单产量不具有相关关系。C农作物的产量与施肥量之间是一种确定性关系 D某产品的产量与其销售之间是一种非确性关系。4.有关线性回归的说法,不正确的是 ( ) A.相关关系的两个变量不是因果关系 B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系 D.任一组数据都有回归方程5.r是相关系数,则结论正确的个数为 r1,0.75时,两变量负相关很强r0.75,1时,两变量正相关很强r(0.75,0.3或0.3,0.75)时,两变量相关性一般r=0.1时,两变量相关很弱A.1 B.2 C.3 D.46散点图的作用( )A查找个体个数 B,比较个体数据大小关系 C探究个体分类 D,粗略判断变量是否具有相关关系二填空题7现有5组数据、,去掉 组数据后,剩下的4组数据的线性相关性最大8有一组独立观测据,则回归直线方程=bx+a的系数b=_。9.线性回归方程=bx+a过定点_.10对于回归方程:,则a=_。三解答题11. 假设关于某种设备的使用年限和支出的维修费用(万元),有以下的统计资料:使用年限23456维修费用2.23.85.56.57.0(1)画出散点图;(2)求支出的维修费用与使用年限的回归方程;(3)估计使用年限为10年时,维修费用是多少? 12下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗 (吨标准煤)的几组对照数据 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:)变量间的相关关系练习二 一选择题1.下面哪些变量是相关关系( )A.出租车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁的大小与质量2单位产品成本与其产量的相关关系;单位产品成本与单位产品原材料消耗量的相关关系( )A前者是正相关,后者是负相关 B前者是负相关,后者是正相关C两者都是正相关 D两者都是负相关3在下列各图中,每个图的两个变量具有相关关系的图是( ) (1) (2) (3) (4)A(1)(2) B(1)(3) C(2)(4) D(2)(3)4 某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程=a+bx经计算,方程为20-0.8x,则该方程参数的计算 ( ) Aa值是明显不对的 Bb值是明显不对的 Ca值和b值都是不对的 Da值和b值都是正确的二填空题5实验测得四组的值为,则与的回归直线方程 6.已知回归方程=4.4x+838.19,则可估计x与y的增长速度之比约为_.三解答题(数据处理可借助计算器)7已知10只狗的血球体积及红血球的测量值如下45424648423558403950y6.536.309.257.506.995.909.496.206.557.72(血球体积,),(血红球数,百万)(1) 画出上表的散点图;(2)求出回归直线并且画出图形 (3)回归直线必经过的一点是哪一点?8.某市近10年的煤气消耗量与使用煤气户数的历史资料如下:年 份1993199419951996199719981999200020012002x用户(万户)11.21.61.822.53.244.24.5y (百万立米)679.81212.114.5202425.427.5(1)检验是否线性相关;(2)求回归方程;(3)若市政府下一步再扩大5千煤气用户,试预测该市煤气消耗量将达到多少.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!