资源描述
1.2回归分析,第1章统计案例,学习目标1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.,问题导学,达标检测,题型探究,内容索引,问题导学,思考某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:,请问如何表示年推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?,知识点一线性回归模型,答案画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.,梳理线性回归模型(1)随机误差具有线性相关关系的两个变量的取值x,y,y的值不能由x完全确定,可将x,y之间的关系表示为yabx,其中是确定性函数,称为随机误差.(2)随机误差产生的主要原因所用的不恰当引起的误差.忽略了.存在误差.,abx,确定性函数,某些因素的影响,观测,(3)线性回归模型中a,b值的求法y称为线性回归模型.,abx,(4)回归直线和线性回归方程,回归值,回归截距,回归系数,知识点二样本相关系数r,答案不一定.,答案越小越好.,梳理样本相关系数r及其性质,(1)r.(2)r具有以下性质:|r|.|r|越接近于,x,y的线性相关程度越强.|r|越接近于,x,y的线性相关程度越弱.,1,1,0,1.:变量x,y不具有线性相关关系.2.如果以95%的把握作出判断,那么可以根据10.950.05与n2在教材附录1中查出一个r的临界值r0.05(其中10.950.05称为检验水平).3.计算.4.作出统计推断:若|r|,则否定H0,表明有的把握认为x与y之间具有线性相关关系;若|r|r0.05,则原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.,提出统计假设H0,样本相关系数r,知识点三对相关系数r进行显著性检验的基本步骤,r0.05,95%,没有理由拒绝,思考辨析判断正误1.求线性回归方程前可以不进行相关性检验.()2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.()3.利用线性回归方程求出的值是准确值.(),题型探究,例1某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:,解答,类型一求线性回归方程,解如图:,(1)请画出上表数据的散点图;,解答,(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.,解答,解由(2)中线性回归方程可知,当x9时,,反思与感悟(1)求线性回归方程的基本步骤列出散点图,从直观上分析数据间是否存在线性相关关系.,写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义.,跟踪训练1某班5名学生的数学和物理成绩如下表:,解答,(1)画出散点图;,解散点图如图.,(2)求物理成绩y对数学成绩x的线性回归方程;,解答,(3)一名学生的数学成绩是96,试预测他的物理成绩.,解答,解答,例2现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下表:,请问:这10名学生的两次数学成绩是否具有线性关系?,类型二线性回归分析,由检验水平0.05及n28,在附录1中查得r0.050.632.因为0.7510.632,由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.,反思与感悟相关关系的两种判定方法(1)利用散点图判定,(2)利用相关系数判定,跟踪训练2一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转的速度而变化,下表为抽样试验的结果:,对变量y与x进行线性相关性检验.,解答,由检验水平0.05及n22,在教材附录1中查得r0.050.950,因为rr0.05,所以y与x具有线性相关关系.,例3下表为收集到的一组数据:,(1)作出x与y的散点图,并猜测x与y之间的关系;,类型三非线性回归分析,解作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线yc1ec2x的周围,其中c1,c2为待定的参数.,解答,(2)建立x与y的关系;,解答,解对两边取对数把指数关系变为线性关系,令zlny,则有变换后的样本点应分布在直线zbxa,alnc1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为,求得线性回归方程为,(3)利用所得模型,估计当x40时y的值.,解答,反思与感悟非线性回归问题的处理方法(1)指数型函数yebxa函数yebxa的图象,处理方法:两边取对数,得lnylnebxa,即lnybxa.令zlny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.,(2)对数型函数yblnxa函数yblnxa的图象:,处理方法:设xlnx,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.(3)ybx2a型处理方法:设xx2,原方程可化为ybxa,再根据线性回归模型的方法求出a,b.,跟踪训练3已知某种食品每千克的生产成本y(元)与生产该食品的重量x(千克)有关,经生产统计得到以下数据:,通过以上数据,判断该食品的生产成本y(元)与生产的重量x(千克)的倒数之间是否具有线性相关关系.若有,求出y关于的回归方程,并估计一下生产该食品500千克时每千克的生产成本约是多少.(精确到0.01),解答,根据上述数据可求得相关系数,所以估计生产该食品500千克时每千克的生产成本约是1.14元.,达标检测,1.设有一个线性回归方程21.5x,当变量x增加1个单位时,y平均_个单位.,答案,1,2,3,4,5,减少1.5,解析由回归方程中两个变量之间的关系可以得到.,解析,答案,2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是_.(填序号),1,2,3,4,5,解析由图易知两个图中样本点在一条直线附近,因此适合用线性回归模型.,解析,3.某厂节能降耗技术改造后,在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表:,1,2,3,4,5,答案,3,根据上表提供的数据,求出y关于x的线性回归方程为0.7x0.35,则上表中的t_.,答案,解析,4.下表是x和y之间的一组数据,则y关于x的回归直线必过点_.,1,2,3,4,5,(2.5,4),1,2,3,4,5,5.已知x,y之间的一组数据如下表:,解答,x1y1x2y2x3y3x4y40113253734,,1,2,3,4,5,(2)已知变量x与y线性相关,求出回归方程.,解答,回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等).,规律与方法,(4)按一定规则估计回归方程中的参数.,本课结束,
展开阅读全文