最新1.1回归分析的基本思想及其初步应用习题课

上传人:麥** 文档编号:87851817 上传时间:2022-05-10 格式:PPT 页数:33 大小:715KB
返回 下载 相关 举报
最新1.1回归分析的基本思想及其初步应用习题课_第1页
第1页 / 共33页
最新1.1回归分析的基本思想及其初步应用习题课_第2页
第2页 / 共33页
最新1.1回归分析的基本思想及其初步应用习题课_第3页
第3页 / 共33页
点击查看更多>>
资源描述
1.1回归分析的基本思想及其初步应用习题课我们的梦向往的地方用自己的聪明和勤奋,打造一个最优秀的自己1.1回归分析的基本思想及其初步应用习题课 北京师范大学是教育部直属重点大学,北京师范大学是教育部直属重点大学,是一所以教师教育、教育科学和文理基础是一所以教师教育、教育科学和文理基础学科为主要特色的著名学府。学校的前身学科为主要特色的著名学府。学校的前身是是1902年创立的京师大学堂师范馆,年创立的京师大学堂师范馆,1908年改称京师优级师范学堂,独立设校。年改称京师优级师范学堂,独立设校。1912年改名为北京高等师范学校。年改名为北京高等师范学校。1923年年更名为北京师范大学,成为中国历史上第更名为北京师范大学,成为中国历史上第一所师范大学。一所师范大学。1931年、年、1952年北平女子年北平女子师范大学、辅仁大学先后并入北京师范大师范大学、辅仁大学先后并入北京师范大学。学。 1.1回归分析的基本思想及其初步应用习题课1.1回归分析的基本思想及其初步应用习题课复习回顾:复习回顾:2.bn nn ni ii ii i i ii i= =1 1i i= =1 1n nn n2 22 22 2i ii ii i= =1 1i i= =1 1a a = =y y- -b bx x( (x x - -x x) )( (y y - -y y) )x x y y - -n nx xy y= =( (x x - -x x) )x x - -n nx x1.回归直线的方程回归直线的方程: axby1.1回归分析的基本思想及其初步应用习题课我们又引入相关指数我们又引入相关指数R2来刻画回归的效果:来刻画回归的效果:niiniiyyyyR12122)()(1残差平方和残差平方和总体偏差平方和总体偏差平方和当当R2越接近于越接近于1,说明解释变量和预报变量说明解释变量和预报变量之间的相关性越强之间的相关性越强,如果同一个问题如果同一个问题,采用采用不同的回归方法分析不同的回归方法分析,我们可以通过我们可以通过选择选择R2大的来作为回归模型大的来作为回归模型1.1回归分析的基本思想及其初步应用习题课相关系数相关系数 相关系数的性质相关系数的性质: : (1)|r|1 (1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接近于越接近于0 0, 相关程度越弱相关程度越弱n ni ii ii i= =1 1n nn n2 22 2i ii ii i= =1 1i i= =1 1( (x x - - x x) )( (y y - - y y) )r r = =( (x x - - x x) )( (y y - - y y) )如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱?0.751, 1, 0.75, 0 25,0.25,rrr 当, 表明两个变量正线性相关很强;当表明两个变量负线性相关很强;当.表明两个变量线性相关性较弱。问题:问题:达到怎样程度,达到怎样程度,x、y线性相关呢?线性相关呢?它们的相关程度怎样呢?它们的相关程度怎样呢?1.1回归分析的基本思想及其初步应用习题课基本步骤基本步骤抽取样本抽取样本, ,采集数据采集数据作出散点图作出散点图确定类型确定类型, ,求回归方程求回归方程残差分析残差分析相关指数相关指数判定拟合程度判定拟合程度1.1回归分析的基本思想及其初步应用习题课案例案例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关。现有关。现收集了收集了7组观测数据列于表中:组观测数据列于表中:(1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并之间的回归方程;并预测温度为预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了)你所建立的模型中温度在多大程度上解释了产卵数的变化?产卵数的变化? 温度温度xoC21232527293235产卵数产卵数y/个个711212466115325非线性回归问题非线性回归问题1.1回归分析的基本思想及其初步应用习题课假设线性回归方程为假设线性回归方程为 :=bx+a选选 模模 型型由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2= =r r2 20.8640.8642 2=0.7464=0.7464估计参数估计参数 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。选变量选变量所以,二次函数模型中温度解释了所以,二次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。探索新知探索新知画散点图画散点图050100150200250300350036912151821242730333639方案1分析和预测分析和预测当当x=28时,时,y =19.8728-463.73 93一元线性模型一元线性模型1.1回归分析的基本思想及其初步应用习题课奇怪?奇怪?9366 ?模型不好?模型不好?1.1回归分析的基本思想及其初步应用习题课 y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案2问题问题选用选用y=bx2+a ,还是,还是y=bx2+cx+a ?问题问题3 产卵数产卵数气温气温问题问题2如何求如何求a、b ?合作探究合作探究 t=x2二次函数模型二次函数模型1.1回归分析的基本思想及其初步应用习题课方案2解答平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作散点图,并由计算器得:作散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为y=y=0.3670.367t t-202.543-202.543,相关指数,相关指数R R2 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得: y=y=0.3670.367x x2 2 -202.543 -202.543当当x x=28=28时时,y y=0.367=0.36728282 2- -202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t1.1回归分析的基本思想及其初步应用习题课问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系21c xyce问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气温气温指数函数模型指数函数模型方案3合作探究合作探究对数对数1.1回归分析的基本思想及其初步应用习题课方案3解答温度温度xoC21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44 y 44 ,指数回归,指数回归模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为0.272x-3.849 .ye22111221lnln()lnlnlnlnlnc xc xycececc xec xc 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得21c xyce令令 ,则,则 就转换为就转换为z=bx+a.z=bx+a.12ln,ln,zy ac bc21c xyce z=0.272x-3.849 ,相关指数相关指数R R2 2=0.98=0.981.1回归分析的基本思想及其初步应用习题课最好的模型是哪个最好的模型是哪个? 产卵数产卵数气温气温产卵数产卵数气温气温线性模型线性模型二次函数模型二次函数模型指数函数模型指数函数模型1.1回归分析的基本思想及其初步应用习题课比一比比一比函数模型函数模型相关指数相关指数R2线性回归模型线性回归模型0.7464二次函数模型二次函数模型0.80指数函数模型指数函数模型0.98最好的模型是哪个最好的模型是哪个?1.1回归分析的基本思想及其初步应用习题课回归分析(二)回归分析(二)(1)0.2723.849(2)2y,y0.367202.543.xex则回归方程的残差计算公式分别为:则回归方程的残差计算公式分别为:由计算可得:由计算可得:(1)(1)0.2723.849(2)(2)2,1,2,.,7;0.367202.543,1,2,.,7.xiiiiiiiieyyyeieyyyxix21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968(1) e(2) e(1)(2)1550.538,15448.431.QQ因此模型(因此模型(1)的拟合效果远远优于模型()的拟合效果远远优于模型(2)。)。1.1回归分析的基本思想及其初步应用习题课练习:练习:为了研究某种细菌随时间为了研究某种细菌随时间x x变化,繁殖的个数,变化,繁殖的个数,收集数据如下:收集数据如下:天 数天 数 x /x /天天 1 1 2 2 3 34 4 5 56 6繁殖个数繁殖个数y/y/个个 6 6 1212 2525 4949 9595190190 (1 1)用天数作解释变量,繁殖个数作预报变量,作出这些)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;数据的散点图; (2) 描述解释变量与预报变量描述解释变量与预报变量 之间的关系;之间的关系; (3 3) 计算残差、相关指数计算残差、相关指数R R2 2. .天数天数繁殖个数繁殖个数解:解:(1)散点图如右所示散点图如右所示1.1回归分析的基本思想及其初步应用习题课 (2 2)由散点图看出样本点分布在一条指数函数)由散点图看出样本点分布在一条指数函数y= y= 的周的周围,于是令围,于是令Z=lny,Z=lny,则则2C x1eCx x1 12 23 34 45 56 6Z Z1.791.792.482.483.223.223.893.894.554.555.255.25由计数器算得由计数器算得 则有则有Z=0.69X 1.1120.69x 1.112 y=e y6.066.0612.0912.0924.0924.0948.0448.0495.7795.77190.9190.9y y6 61212252549499595190190n22ii=11e()3.1643,niiiyyn222i1i=1()yny25553.3.niiyy(3)即(解释变量)天数即(解释变量)天数解释了解释了99.99%(预报变量)繁殖细菌得预报变量)繁殖细菌得个数个数23.164310.9999.25553.3R 1.1回归分析的基本思想及其初步应用习题课理论迁移理论迁移 例例 19931993年到年到20022002年中国的国内生产总年中国的国内生产总值(值(GDPGDP)的数据(单位:亿元)如下:)的数据(单位:亿元)如下:104790.6104790.62002200274462.674462.61997199797314.897314.82001200167884.667884.61996199689468.189468.12000200058478.158478.11995199582067.582067.51999199946759.446759.41994199478345.278345.21998199834634.434634.419931993GDPGDP年份年份GDPGDP年份年份1.1回归分析的基本思想及其初步应用习题课(1 1)作)作GDPGDP和年份的散点图,根据该图和年份的散点图,根据该图猜想它们之间的关系应是什么?猜想它们之间的关系应是什么?(2 2)建立年份为解释变量)建立年份为解释变量GDPGDP为预报变为预报变量的回归模型,并计算残差量的回归模型,并计算残差. .(3 3)根据你得到的模型,预报)根据你得到的模型,预报20032003年的年的GDPGDP,看看你的预报与实际的,看看你的预报与实际的GDPGDP(117251.9117251.9亿元)的误差是多少?亿元)的误差是多少?(4 4)你认为这个模型能较好地刻画)你认为这个模型能较好地刻画GDPGDP和年份的关系吗?请说明理由和年份的关系吗?请说明理由. .1.1回归分析的基本思想及其初步应用习题课0200004000060000800001000001200001992199419961998200020022004 GDP GDP与年份近似地呈线性关系与年份近似地呈线性关系. .7191.96914292537.729yt1.1回归分析的基本思想及其初步应用习题课993.791993.791200220024638.0554638.055199719971277.6221277.622200120015252.0245252.024199619961932.3531932.353200020003037.4933037.493199519952140.9842140.984199919991489.2381489.238199419941328.6851328.685199819986422.2696422.26919931993残差残差年份年份残差残差年份年份20032003年年GDPGDP预报值为预报值为112976.4112976.4,预报与实际,预报与实际相差相差4275.54275.5相关指数相关指数R R2 20.9740.974,说明年份能够解释,说明年份能够解释97.4%97.4%的的GDPGDP值变化,所建模型能很好地刻画值变化,所建模型能很好地刻画GDPGDP和年份的关系和年份的关系. .1.1回归分析的基本思想及其初步应用习题课练习某运动员训练次数与运动成绩之间的数据关系如下:编号次数 成绩 试预测运动员训练次以及次的成绩1.1回归分析的基本思想及其初步应用习题课编号次数 成绩 第一步:做散点图1.1回归分析的基本思想及其初步应用习题课编号次数 成绩 第二步:求回归方程y=1.0415x-0.003021.1回归分析的基本思想及其初步应用习题课编号编号次数次数 成绩成绩 残差残差y=1.0415x-0.00302第三步:残差图-1.24-0.370.550.461.380.170.09-1.081.1回归分析的基本思想及其初步应用习题课残差图残差图编号编号次数次数 成绩成绩 残差残差-1.24 -0.370.550.461.380.170.09-1.081.1回归分析的基本思想及其初步应用习题课第四步:计算相关指数第四步:计算相关指数编号编号次数次数 成绩成绩 残差残差-1.24 -0.370.550.461.380.170.09-1.082212110.9855niiiniiyyRyy 相关指数说明了该运动员的成绩的差异有是由训练次数引起的,说明了两个变量的相关关系非常强1.1回归分析的基本思想及其初步应用习题课第五步:作出预报y=1.0415x-0.00302来作为该运动员成绩的预报值495747554957将x=47和x=55分别代入可以得到: y和故预测该运动员训练次和次的成绩分别为和由上述分析可知,我们可以用回归方程1.1回归分析的基本思想及其初步应用习题课一般地,建立回归模型的基本步骤为:1.确定研究对象2.画散点图3.由经验确定回归方程的类型4.按一定规则估计回归方程中的参数5. 分析残差图. 下结论. 分析残差图小结:1.1回归分析的基本思想及其初步应用习题课作业:作业: 假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用 y(万元),有如下的统计资料。(万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.0若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 的回归系数的回归系数 ;(2)求残差平方和;)求残差平方和;(3)求相关系数)求相关系数 ;(4)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?ybxa ab、2R1.1回归分析的基本思想及其初步应用习题课解:解: (1)由已知数据制成表格。)由已知数据制成表格。12345合计合计23456202.23.85.56.57.0254.411.422.032.542.0112.34916253690ixiyiix y2ix4;5;xy5521190;112.3.iiiiixx yi1.23,0.08.ba1.230.08.yx所以有所以有
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 幼儿教育


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!