统计学一元线性回归课后习题答案课件

上传人:风*** 文档编号:242662220 上传时间:2024-08-31 格式:PPT 页数:53 大小:562.46KB
返回 下载 相关 举报
统计学一元线性回归课后习题答案课件_第1页
第1页 / 共53页
统计学一元线性回归课后习题答案课件_第2页
第2页 / 共53页
统计学一元线性回归课后习题答案课件_第3页
第3页 / 共53页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,一元线性回归课后习题讲解,-第九组,一元线性回归课后习题讲解-第九组,1,11.1,从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:,企业编号,产量(台),生产费用,1,40,130,2,42,150,3,50,155,4,55,140,5,65,150,6,78,154,7,84,165,8,100,170,9,116,167,10,125,180,11,130,175,12,140,185,11.1 从某一行业中随机抽取12家企业,所得产量与生产费用,2,产量和费用存在正的线性相关系数,(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。,产量和费用存在正的线性相关系数(1)绘制产量与生产费用的散点,3,r=0.9202,2)计算产量与生产费用之间的线性相关系数。,r=0.92022)计算产量与生产费用之间的线性相关系数。,4,1、提出假设:,H,0:, ;,H,1:, 0,2、计算检验的统计量,根据显著性水平,0.05,查,t,分布表得,t,(,n,-2)=2.2281由于,t,=7.435453,t,(12-2)=2.2281,拒绝,H,0,产量与生产费用之间存在着显著的正线性相关关系,(3)对相关系数的显著性进行检验(,0.05,),并说明二者之间的关系强度。,t,(12-2)=2.2281,1、提出假设:H0: ;H1: 02、计算检,5,11.2,学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,取得的数据如下:,复习时间X,20,16,34,23,27,32,18,22,考试分数Y,64,61,84,70,88,92,72,77,11.2 学生在期末考试之前用于复习的时间(单位:小时)和考,6,复习时间和考试分数存在正的线性相关关系,复习时间和考试分数存在正的线性相关关系,复习时间和考试分数存在正的线性相关关系,要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。,复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在,7,r=0.8621,(2)计算相关系数,说明两个变量之间的关系强度。,r=0.8621(2)计算相关系数,说明两个变量之间的关系强,8,11.3,、根据一组数据建立的线性回归方程,要求:,1,)解释截距 的意义。,1)解释斜率 的意义。,2)当=6时的E(y),1)表示在没有自变量X的影响时其他各种因素对因变量Y的影响为10,2)斜率的意义在于:自变量X变化对Y影响程度。回归方程中,当x增加一个单位时,y将减少0.5个单位。,3)x=6时,代入方程,则,y=10-0.5 6=7,11.3、根据一组数据建立的线性回归方程,9,11.4,设SSR=36,SSE=4,n=18,要求:1)计算判定系数R2并解释其意义,回归直线对观测值的拟合程度为0.9,说明变量Y的变异性中有90%是由自变量x引起的。,2)计算估计标准误差 并解释其意义,表示实际值与估计值之间的差异程度是0.5,11.4 设SSR=36,SSE=4,n=18表示实际值,10,11.5,一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车的运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下表:,运送距离x,825,215,1070,550,480,920,1350,325,670,1215,运送时间y,3.5,1.0,4.0,2.0,1.0,3.0,4.5,1.5,3.0,5.0,(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态,(2)计算线性相关系数,说明两个变量之间的关系强度。,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,11.5一家物流公司的管理人员想研究货物的运输距离和运输时间,11,根据图表显示,二者可能存在正线性相关关系,(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态,根据图表显示,二者可能存在正线性相关关系 (1)绘制运送距离,12,x与y的简单相关系数是0.9489,两变量之间呈现高度正相关关系,运送距离x,运送时间y,运送距离x,1,运送时间y,0.94894,1,(2)计算线性相关系数,说明两个变量之间的关系强度,x与y的简单相关系数是0.9489,两变量之间呈现高度正相关,13,最小二乘估计:,y,=,0,+,1,x,将表中数据代入公式得:,=0.118129,=0.003585,y=0.118129 + 0.003585x,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,y关于x的回归方程为y=0.118129 + 0.003585x表示运输距离每增加1公里,运送时间平均增加 0.003585天。,最小二乘估计:y = 0+ 1 x将表中数据代入公式得,14,11.6,下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:,地区,人均GDP(元),人均消费水平(元),北京,辽宁,上海,江西,河南,贵州,陕西,22 460,11 226,34 547,4 851,5 444,2 662,4 549,7 326,4 490,11 546,2 396,2 208,1 608,2 035,11.6 下面是7个地区2000年的人均国内生产总值(GDP,15,要求:,(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。,产量和生产费用之间存在着正的线性相关关系,要求:产量和生产费用之间存在着正的线性相关关系,16,(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。,说明两个变量之间高度相关,(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系,17,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。,y =,734.6928,+,0.308683,x,回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。,(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际,18,(4)计算判定系数,并解释其意义。,人均GDP对人均消费的影响达到99.6%。,(4)计算判定系数,并解释其意义。 人均GDP对人均消费的影,19,(5)检验回归方程线性关系的显著性(a=0.05)。,提出假设,H,0:,1=0 人均消费水平与人均GDP之间的线性关系不显著,计算检验统计量,F,确定显著性水平,=0.05,并根据分子自由度1和分母自由度7-2找出临界值,F,=6.61,作出决策:若,F,F ,拒绝,H,0,线性关系显著,(5)检验回归方程线性关系的显著性(a=0.05)。提出假,20,(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。,某地区的人均GDP为5 000元,预测其人均消费水平为2278.1078元。,(6)如果某地区的人均GDP为5 000元,预测其人均消,21,(7)求人均GDP为5 000元时,人均消费水平95的置信区间和预测区间。,解,:,已知,n,=7,,t,(7-2)=2.5706,置信区间为,人均GDP为5 000元时,人均消费水平95的,置信区间为1990.74915,2565.46399,1990.74915,t,=2.201,拒绝,H,0,回归系数显著,提出假设,H,0:,b,1 = 0,H,1:,b,1,0,计算检验的统计量,3)检验回归系数的显著性(a=0.05),=2.201,t=4.7684t=2.201,拒绝H0,回归系数显,27,解:,已知,n,=10,,t,(10-2)=2.306,置信区间为,计算得,4)如果航班正点率为80%,估计顾客投诉次数,5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间,解:已知n=10,t(10-2)=2.306计算得4),28,已知,n,=10,,t,(10-2)=2.306,预测区间为,计算得,已知n=10,t(10-2)=2.306计算得,29,11.8,下面是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。,地区编号,出租率(%),每平方米月租金(元),1,70.6,99,2,69.8,74,3,73.4,83,4,67.1,70,5,70.1,84,6,68.7,65,7,63.4,67,8,73.5,105,9,71.4,95,10,80.7,107,11,71.2,86,12,62,86,13,78.7,106,14,69.5,70,15,68.7,81,16,69.5,75,17,67.7,82,18,68.4,94,19,72,92,20,67.9,76,11.8 下面是20个城市写字楼出租率和每平方米月租金的数据,30,回归统计,Multiple R,0.79508,R Square,0.632151,Adjusted R Square,0.611715,标准误差,8.568399,观测值,20,方差析,df,SS,MS,F,Significance F,回归分析,1,2271.036,2271.036,30.93318,2.8E-05,残差,18,1321.514,73.41746,总计,19,3592.55,回归统计Multiple R0.79508R Square0,31,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,-94.2498,32.07947,-2.93801,0.008792,-161.646,-26.8534,-161.646,-26.8534,X Variable 1,2.536492,0.456059,5.561761,2.8E-05,1.578347,3.494637,1.578347,3.494637,Coefficients标准误差t StatP-value,32,11.9,某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:,方差分析表,变差来源,df,SS,MS,F,SignificanceF,回归,2.17E09,残差,40158.07,总计,11,1642866.67,参数估计表,Coefficients,标准误差,tStat,Pvalue,Intercept,363.6891,62.45529,5.823191,0.000168,XVariable1,1.420211,0.071091,19.97749,2.17E09,11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的,33,(1)完成上面的方差分析表,。,变差来源,df,SS,MS,F,SignificanceF,回归,1,1602708.6,1602708.6,399.1000065,2.17E09,残差,10,40158.07,4015.807,总计,11,1642866.67,SSR=SST-SSE= 1642866.67-40158.07=1602708.6,MSR=SSR/1= 1602708.6,MSE=SSE/10= 4015.807,F=MSR/MSE=399.1000065,(1)完成上面的方差分析表。dfSSMSFSignifi,34,(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?,汽车销售量的变差中有97.56%是由于广告费用的变动引起的,(3)销售量与广告费用之间的相关系数是多少?,(2)汽车销售量的变差中有多少是由于广告费用的变动引起的,35,(4)写出估计的回归方程并解释回归系数的实际意义。,回归系数的意义:广告费用每增加一个单位,,汽车销量就增加1.42个单位。,(5)检验线性关系的显著性(a0.05)。,p=2.17E09,显著。,(4)写出估计的回归方程并解释回归系数的实际意义。 回归系数,36,11.10,根据下面的数据建立回归方程,计算残差,判定R2,估计标准误差se,并分析回归方程的拟合程度。,11.10,37,残差,估计标准误差se,残差估计标准误差se,38,本题判定系数,R2=0.937348,,可以看出拟合程度好。,判定R2,本题判定系数R2=0.937348,可以看出拟合程度好。判,39,11.11,从20的样本中得到的有关回归结果是:SSR=60,SSE=40。,要检验x与y之间的线性关系是否显著,即检验假设:,。,(1)线性关系检验的统计量F值是多少?,解:(1)SSR的自由度为1;SSE的自由度为n-2=18;,F=,=,=27,(2)给定显著性水平a0.05,Fa是多少?,=,=4.41,(3)是拒绝原假设还是不拒绝原假设?,拒绝原假设,线性关系显著。,11.11 从20的样本中得到的有关回归结果是:SSR=6,40,(4)假定x与y之间是负相关,计算相关系数r,r=,=,=0.7746,由于是负相关,因此r=-0.7746,(5)检验x与y之间的线性关系是否显著?,从F检验看线性关系显著。,F=,27,=4.41,(4)假定x与y之间是负相关,计算相关系数r r=0.,41,11.12,从n=20的样本中得到的有关回归结果是:,y=5+3x, =1 =2,,要求,1)当x=4时,构建y的平均值的95%的置信区间,11.12从n=20的样本中得到的有关回归结果是:要求,42,2)当x=4时,构建y的平均值的95%的预测区间,2)当x=4时,构建y的平均值的95%的预测区间,43,11.13 一家公司拥有多家子公司,公司的管理者想通过广告支出来估计销售收入,为此抽取了8家子公司,得到广告支出和销售收入的数据如下(单位:万元),广告支出X,12.5,3.7,21.6,60,37.6,6.1,16.8,41.2,销售收入Y,148,55,338,994,541,89,126,379,建立线性回归模型,当x=40万元时,构建销售收入95%的置信区间,。,11.13 一家公司拥有多家子公司,公司的管理者想通过,44,统计学一元线性回归课后习题答案课件,45,y,0,=-46.2918+15.23977x,当x=40万元时 E(y,0,)=-46.2918+15.23977*40=563.299,t,/2,=t,0.025,(6)=2.4469,置信区间为441.559 , 685.039,置信区间为441.559 , 685.039,46,11.14,从两个回归分析中得到的残差如下:,绘制残差图,你会得出什么结论。,11.14从两个回归分析中得到的残差如下:绘制残差图,你会得,47,回归1 :,观察图像可以看出,残差值基本上集中在两条平行线之间,表明对于所有值,方差都相同,所以认定其假定描述变量x和y之,间关系的回归模型是合理的。,回归1 :观察图像可以看出,残差值基本上集中在两条平行线之间,48,回归2,:,对于不同的x值残差相差也较大,且其残差值基本上集中在两条曲线之间,这就意味着其违背了方差相等的,表明所选择,的回归模型不合理,应该考虑曲线回归或多元回归。,回归2: 对于不同的x值残差相差也较大,且其残差值,49,11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:,11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:,超市,广告费支出(万元),销售额(万元),A,B,C,D,E,F,G,l,2,4,6,10,14,20,19,32,44,40,52,53,54,11.15 随机抽取7家超市,得到其广告费支出和销售额数据,50,解,:(1),(1)用广告费支出作自变量x,销售额作因变量y,,求出估计的回归方程。,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,29.39911,4.807253,6.115573,0.001695,17.04167,41.75655,17.04167,41.75655,X Variable 1,1.547478,0.463499,3.338688,0.020582,0.356016,2.738939,0.356016,2.738939,解:(1)(1)用广告费支出作自变量x,销售额作因变量y,,51,(2)回归直线的F检验:,显著。,(2)检验广告费支出与销售额之间的线性关系是否显著(a0.05)。,方差分析,df,SS,MS,F,Significance F,回归分析,1,691.7226,691.7226,11.14684,0.020582,残差,5,310.2774,62.05549,总计,6,1002,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,29.39911,4.807253,6.115573,0.001695,17.04167,41.75655,17.04167,41.75655,X Variable 1,1.547478,0.463499,3.338688,0.020582,0.356016,2.738939,0.356016,2.738939,广告费支出与销售额之间的线性关系显著,(2)回归直线的F检验:显著。(2)检验广告费支出与销售额之,52,显著。,回归系数的t检验:,(3)绘制关于x的残差图,你觉得关于误差项,的假定被满足了吗?,3).大约有95%的标准化残差在-2,2之间表明误差项假定的条件成立。从图中可以看出不满足这个条件,所以,关于误差项的假定没有被满足。,(4)你是选用这个模型,还是另寻找一个更好的模型?,4).可考虑选用非线性模型,显著。回归系数的t检验:(3)绘制关于x的残差图,你觉得关于,53,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!