第三节线性回归的显著性检验及回归预测

上传人:小** 文档编号:43138689 上传时间:2021-11-30 格式:DOC 页数:35 大小:1.46MB
返回 下载 相关 举报
第三节线性回归的显著性检验及回归预测_第1页
第1页 / 共35页
第三节线性回归的显著性检验及回归预测_第2页
第2页 / 共35页
第三节线性回归的显著性检验及回归预测_第3页
第3页 / 共35页
点击查看更多>>
资源描述
第三节线性回归的显著性检验及回归预测在回归分析中,要检验因变量Y与自变量X之间到底有无真正的线性关系,可以通过回归系数的显著性检验(t检验)或回归方程 的显著性检验(F检验)来判断.一、回归系数的显著性检验回归系数显著性检验的目的是通过检验回 归系数p的值与0是否有显著性差异,来判断Y 与X之间是否有显著的线性关系若3二0,则总体 回归方程中不含X项(即Y不随X变动而变动),因 此,变量Y与X之间并不存在线性关系;若p H 0,说 明变量Y与X之间存在显著的线性关系.提出原假设与备择假设:Hq:0 = O; 码:"0嗾1 构造检验统计量,二而其中,S(b) = Se I2为方的样本方差,工(旺-兀)2=屈给定显著性水平0C,这是t分布的双侧检验,查 表计算出临界值乙/2( -2),得出拒绝域; 根据已知条件实际计算统计量t的值; 比较与中的计算结果,得到结论廉回归系数的检验(例题分析)&对例题的回归系数进行显著性检验(a= 0.05)1-提出假设H°:0 = O;码:0工02.计算检验的统计量0.79612.457 x0.7961=16.65480.0478 264531/2® - 2)=仏5(14) = 2.1448 > 16 砧 48,所以拒绝原假 设,表示丫与X之间存在显著的线性关系,即能源V 与工业总产值之间存在显著的线性相关关系.二回归方程的显著性检验(方差分析(F检验) 检验两变量是否线性相关的另一种方法是方差分 析,它是建立在对总离差平方和如下分解的基础上: 工(X -刃$ = 丫(几J + 丫(几一歹);即:SS =工(必-可2 =叫2 = 丫 ”2 _ (丫丿 )2 /兀SSE = SS -bnSxySSR =SS- SSE = bnSxySS,SSe,SSr 依赖:!吃乞2 - Ys +吃七a-y-bx注意:三个平方和SS,SSe,SS«的自由度分别记为 几九,几,则它们之间也有等式成立:/ = A + A且:f =n-l,/£ =n-2,贝悅=/一心=1. 提出原假设与备择假设:码:0 = 0;码:0工0 构造检验统计量i构造*分布统计量:ii 构造统F分布计量:SSr卩(1/一2)给定显著性水平a,查表计算出临界值Pan-2) 得出拒绝域(代(1必2),收)根据已知条件实际计算统计量F的值;方差分析把总离差平方和及其自由度进行分解,利用F统计量检验两变量间线性相关显著性的 方法称为方差分析方差分析的结果归纳如下:一元线性回归的方差分析表离差来源平方和自由度1n-2ssR=X(yci-y)2 sSe =- yCi)线性关系的检验(例题分析)1. 提出假设码:0 = 0;2. 计算检验统计量FSS =工 y 2 _( Y y )2 H = 26175 一 (625)2 /16 = 1760.9375 nSxy=工x.j. - (工x.工y/n = 37887-(916x625)/16 =2105.75SSR = bnSxy = 0.7961 x 2105.75 = 1676.3876SSE =SS- SSR = 84.5499SSrSSE /(n 2)1676.3876-84.5499/14=277.58083确定显著性水平0=0.05,并根据分子自由度1和分母自由度14找出临界值聲二4.60ill4作出决策:若F>Fa,拒绝耳,认为能源 消耗量与工业总产值两变量间的线性相关 关系是显著的.离差来源平方和自由度F值回归 剩余SSR = 1676.3876SSE = 84.5499114F = 277.5808总计SS = 2105.7515三、利用回归方程进行估计和预测点估计1对于自变量X的一个给定值也根据回归方程得到因变量y的一个估彳值几2点估计值有y的平均值的点、估计 y的个别值的点、估计3在点估计条件下,平均值的点估计和个别 值的的点估计是一样的,但在区间估彳 则不同y的平均值的点估计利用估计的回归方程,对于自变量X的一 个给定值遍求出因变量呻平均值的一个 估计值砌)',就是平均值的点估计-在能源消耗量与工业总产值的例子中, 假如我们要估计能源消耗量为78十万吨 的平均工业总产值,那么将78十万吨代 入估计的回归方程就得到了工业总产 值的点估计:E(j0) = -6.5142 + 0.7961x78 = 55.5816(亿0y的个别值的点估计利用估计的回归方程,对于自变量X的一个给定值毛,求出因变量y的一个个另U值的估计值儿,就是个别值的点估计.-例如,如果我们只是想知道能源消耗量为80万吨的工业总产值是多少,则属于个别值的点估计。根据估计的回归方程得几=-6.5142 + 0.7961x80 = 57.1738(亿元)区间估计区间估计点估计不能给出估计的精度,点估计值与 实际值之间是有误差的,因此需要进行区 间估计对于自变量X的一个给定值耳,根据回归 方程得到因变量y的一个估计区间区间估计有两种类型 置信区 间估计(confidence interval estimate) 预测区间估计(ptedictioa interval estim娥彥解I读 置信区间估计1. 利用估计的回归方程,对于自变量X 的一个给定值冯,求出因变量y的平 均值的估计区间,这一估计区间称为 置信区 /(confidence interval)2. H%)在1皿置信水平下的置信区间为H2)» 匚+-r驴同 式中:Sf为回归估计标准差置信区间估计(例题分析)【例】求出工业总产值的点估计为100亿元时,工业总产值95%置信水平下的置信区间.解:根据前面的计算结果,已知12=16,100100 ± 2.1448 X 2.457 xJ+ 一 5725)_ V16264597.9167 < E(j0) < 102.0833当工业总产值的点估计为100亿元时,工业总产 的平均值在97.9167亿元到1020833亿元之间、讥=2457,也(16-2)=2.1448 置信区间为预测区间估计1-利用估计的回归方程,对于自变量X的一个给定值耳,求出因变量y的一个个别值的估计区间,送一区風称为预测区间(prediction interval)2. %在1也置信水平下的预测区间为解上读影响&间寛决的素1. 置信水平(1-a)-区间宽度随置信水平的增大而增大2. 数据的离散程度Q-区间宽度随离程度的增大而增大 3 样本容量-区间宽度随样本爭量的增大而减小 4用于预测的爲与:勺差异程度-区间宽度随遍与x的差异程度夠J 而增大rr=预测区间估计(例题分析)【例】求出能源消耗量为73十万吨时,工业总产值 95%置信水平下的置信区间解:根据前面的计算结果,已知n=16,Sc.457,2(14)=2.1448 几=-6.5142 + 0.7961x73 = 51.6011(亿元) 置信区间为51.6011 ± 2.1448 x 1.457 x45.9345 < j0< 57.2677预测区间估计(大样本)1. %在1乜置信水平下的预测区间为 X 土 ZaHSe特别:1) = 68.27%Pr°-Jcl <2 = 95.45 %P|JoJc <3) = 99.73%=a+bx作业:P2231> 4> 6. 7
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!