资源描述
第9章 一元线性回归练习题一 选择题1具有相关关系的两个变量的特点是( )A一个变量的取值不能由另一个变量唯一确定B一个变量的取值由另一个变量唯一确定C一个变量的取值增大时另一个变量的取值也一定增大D一个变量的取值增大时另一个变量的取值肯定变小2下面的各问题中,哪个不是相关分析要解决的问题A判断变量之间是否存在关系 B判断一个变量数值的变化对另一个变量的影响C描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在( )A. 正线性相关关系 B. 负线性相关关系 C. 非线性关系 D. 函数关系4.下面的陈述哪一个是错误的( )A. 相关系数是度量两个变量之间线性关系强度的统计量B相关系数是一个随机变量C相关系数的绝对值不会大于1D相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的( )A. -0.86 B. 0.78 C. 1.25 D. 06.如果相关系数r=0,则表明两个变量之间( )A.相关程度很低 B. 不存在任何关系C不存在线性相关关系 D.存在非线性关系7. 下列不属于相关关系的现象是( )A.银行的年利息率与贷款总额 B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量 D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着( )A. 高度相关 B.中度相关 C.低度相关 D.极弱相关9.在回归分析中,被预测或被解释的变量称为( )A.自变量 B.因变量 C.随机变量 D.非随机变量10. 对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是( )A. B. C. D. 11. 下列哪个不属于一元回归中的基本假定( )A.误差项服从正态分布 B. 对于所有的X,方差都相同C. 误差项相互独立 D. 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A. B. C. D. 13.对不同年份的产品成本拟合的直线方程为y表示产品成本,x表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间14.在回归分析中,F检验主要是用来检验( )A相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数 B.回归系数 C. 判定系数 D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=( )A.97.08% B.2.92% C.3.01% D. 33.25%17. 判定系数R2值越大,则回归方程( )A 拟合程度越低 B拟合程度越高C拟合程度有可能高,也有可能低 D 用回归方程进行预测越不准确18. 居民收入与储蓄额之间的相关系数可能是( )A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多 C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.820.下列方程中肯定错误的是( )A. ,r=0.65 B. , r= - 0.81 C. , r=0.42 D. , r= - 0.9621. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R2的取值范围是( )A.【0,1】 B. 【-1,0】 C. 【-1,1】 D.小于0的任意数二 填空题1. 当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。 若不能判断,则我们需要进行( t检验 )检验,构造的检验统计量为( ),它服从( )分布。在=a0.05水平下,该相关关系是否显著( )。2.如下两图中,图(图1 )的相关系数会大一些。我们能否用相关系数判断哪个图中数据间的相关性会强一些( 不能 ),理由是(因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。 ) 图1 图2三 计算题1. 从n=20的样本中得到的有关回归结果如下:SSR=80,SSE=60。现要检验x与y之间的线性关系是否显著。(1)SSR的自由度是多少?SSE的自由度是多少? .(1) SSR的自由度是1,SSE的自由度是18。(2)线性关系检验的统计量F值是多少? (2)(3)判定系数为多少?其含义是什么? 判定系数在y的总变差中,由57.14的变差是由于x的变动说引起的。(4)假定x与y之间是负相关,计算相关系数。( 相关系数为-0.7559。(5)给定显著性水平,临界值为4.414,检验x与y之间的线性关系是否显著。因为,所以拒绝原假设,x与y之间的线性关系显著。2.从某一行业中随机抽区17家企业,为了解所得产量和生产费用的关系,现对有关数据进行了回归分析,其中所得产量为x(台),生产费用为y(万元),得到如下分析结果:方差分析表dfSSMSFSignificance F回归分析0.017残差75总计16500参数估计表Coefficients标准误差t StatP-valueIntercept6.3882.0762.8560.017X Variable 11.2480.1826.8620.000(1) 完成上面的方差分析表。(1)方差分析表dfSSMSFSignificance F回归分析1425425850.017残差15755总计16500(2) 在生产费用的总方差中,有多少可以由产量来解释? 判定系数表明在维护费用的变差中,有85的变差可由使用年限来解释。(3) 生产费用与产量的相关系数是多少?(保留四位小数)二者相关系数为0.9220,属于高度相关(4) 写出估计的回归方程并解释回归系数的实际意义。回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。(5) 检验方程线性的显著性()。线性关系显著性检验:因为Significance F=0.017,所以线性关系显著。(6) 当使用年限为20时,预测生产费用是多少?当产量为10时,生产费用为31.348万元。3.Coefficients标准误差t StatP-value下限 95.0%上限 95.0%Intercept-1.02 0.78 -1.31 0.21 -2.65 0.61 x10.24 0.01 4.84 0.00 0.02 0.36 x20.35 0.08 1.68 0.09 -0.22 0.51 x30.11 0.08 0.17 0.46 -0.06 0.29 上表是含有三个自变量的多元线性回归模型的Excel部分输出结果:(1) 这些数据对应的回归方程是什么?(2) 因变量变差中有多少能被模型解释?因变量总体变差中有75.1%可以用模型中的四个自变量解释(3) 模型整体在统计上显著吗(显著性水平为0.05)?说明理由。因为sig.F=1.056E-06a=0.05,因此模型整体在统计上显著。(4)模型中所有的自变量都是显著的吗(显著性水平为0.05)?如果不是,哪些不显著?从哪里可以看出来?不是所有自变量都显著。其中,x2和x3变量不显著。因为x1对应的P值=0.000.05,不拒绝原假设,即x2不显著x3对应的P值=0.460.05,不拒绝原假设,即x3不显著(5)在其他变量保持不变的情况下,自变量x1每变化一个单位,对应的因变量会发生多大变化?在其他变量保持不变的情况下,当自变量x1每变化一个单位时,对应的因变量会平均增加0.24个单位,对应的变化区间为(0.02,0.36)(6)多重共线性什么含义,衡量多重共线性的方法是什么?可以利用相关系数矩阵进行简单判断,在此基础上,通过方差膨胀因子VIF来检验。多重共线性越严重,VIF值越大。如果VIF5时,认为自变量间的相关性高,存在多重共线性问题。
展开阅读全文