直线相关与直线回归.ppt

上传人:za****8 文档编号:7249667 上传时间:2020-03-17 格式:PPT 页数:25 大小:279.50KB
返回 下载 相关 举报
直线相关与直线回归.ppt_第1页
第1页 / 共25页
直线相关与直线回归.ppt_第2页
第2页 / 共25页
直线相关与直线回归.ppt_第3页
第3页 / 共25页
点击查看更多>>
资源描述
双变量的两种选取方法 1 一个变量是选定的 可以精确地测量或严格控制 称为选定变量x 另一个变量是随机的 有不可控制的偶然因素影响 称为随机变量y 例如 儿童的年龄是选定变量 身高则是随机变量 选定变量x值处存在着随机变量y值的总体 常常是x值处y服从正态分布 2 x y都是随机变量 则存在着一个双变量 x y 总体 如果在任意的x值处y服从正态分布 在任意的y值处x服从正态分布 则x y称为双变量正态分布 例如 某一个儿童年龄组的身高与体重是双变量正态分布 双变量研究中存在的两种关系 1 相互关系 互依关系 两个变量是平等的 可令任一变量为x 另一变量为y 来研究两个变量的彼此关系或彼此影响 可采用直线相关分析 一般来说 直线相关分析只适用于双变量正态分布资料 2 因果关系 依存关系 两个变量是不平等的 一个为自变量x 另一个为因变量y 来研究x对y的作用或y对x的依赖 可采用直线回归分析 一般来说 直线回归分析可适用于上述两种变量的选取 第一节直线相关分析 直线相关 linearcorrelation 当一个变量x由小到大变化 另一个变量y亦相应地由小到大或由大到小变化 两个变量的散点图呈直线趋势 那么 两个变量间存在直线关系 这种直线关系 或分析这种直线关系的理论或方法 统称为直线相关 两变量间直线相关的密切程度和方向 用直线相关系数来表示 直线相关分析的步骤 1 散点图 相关图 观察各个散点有无直线趋势 若有直线趋势 可进行直线相关分析 2 计算五个基本数字 x x2 y y2 xy3 求相关系数rr x x y y x x 2 y y 24 相关系数r的假设检验 查表法 t检验t r 0 SrSr 1 r2 n 2 5 根据专业知识作出结论 相关系数的计算 本例r 0 9395 相关系数及其意义 correlationcoefficient 1 定义 相关系数是描述呈双变量正态分布的两个变量直线相关的密切程度和方向的指标 2 符号 样本相关系数用r表示 总体相关系数用 表示 没有单位 取值范围从 1到 1 3 意义 在r值有显著性意义的条件下 r 值愈接近1 两个变量的关系愈密切 r 值愈接近0 两个变量的关系愈不密切 r 0为正相关 positivecorrelation 表示y随x增加而增加 r100时 r 0 7称为高度相关 0 7 r 0 4称为中度相关 r 0 4称为低度相关 相关系数的假设检验 上例中的相关系数r等于0 9395 似乎说明10只大白鼠进食量 g 和增加体重 g 之间存在相关关系 但是 这10只大白鼠只是总体中的一个样本 由此得到的相关系数会存在抽样误差 因为 总体相关系数 为零时 由于抽样误差 从总体抽出的10只 其r可能不等于零 所以 要判断该样本的r是否有意义 需与总体相关系数 0进行比较 看两者的差别有无统计学意义 这就要对r进行假设检验 判断r不等于零是由于抽样误差所致 还是两个变量之间确实存在相关关系 相关系数r的t检验 样本相关系数r 0的原因 由于抽样误差引起 总体相关系数 0 存在相关关系 总体相关系数 0方法 式中Sr为相关系数的标准误本例t 7 7587 总体相关系数 的可信区间 1 相关系数变换为Z值 使之近似呈正态分布2 Z值的标准误SZ3 Z值的可信区间Z值的95 可信区间 Z 1 96SZZ值的99 可信区间 Z 2 58SZ4 Z值的可信区间转换为总体相关系数 的可信区间 分别将Z值可信区间的上下限转换为 值可信区间的上下限 直线相关分析中应注意的问题 1 两个变量间毫无实际意义时不要作直线相关分析 2 两个变量间呈线性关系时 要根据专业知识分辨是伴随关系还是因果关系 从而确定作直线相关分析或作直线回归分析 3 相关分析要求资料x y两变量都是来自正态总体的随机变量 x和y可以互换位置 不分自变量和因变量 4 不要把r的显著性水平误解为相关的密切程度 小样本相关系数r经假设检验只能推断两变量间有无直线相关存在 只有当大样本 n 100 时 r 0 7称为高度相关 0 7 r 0 4称为中度相关 r 0 4称为低度相关 第二节直线回归分析 直线回归 linearregression 1 定义 直线回归又称简单回归 simpleregression 是用于研究两个连续性变量X和Y之间线性依存变化的数量关系 其中X为自变量 independentvariable Y为依赖于X的因变量 dependentvariable 也称为反应变量 responsevariable 两变量之间有数量依存关系 但非一一对应的函数关系 如年龄与身高 年龄与体重的关系 由于多种因素的影响 它们之间不是严格的函数关系 不能用函数方程表达 为了区别于数学上两变量间的函数方程 称这种关系式为直线回归方程 这种关系为直线回归 2 直线回归分析的任务 找出最适合的直线回归方程 以确定一条最接近于各实测点的直线 来描述两个变量之间的回归关系 直线回归分析的步骤 1 散点图 相关图 观察各个散点有无直线趋势 若有直线趋势 可进行直线回归分析 2 计算五个基本数字 x x2 y y2 xy3 求直线回归方程 a bxb x x y y x x 2a y bx4 回归系数的假设检验 查表法 t检验t b 0 Sb5 根据专业知识作出结论 直线回归参数的含义 a称为回归直线在纵轴上的截距 intercept a 0 表示直线与纵轴的交点在原点的上方 a0 表示y随x增大而增大 b 0 表示y随x增大而减小 b 0 表示直线与轴平行 即y与x无直线关系 回归参数a和b的计算 根据数学上的最小二乘法原理 使直线上各估计值与实测值Y之差的平方和最小 即各实测点至回归直线的纵向距离平方和为最小 可推导出a和b的计算公式 本例b 0 2219a 17 3618 回归系数及其意义 regressioncoefficient 1 定义 回归系数又称为直线回归方程的斜率 slope 或坡度 表示因变量y依赖于自变量x的直线变化的数量关系 2 符号 样本回归系数用b表示 总体回归系数用 表示 回归系数含有单位 3 意义 在b有显著性意义的前提条件下 表示x每增加一个单位时 y平均增加 当b 0时 或平均减少 当b 0时 b个单位 与直线相关一样 直线回归方程也是从样本资料计算而得的 同样也存在着抽样误差问题 所以 需要对样本的回归系数b进行假设检验 以判断b是否从总体回归系数 为零的总体中抽得 为了判断抽样误差的影响 需对回归系数进行假设检验 总体回归系数一般用 表示 样本回归系数的假设检验 回归系数b的t检验 1 y与 离差的平方和2 标准估计误差 固定x时 y与回归线 垂直方向的离散程度 即y的标准差 反映x的影响被扣除后y的变异 故又称为剩余标准差 3 样本回归系数b的标准误4 回归系数b的t检验 直线回归方程的建立 回归直线的描绘 根据求得的回归方程 可以在自变量X的实测范围内任取两个值 代入方程中 求得相应的两个Y值 以这两对数据找出对应的两个坐标点 将两点连接为一条直线 就是该方程的回归直线 回归直线一定经过 0 a 这两点可以用来核对直线绘制是否正确 直线回归分析的用途 1 回归系数b有显著性意义的前提条件下 利用直线回归方程描述应变量y依赖自变量x变化而变化的数量关系 例如 儿童体重依赖年龄变化而变化的数量关系 2 根据容易测定的变量值估计难以测定的变量值 例如 以人的体重估计人的体表面积 3 利用直线回归方程进行预测预报 由已知变量 预报因子x 预测将来的未知变量 预报量y 例如 由父母的身高预测子女将来的身高 4 利用直线回归方程进行统计控制 即利用回归方程进行逆估计 例如 把车流量 x 与汽车排出的某种毒物 y 建立直线回归方程 若要求y在一定的波动范围内 卫生标准以下 可通过控制x的取值来实现 直线回归分析中应注意的问题 1 两个事物间毫无实际意义时不要作直线回归分析 2 回归分析前首先绘制散点图 观察两变量间散点有无线性趋势 有无异常点 高杠杆点或强影响点存在 3 考虑建立直线回归模型的基本假定 满足线性 linear 独立 independent 正态 normal 方差相等 equalvariance 4个条件 4 x选定 y服从正态分布的双变量 作直线回归分析称 型回归 如标准曲线 x y服从双变量正态分布的资料 作直线回归分析称 型回归 5 双变量正态分布资料作直线回归分析 由x推算y 或由y推算x 所得回归系数b及回归方程不同 因此 自变量x和应变量y应根据专业知识来确定 6 绘制的回归直线应在x的实测值范围内或实际可用的范围内使用 不能任意将直线延长 因为直线延长后不一定呈直线关系 直线回归与直线相关的区别 1 意义 相关反映两变量的相互关系 即在两个变量中 任何一个的变化都会引起另一个的变化 是一种双向变化的关系 回归是反映两个变量的依存关系 一个变量的改变会引起另一个变量的变化 是一种单向的关系 2 在资料要求上 直线回归适用于y服从正态分布 x是可以精确测量和严格控制的变量 称为 型回归 也适用于x y服从双变量正态分布资料 可以计算两个回归方程 称为 型回归 直线相关分析只适用于x y服从双变量正态分布资料 3 在应用上 说明两变量间依存关系的数量关系时采用直线回归 说明两变量间的相互关系时采用直线相关 实际工作中 应根据专业知识来确定是作直线相关分析 相互关系 还是作直线回归分析 因果关系 4 研究性质 相关是对两个变量之间的关系进行描述 看两个变量是否有关 关系是否密切 关系的性质是什么 是正相关还是负相关 回归是对两个变量做定量描述 研究两个变量的数量关系 已知一个变量值可以预测出另一个变量值 可以得到定量结果 5 相关系数r与回归系数b的解释上 b和r的绝对值没有直线联系 b有单位 而r无单位 r的绝对值越大 散点图中的点越趋向于一条直线 表明两变量的关系越密切 相关程度越高 b的绝对值越大 回归直线越陡 说明当X变化一个单位时 Y的平均变化就越大 反之也是一样 直线回归与直线相关的联系 1 方向一致 对一组数据若同时计算r与b 它们的正负号是一致的2 假设检验等价 对同一样本 r和b的假设检验得到的t值相等 故同一组数据的r和b的假设检验是等价的 可用查表法进行r的假设检验来代替b的假设检验 若x y服从双变量正态分布 一般是先作直线相关分析 需要时再作直线回归分析 3 用回归解释相关 r的平方称为决定系数
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!