应用统计学相关与回归课件

上传人:无*** 文档编号:241328369 上传时间:2024-06-18 格式:PPT 页数:44 大小:1,002KB
返回 下载 相关 举报
应用统计学相关与回归课件_第1页
第1页 / 共44页
应用统计学相关与回归课件_第2页
第2页 / 共44页
应用统计学相关与回归课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
重庆交通大学管理学院18 六月 2024*简单相关与回归简单相关与回归重庆交通大学管理学院18 六月 2024*v 内容提要内容提要相关分析简介相关分析简介简单相关分析简单相关分析偏相关分析偏相关分析Distance 过程过程简单回归分析简单回归分析小结小结重庆交通大学管理学院18 六月 2024*相关分析简介相关分析简介 在在医医学学科科学学研研究究中中,常常常常要要分分析析两两个个变变量量之之间间的的关关系系,例例如如身身高高和和体体重重、年年龄龄和和血血压压、体体温温和和脉脉搏搏、药药物物剂剂量量和和疗疗效效等等问问题题,因因此此涉涉及及到到研研究究两两个个变变量量的的相相互互关关系系。这这时时就就涉涉及及到到两两个个变变量量之之间间的相关与回归。的相关与回归。重庆交通大学管理学院18 六月 2024*积积差差相相关关系系数数,又又称称Pearson相相关关系系数数:定定量量描描述述线线性性相相关关程程度好坏的常用指标,只适用于两变量呈线性相关时。度好坏的常用指标,只适用于两变量呈线性相关时。特点:特点:相关系数相关系数r 是一个无单位的量值,且是一个无单位的量值,且-1 r 0 为正相关,为正相关,r 0 为负相关;为负相关;r 越接近于越接近于1,说明相关性越好;越接近于,说明相关性越好;越接近于0,相关性越差。,相关性越差。Spearman等级相关系数:当数据不满足条件双变量正态时。等级相关系数:当数据不满足条件双变量正态时。相关分析简介相关分析简介v 连续变量的相关指标(最常见)连续变量的相关指标(最常见)重庆交通大学管理学院18 六月 2024*Gamma统计量:统计量:描述有序分类变量数据联系强度的指标,描述有序分类变量数据联系强度的指标,以下指标都是基于以下指标都是基于Gamma统计量衍生出来的。统计量衍生出来的。Kendalls Tau-b:反映两个有序分类变量的一致性。反映两个有序分类变量的一致性。Kendalls Tau-c:对对Kendalls Tau-b进行了校正。进行了校正。相关分析简介相关分析简介v 有序变量的相关指标有序变量的相关指标重庆交通大学管理学院18 六月 2024*列联系数:基于列联系数:基于 2值得出值得出Phi and Cramers V:也是基于:也是基于 2值得出值得出Lambda 系数:系数:用于反映自变量对因变量的预测效果用于反映自变量对因变量的预测效果不确定系数不确定系数相关分析简介相关分析简介v 名义变量的相关指标名义变量的相关指标重庆交通大学管理学院18 六月 2024*Eta Kappa 值值OR、RR等等相关分析简介相关分析简介v 其他相关指标其他相关指标重庆交通大学管理学院18 六月 2024*相关分析简介相关分析简介v 实际上,在实际上,在Crosstabs Crosstabs 过程的过程的statistics statistics 子对话框子对话框 中提供了非常整齐的相关分析指标体系,如左图。中提供了非常整齐的相关分析指标体系,如左图。重庆交通大学管理学院18 六月 2024*除除了了Crosstab过过程程的的statistics 子子对对话话框框外外,SPSS还还在在statistics菜菜单单的的correlation中中提提供供了了几几个个更更专专业业的的相相关关分分析析过程:过程:Bivariate 过程:最常用过程:最常用Partial 过程:专门进行偏相关分析过程:专门进行偏相关分析Distances 过过程程:一一般般不不单单独独使使用用,而而用用于于因因子子分分析析、聚聚类分析和多维尺度分析的预分析类分析和多维尺度分析的预分析相关分析简介相关分析简介重庆交通大学管理学院18 六月 2024*例例1 某医院研究某种代乳粉的营养价值是用大白鼠做试验,某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。(数据文件见析两者有无直线相关关系。(数据文件见corr.sav)动物编号12345678910进食量feed820780720867690787934679639820体重增量weight165158130180134167186145120158进食量和体重增量的数据进食量和体重增量的数据简单相关分析简单相关分析重庆交通大学管理学院18 六月 2024*首先绘制散点图,结果如下:首先绘制散点图,结果如下:简单相关分析简单相关分析v 两变量间存两变量间存在线性相关趋势在线性相关趋势v 没有发现明没有发现明显的异常值显的异常值重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析重庆交通大学管理学院18 六月 2024*选入希望进选入希望进行相关分析行相关分析的变量的变量选择相关分选择相关分析指标析指标简单相关分析简单相关分析重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析结果分析结果分析v PearsonPearson相相关关系系数数为为0.9400.940,且且具具有有统统计计学学意意义义,表表明明feedfeed和和weightweight有有非非常常密密切切的的关关系系,随随着着feedfeed的的增增加加,weightweight也随之增加。也随之增加。重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析v 利利用用上上述述对对话话框框可可以以计计算算秩秩相相关关系系数数,即即spearmanspearman相相关关系系数数,对对原原始始数数据据分分布布不不作作要要求求,利利用用两两变变量量的的秩秩次次关关系系作作线线性性相相关关分分析,适用范围更广,但效能也较低。析,适用范围更广,但效能也较低。重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析结果分析结果分析v 对对上上面面的的例例子子计计算算秩秩相相关关系系数数的的结结果果显显示示,秩秩相相关关系系数数为为0.8990.899,P P 值值0.0010.001。重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析v 上上述述对对话话框框可可用用于于计计算算kendallskendalls等等级级相相关关系系数数,适适用用于两变量均为有序分类的情况。于两变量均为有序分类的情况。重庆交通大学管理学院18 六月 2024*简单相关分析简单相关分析结果分析结果分析v 对上面的例子计算等级相关系数,结果显示,等级相关系数为对上面的例子计算等级相关系数,结果显示,等级相关系数为0.750,P P 值值0.003。v 注意本例并未违反计算积差相关系数的适用条件,这里仅仅是注意本例并未违反计算积差相关系数的适用条件,这里仅仅是作为演示用。作为演示用。重庆交通大学管理学院18 六月 2024*v 大家可以发现,大家可以发现,对相同的数据,秩相关系数和对相同的数据,秩相关系数和等级相关系数的绝对值均比积差相关系数小,为等级相关系数的绝对值均比积差相关系数小,为什么?什么?简单相关分析简单相关分析v 显然,这是由于在秩变换或数据按有序分类处显然,这是由于在秩变换或数据按有序分类处理时损失信息所导致的。理时损失信息所导致的。重庆交通大学管理学院18 六月 2024*v 前前面面介介绍绍的的相相关关分分析析是是分分析析两两个个计计量量资资料料间间的的关关系系,在在计计算算积积差差相相关关系系数数、Spearman Spearman 相相关关系系数数和和KendallsKendalls相相关关系系数数的的时时候候,都都没没有有考考虑虑第第三三方方的的影影响响,这这就就导导致致可可能能对对事事物物的的解解释释出出现现偏偏差差。下下面面以一个例子对此作进一步的说明。以一个例子对此作进一步的说明。偏相关分析偏相关分析重庆交通大学管理学院18 六月 2024*例例2 某某地地29名名13岁岁男男童童身身高高(x1,cm)、体体重重(x2,kg)及及肺肺活活量量的的实实测测数数据据文文件件为为partial.sav。试试计计算算其其简简单单相相关关系系数数。当当体体重重固固定定时时,计计算算身身高高与与肺肺活活量量的的偏偏相相关关系数,并做假设检验。系数,并做假设检验。偏相关分析偏相关分析重庆交通大学管理学院18 六月 2024*偏相关分析偏相关分析重庆交通大学管理学院18 六月 2024*偏相关分析偏相关分析选择需要选择需要在偏相关在偏相关分析时进分析时进行控制的行控制的变量。变量。重庆交通大学管理学院18 六月 2024*选择选择Zero-order correlations 复选框,则可以给出包括复选框,则可以给出包括协变量在内所有变量两两相关的系数阵。协变量在内所有变量两两相关的系数阵。偏相关分析偏相关分析重庆交通大学管理学院18 六月 2024*偏相关分析偏相关分析结果分析结果分析v 可可见见,控控制制了了体体重重的的影影响响后后,身身高高和和肺肺活活量量之之间间的的关关系系无无统统计学意义。计学意义。包括协变包括协变量在内所量在内所有变量两有变量两两相关的两相关的系数阵。系数阵。重庆交通大学管理学院18 六月 2024*Distance 过程过程 简简单单相相关关和和偏偏相相关关有有一一个个共共同同点点,那那就就是是对对所所分分析析的的数数据据背背景景应应当当有有一一定定程程度度的的了了解解。但但有有时时会会遇遇到到一一种种情情况况,在在分分析析之之前前对对数数据据所所代代表表的的专专业业背背景景知知识识了了解解尚尚不不充充分分,本本身身就就属属于于探探索索性性的的研研究究,这这时时往往往往就就需需要要先先对对几几个个指指标标或或者者案案例例的的差差异异性性、相相似似程程度度进进行行考考察察,以以先先对对数数据据有有一一个个初初步步的的了了解解,然然后后再再根根据据结结果果考虑如何进行深入的分析。考虑如何进行深入的分析。重庆交通大学管理学院18 六月 2024*Distance Distance 过过程程用用于于计计算算记记录录或或变变量量间间的的距距离离(或或相相似似程程度度),根根据据变变量量的的不不同同类类型型可可以以有有许许多多距距离离、相相似似程程度度测测量量指指标标供供用用户户选选择择。但但由由于于本本模模块块只只是是一一个个预预分分析析过过程程,因因此此距距离离分分析析并并不不会会给给出出常常用用的的P P 值值,而而只只给给出出距离大小,以供用户自行判断相似性。距离大小,以供用户自行判断相似性。Distance 过程过程重庆交通大学管理学院18 六月 2024*例例3 某某实实验验室室制制作作了了一一张张基基因因芯芯片片,上上面面一一共共检检测测了了上上万万个个基基因因,现现在在从从数数据据库库中中提提取取出出7个个基基因因的的数数据据,由由于于对对这这7个个基基因因的的生生物物学学功功能能现现在在一一无无所所知知,因因此此首首先先想想对对其其进进行行距距离离测测量量,看看看看哪哪几几个个基基因因“距距离离”比比较较接接近近,然然后后可可以以通通过过临临床床或或实实验验室室进进一一步步验验证证。(数据见(数据见distance.sav。)。)Distance 过程过程重庆交通大学管理学院18 六月 2024*Distance 过程过程重庆交通大学管理学院18 六月 2024*Distance 过程过程注意选择注意选择该项该项重庆交通大学管理学院18 六月 2024*Distance 过程过程结果分析结果分析v 可可见见,代代号号为为CDK2AP1CDK2AP1,TCEB1TCEB1和和IRF2IRF2三三个个基基因因比比较较接接近近,可可以以粗粗略略的的划划为为一一类类,而而FPGS,ELF3FPGS,ELF3和和GFRA2GFRA2可可以以划划为为另另一一类类,而而NFE2NFE2可能作为单独一类,这样就可以进一步研究了。可能作为单独一类,这样就可以进一步研究了。重庆交通大学管理学院18 六月 2024*例例4 仍仍以以数数据据corr.sav为为例例,进进一一步步作作回回归归分分析析,计算进食量与体重增量之间的回归方程。计算进食量与体重增量之间的回归方程。分析:分析:与与相相关关分分析析类类似似,在在回回归归分分析析之之前前首首先先要要考考虑虑的的问问题题是是两两变变量量是是否否存存在在某某种种趋趋势势,通通过过前前面面的的散散点点图图已已经经得得到到了了肯肯定的结论,因此直接进行回归分析。定的结论,因此直接进行回归分析。简单回归分析简单回归分析重庆交通大学管理学院18 六月 2024*绘制散点图如下:绘制散点图如下:简单回归分析简单回归分析v 两两变变量量间间存存在线性相关趋势在线性相关趋势v 没没有有发发现现明明显的异常值显的异常值重庆交通大学管理学院18 六月 2024*简单回归分析简单回归分析重庆交通大学管理学院18 六月 2024*选择选择应变量应变量选择选择自变量自变量简单回归分析简单回归分析重庆交通大学管理学院18 六月 2024*简单回归分析简单回归分析结果分析结果分析v 对对各各自自变变量量纳纳入入模模型型情情况况的的汇汇总总,本本例例只只有有一一个个自变量。自变量。重庆交通大学管理学院18 六月 2024*简单回归分析简单回归分析结果分析结果分析v 对对模模型型的的简简单单汇汇总总,即即对对回回归归方方程程拟拟合合情情况况的的描描述述。本例决定系数为本例决定系数为0.883。重庆交通大学管理学院18 六月 2024*简单回归分析简单回归分析结果分析结果分析v 对模型进行方差分析的结果,说明模型具有统计对模型进行方差分析的结果,说明模型具有统计学意义。学意义。重庆交通大学管理学院18 六月 2024*最重要最重要简单回归分析简单回归分析结果分析结果分析v 给给出出了了回回归归方方程程中中的的常常数数项项、回回归归系系数数的的估估计计值值和和检检验结果,可写出回归方程如下:验结果,可写出回归方程如下:体重增量体重增量 -17.357-17.3570.2220.222进食量进食量重庆交通大学管理学院18 六月 2024*小小 结结v 相关系数r 表示两变量间的直线相关程度,r 值的范围为-11。r 为正表示X与Y之间为正相关,r为负表示负相关。r 接近于0表示两变量间关系不密切。但r 有抽样误差,故算得相关系数之后,必须检验相应的总体相关系数是否为0。重庆交通大学管理学院18 六月 2024*小小 结结v 研究中一般只涉及直线相关关系,但从理论上讲,可以进行变量间的曲线相关分析;如果希望扣除其他变量的影响,可以进行偏相关分析;如果变量不满足线性相关分析的适用条件,则可以进行Spearman秩相关分析。重庆交通大学管理学院18 六月 2024*小小 结结 在意义和应用上,回归反映两变量间的依存关系,相关反映两变量间的相互关系。在资料要求上,相关要求X与Y都是随机变量,而且服从双变量正态分布,这种资料若进行回归分析,一般称为型回归模型。而回归要求应变量Y是随机变量,服从正态分布,自变量是固定的非随机变量,建立的模型称为型回归模型。v 相关与回归既有区别又有联系。写在最后写在最后成功的基成功的基础在于好的学在于好的学习习惯The foundation of success lies in good habits43谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way讲师:XXXXXX XX年XX月XX日
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!