相关与回归课件

上传人:无*** 文档编号:241619707 上传时间:2024-07-10 格式:PPTX 页数:58 大小:1.19MB
返回 下载 相关 举报
相关与回归课件_第1页
第1页 / 共58页
相关与回归课件_第2页
第2页 / 共58页
相关与回归课件_第3页
第3页 / 共58页
点击查看更多>>
资源描述
第六章第六章 简单相关与回归简单相关与回归 前面各章我们讨论的问题,都只涉及到一个变量,如体重、日增重、产仔数、体温、血糖浓度、产奶量、产毛量或孵化率、发病率等。但是,由于客观事物在发展过程中相互联系、相互影响,因而在畜牧、水产等试验研究中常常要研究两个或两个以上变量间的关系。变量间的关系有两类:一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。如长方形的面积(S)与 长(a)和 宽(b)的关系可以表达为:S=ab。它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。另一类是 变 量 间不存在完全的确定性关系,不能用精确的数学公式来表示。如黄牛的体长与体重的关系;仔猪初生重与断奶重的关系;猪瘦肉率与背膘厚度、眼肌面积、胴体长等的关系等等,这些变量间都存在着十分密切的关系,但不能由一个或几个变量的值精确地求出另一个变量的值。像这样一类关系在生物界中是大量存在的,统计学中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。相关变量间的关系一般分为两种:一种是平行关系,是研究变量间关系的强弱程度,此时我们不关心在它们之间是谁影响了谁,谁是因,谁是果,变量间的地位是平等的。如黄牛的体长和胸围之间的关系,猪的背膘厚度和眼肌面积之间的关系等都属于平行关系。另一种是因果关系,即一个变量的变化受另一个或几个变量的影响。如仔猪的生长速度受遗传特性、营养水平、饲养管理条件等因素的影响,子代的体高受亲本体高的影响。统计学上采用相关分析研究呈平行关系的相关变量之间的关系。对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线相关分析)。对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。统计学上采用回归分析 研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。第一节第一节 简单相关简单相关一、一、样本相关系数的定义样本相关系数的定义 假设两个随机变量(X,Y)有若干个体(n个)在这两个变量上的观测值(xi,yi)那么在直角坐标中则可作出n 对观测值的散点图(见图6-1(A)表示x与y 无相关;(B)表示y 随x 增加而增加;(C)表示y 随x 增加而减少;(D)表示x与y呈曲线关系。)。如果把零点为原点的坐标移到以(,)为原点的坐标中,其各相关点的位置不变,而各对x,y值化为 ,则在以平均数 为原点的坐标中,x轴与y轴就将整个坐标平面划分为4个象限。这时我们就可以用 描述各散点在象限中的变异情况。:+;:-+;:-;:+-。图图6-1 各类相关散点示意图各类相关散点示意图 那么,x与y的关系如何描述,办法是用+,-,中的一个作变异的合并。若用“+,-”合并,则 无意义。若用“”法合并,谁为分子,谁为分母无依据,且随意决定,会出现计算结果各不相同,而惟有用“”合并,能克服以上弊端。相乘时:、为正,反映正相关;、为负,反映负相关。将散点变异相加,即得:,此即离均差乘积和,间称乘积和。以 SPxy表示,以此可作为两变量间相关性质(方向)和相关程度的度量。为了消除两变量各自变异度及单位不同的影响,须将 各以其标准差除之,另外为了消除自由度不等的影响,便于比较,再除以自由度,于是得到相关系数r(表示简单相关程度和性质的统计量称作相关系数).样本相关系数用样本相关系数用r r 表示,总表示,总体相关系数用体相关系数用表示。表示。其中:其中:SPSPxyxy 变量变量x x和变量和变量y y的的离均差离均差乘积和乘积和简称简称乘积和乘积和SSSSx x 变量变量x x 的的离均差平方和离均差平方和 SSSSy y 变量变量y y 的的离均差平方和离均差平方和相关系数相关系数r r 的特点的特点:(1)r 为无单位的相对数值,可直接用于不同资料间相关程度的比较。(2)r1,0|r|1。|r|越接近于1,说明两变量的相关程度越强;|r|越接近于0,两变量的相关程度越差。(3)r=0表示x与y无相关,r0表示负相关,r0表示正相关,|r|=1为完全相关。二、二、样本相关系数的计算样本相关系数的计算【例6-1】表6-1为用氦氖激光照射母黄牛后血红蛋白含量(y,g)和照射天数(x,d)的资料,试求两变量的相关系数。一级数据计算如下:一级数据计算如下:三、相关系数的显著性检验三、相关系数的显著性检验 由样本资料求出的相关系数r与其他统计量一样,也存在着抽样误差,假若求得的r值不等于零,它是否是一个有意义的数值,还需要进行显著性检验之后才能作出判断。检验的目的就是要判明r所在的总体是否确有线性关系。检验时首先提出假设:H0:=0;HA:0;然后测定r与之间的差异是由于抽样误差引起的,还是本质的差异,根据构造统计量的不同分为F检验和t检验,下面以t检验步骤为例说明。1 1、H H0 0:=0=0;H HA A:002 2、t t 检验公式为检验公式为其中:其中:相关系数的标准误相关系数的标准误 误差自由度误差自由度 对于例对于例6-16-1,由公式可得:,由公式可得:故故p p0.010.01,否定,否定H H0 0:=0=0,接受,接受H HA A:00。说明。说明母黄牛血红蛋白含量和照射天数间负相关关系极母黄牛血红蛋白含量和照射天数间负相关关系极显著,表示为显著,表示为r r=*。统计学家已根据相关系数r 的t 检验法,计算出r的显著临界值并列出了表(见附表9)。实际分析资料时可以直接查附表对r 进行显著性检验。本例由dfe=9-2=7,M=2(变量个数),查r 临界值表得:r0.05(7)=0.666,r0.01(7)=0.798,而 r0.01(7)=0.798,p0,Y 随X 的增大而增大(减少 而减少)斜上;bF0.01(1,7)=12.25,pt0.01(7)=3.499,p0.71),以确保回归变异至少占y 总变异的一半以上。五、直线回归的应用五、直线回归的应用1.1.预测(预测(forecastforecast)(给定(给定X X 值,估计值,估计Y Y)2.2.控制(控制(controlcontrol)(给定(给定Y Y 值范围,求值范围,求X X 值范围)值范围)区别:区别:六、直线回归与相关的区别与联系六、直线回归与相关的区别与联系 1.1.资料资料X X、Y Y 服从双变量正态分布,即均为随机变量服从双变量正态分布,即均为随机变量 Y Y为正态为正态随机变量随机变量,X X为为选定选定变量变量 2.2.应用应用 回归回归 由一个变量值推算另一个变量值由一个变量值推算另一个变量值 相关相关 只反映两变量间互依关系只反映两变量间互依关系 3.3.回归系数与原度量单位有关,而相关系数无关回归系数与原度量单位有关,而相关系数无关回归:回归:相关:相关:联系:联系:57写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way讲师:XXXXXX XX年XX月XX日
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!