生物统计资料第7章课件

上传人:仙*** 文档编号:241599576 上传时间:2024-07-08 格式:PPT 页数:90 大小:608.50KB
返回 下载 相关 举报
生物统计资料第7章课件_第1页
第1页 / 共90页
生物统计资料第7章课件_第2页
第2页 / 共90页
生物统计资料第7章课件_第3页
第3页 / 共90页
点击查看更多>>
资源描述
第一节第一节第一节第一节 回归与相关回归与相关回归与相关回归与相关分析的意义分析的意义分析的意义分析的意义u、t、F、检检验验差差异异显显著著性性检检验验,只只涉及涉及一个变量一个变量。变量间的关系:变量间的关系:函数关系;函数关系;相关关系相关关系回回归归与与相相关关分分析析研研究究变变量量间间相相关关关关系系的统计方法。的统计方法。相相关关分分析析:研研究究变变量量之之间间的的联联系系程程度度和和联系性质联系性质的一种统计方法。的一种统计方法。程度:变量间关系密切程度。程度:变量间关系密切程度。变量变量关系关系 正正 一致一致 性质:性质:相关相关方向方向 负负 相反相反 一元直线相关(简单相关)一元直线相关(简单相关)相关相关分析分析 复相关复相关 多元线性相关多元线性相关 偏相关偏相关回回归归分分析析:研研究究变变量量之之间间的的联联系系形形式式的的一种统计方法。一种统计方法。联联系系形形式式用用回回归归方方程程来来表表示示。由由方方程程次次数不同来分:数不同来分:线性回归线性回归方程次数为方程次数为1 如:如:yabx。非线性回归非线性回归方程次数不为方程次数不为1 如:如:yaxb(b1)由方程的自变量个数来分由方程的自变量个数来分一元回归一元回归只有一个自变量只有一个自变量 如:如:yabx,yaxb多多元回归元回归自变量个数多于自变量个数多于1 如:如:yb0b1x1bmxm第二节第二节第二节第二节 直线回归分直线回归分直线回归分直线回归分析析析析一、直线回归方程的建立一、直线回归方程的建立一、直线回归方程的建立一、直线回归方程的建立其中,其中,自变量,自变量,依变量的回归估计值依变量的回归估计值确定自、依变量的原则:确定自、依变量的原则:1.因果关系明确:因果关系明确:原因原因变量作变量作自变量自变量 x;结果结果变量作变量作依变量依变量 y。2.因果关系不明确:因果关系不明确:作估测依据作估测依据的变量作的变量作自变量自变量x;被估测被估测的变量作的变量作依变量依变量 y。a回回归归截截距距(直直线线在在 y 轴轴上上的的切切割点)割点)b回回归归系系数数,其其统统计计意意义义为为 y 随随 x 改改变变一一个个单单位位而而改改变变的的单单位位数数;几何意义是直线的斜率。几何意义是直线的斜率。有有一一双双变变量量总总体体(X,Y),从从中中抽抽出出一一个容量为个容量为 n 的双变量样本(的双变量样本(x,y)于是,于是,但但 y 00要求:总偏差最小。要求:总偏差最小。可证可证 最小最小 总偏差最小总偏差最小令令于于是是,通通过过求求 最最小小值值解解出出a、b最小二乘法最小二乘法:求偏导数:求偏导数:整理第一个方程得,整理第一个方程得,代入第二个方程得,代入第二个方程得,整理得,整理得,其中,其中,SP离均差离均差乘积和乘积和 SSx自变量的自变量的离均差离均差平方和平方和由由b的公式可见,的公式可见,b的符号由分子的符号由分子SP确定。确定。当当 时时,故故回回归归直直线线一一定定要要过过(,)这一点。可以证明,)这一点。可以证明,的平均数就是的平均数就是 。例例1,例例7-1解:一级统计数解:一级统计数二级统计数二级统计数注:回归与相关分析中,一般要求中注:回归与相关分析中,一般要求中间结果保留间结果保留4 46 6位小数。位小数。回归方程:回归方程:b的解释:的解释:b=1.0996表明累积温每升表明累积温每升高(或减少)高(或减少)1,将使一代三化螟蛾,将使一代三化螟蛾的盛发期提前(或延迟)约的盛发期提前(或延迟)约1.1天。天。二、回归关系的显著性检验二、回归关系的显著性检验二、回归关系的显著性检验二、回归关系的显著性检验检验检验x与与y是否有真实的回归关系。是否有真实的回归关系。H0:0 HA:0 F检验:检验:回归关系引起的变异回归关系引起的变异依变量依变量y的总变异的总变异 其它因素引起的变异其它因素引起的变异 因为因为所以所以其中,其中,回归平方和,记作回归平方和,记作 SSR 离回归平方和(偏差离回归平方和(偏差 平方和)记作平方和)记作 SSr所以,所以,SSySSRSSr 相应地,相应地,dfydfRdfr其中,其中,dfyn1 dfR1 dfrdfydfRn2各项平方和的实用计算公式:各项平方和的实用计算公式:SSrSSySSRSSy S2R SSR,S2r注注:叫叫做做回回归归估估计计标标准准误误,是是表表示示回回归归估估计计精精度度的的重重要要统统计计数数。Syx大大(或或小小),由由回回归归方方程程估估计计 y 的精度就低(或的精度就低(或高高)。)。FF0.05 接受接受 不显著不显著。当当 F0.05F F0.01,所以否定所以否定H0,推断回归推断回归关系极显著,即表明累积温关系极显著,即表明累积温x与一代三与一代三化螟蛾盛发期化螟蛾盛发期 y 具有真实的直线关系。具有真实的直线关系。t 检验:检验:可证:当分子自由度可证:当分子自由度1时,时,F与与 t 有如有如下关系:下关系:Ft2其中,其中,叫做叫做回归系数标准误回归系数标准误。查临界查临界 t 值用离回归自由度值用离回归自由度dfrn2。上例,上例,已知:已知:b=1.0996,SSx=144.6356,SSr=74.6670,n=9解:解:df=n2=92=7 t0.05(7)=2.36 t0.01(7)=3.50因为因为|t|t0.01(7),所以否定所以否定H0,推断回归推断回归关系极显著,即表明累积温与一代三化关系极显著,即表明累积温与一代三化螟蛾盛发期具有真实的直线关系。螟蛾盛发期具有真实的直线关系。三、直线回归方程的图示三、直线回归方程的图示三、直线回归方程的图示三、直线回归方程的图示由由 ,和和 ,两点画直线。两点画直线。上例,上例,31.7 48.54851.099631.713.6912 44.2 48.54851.099644.20.05380 30 34 38 42 46 x510y15(,)四、回归方程的应用方向四、回归方程的应用方向四、回归方程的应用方向四、回归方程的应用方向1.预测:预测:由由 x 去预测去预测 y。在产量预测、病虫害预报等方面应用较多。在产量预测、病虫害预报等方面应用较多。例例,一一代代三三化化螟螟蛾蛾盛盛发发期期 y 与与三三至至四四月月积积温温 x 的回归方程如下:的回归方程如下:48.54851.0996 x假设某年的积温假设某年的积温 x35,则则 48.54851.09963510.062510.1该虫盛发期约为该虫盛发期约为5月月20日(以日(以10/5为为0)左右。)左右。2.控制控制:由由 y 去控制去控制 x。这主要在制定生产措施时用。这主要在制定生产措施时用。例例,某某作作物物产产量量y与与施施肥肥量量 x 的的回回归归方方程程如如下:下:391.936.62x若若希希望望y600斤斤/亩亩,施施肥肥至至少少多多少少斤斤/亩亩?由由 391.936.62x600 可推出可推出 x (斤斤/亩)亩)注注:实实际际应应用用中中,预预测测应应结结合合误误差差和和概率进行区间估计。概率进行区间估计。应应用用回回归归方方程程时时,自自变变量量 x 的的取取值值范围只限于原观察值的变化范围。范围只限于原观察值的变化范围。样样本本容容量量 n 应应尽尽可可能能的的大大,至至少少要要大于大于5。回归分析的完整步骤:回归分析的完整步骤:第一步第一步 建立回归方程建立回归方程第二步第二步 进行回归关系的显著性检验进行回归关系的显著性检验第三步第三步 绘制回归直线绘制回归直线第三节第三节第三节第三节 直线相关分直线相关分直线相关分直线相关分析析析析一、相关系数与决定系数一、相关系数与决定系数一、相关系数与决定系数一、相关系数与决定系数相关系数:相关系数:是表示变量间的联系性是表示变量间的联系性质和联系程度的统计数。质和联系程度的统计数。设有一个双变量样本(设有一个双变量样本(x,y)xx1x2xnyy1y2yn在在xoy中,有中,有第一象限:第一象限:第二象限:第二象限:第三象限:第三象限:第四象限:第四象限:xy(x,y)yyO x x(,)O进一步讨论进一步讨论当当正相关正相关时,如右图,可见时,如右图,可见大多数点子在一、三象限,大多数点子在一、三象限,则则 0;而且当;而且当 n 一定时,一定时,在第一、三象限的点子愈多(相应第二、在第一、三象限的点子愈多(相应第二、四象限的点子就愈少),此和值的绝对四象限的点子就愈少),此和值的绝对值值 也愈大,而此时也正也愈大,而此时也正是正相关程度愈大。是正相关程度愈大。yx当当负相关负相关时,如右图,可见时,如右图,可见大多数点子在二、四象限,大多数点子在二、四象限,则则 0;而;而且当且当n一定时,在第二、四象限的点子愈一定时,在第二、四象限的点子愈多(相应第一、三象限点子就愈少),此多(相应第一、三象限点子就愈少),此和值的绝对值和值的绝对值 也愈大,也愈大,而此时也正是负相关程度愈大。而此时也正是负相关程度愈大。yx当当无关无关时,如右图,可见时,如右图,可见点子在四个象限分布均匀,点子在四个象限分布均匀,这样,这样,0。值值受受变变量量单单位位、样样本本容量容量n 影响。影响。yx当正相关时,当正相关时,0,于是,于是,r0;极端地,完全正相关时,极端地,完全正相关时,y (x ),),则则 r1。当负相关时,当负相关时,0,于是,于是,r0;极端地,完全负相关时,极端地,完全负相关时,y (x ),),则则 r1。当无关时,当无关时,0,于是,于是,r0 所以,相关系数的取值范围:所以,相关系数的取值范围:1r1 or r1r愈愈接接近近于于1(0),表表明明变变量量的的相相关关程度愈大(程度愈大(小小)。)。决定系数:决定系数:SSR 表示回归关系引起的变异部分表示回归关系引起的变异部分相关系数的平方相关系数的平方决决定定系系数数 r2 表表示示在在依依变变量量 y 的的总总变变异异中中,由由回回归归关关系系引引起起的的变变异异部部分分所所占占的的百百分分比比。例例如如,r0.8,r20.64,表表示示由由回回归归关关系系引引起起的的变变异异部部分分只只占占 y 的的总总变变异异的的64,还有还有36是其它因素引起的变异。是其它因素引起的变异。决定系数决定系数 r2是在相关系数是在相关系数r显著时才计算。显著时才计算。例例2,例例7-3已知:已知:SSx=144.6356 SSy=249.5556 SP=159.0444 n=9二、相关系数的显著性检验(二、相关系数的显著性检验(二、相关系数的显著性检验(二、相关系数的显著性检验(t t 检验)检验)检验)检验)设一双变量总体(设一双变量总体(X,Y),),相关系数相关系数 0,r0?0,r0H0:0 HA:0 t 检验:检验:相关系数标准误相关系数标准误 查临界查临界 t 值的自由度值的自由度dfn2 显著水准显著水准0.05,0.01前例,已知:前例,已知:r=0.8371 n=9df=n2=92=7 查表查表3:t0.05(7)=2.365 t0.01(7)=3.499因为因为|t|t0.01(7),所以否定所以否定H0,推断相推断相关系数极显著。关系数极显著。表明一代三化螟蛾表明一代三化螟蛾盛发期与盛发期与3月下旬至月下旬至4月中旬积温呈月中旬积温呈极显著负相关,即积温愈高极显著负相关,即积温愈高(低低),盛发期愈早(盛发期愈早(迟迟)。表表8,r 与与 R 的显著值表:由的显著值表:由 df=n2 和变量个数和变量个数 M=2 作查表参数。作查表参数。本例,本例,r=0.8371*df=92=7 r0.05(7)=0.666 r0.01(7)=0.798决定系数决定系数 r2=0.7007 表明,在一代三表明,在一代三化螟蛾盛发期的变异中,仅有化螟蛾盛发期的变异中,仅有70.07%是由是由3月下旬至月下旬至4月中旬的积温不同所月中旬的积温不同所引起的。引起的。相关分析的完整步骤:相关分析的完整步骤:第一步第一步 计算相关系数和决定系数;计算相关系数和决定系数;第二步第二步 相关系数的显著性检验。相关系数的显著性检验。第四节第四节第四节第四节 应用相关与回归分析应用相关与回归分析应用相关与回归分析应用相关与回归分析时时时时应注意的问题应注意的问题应注意的问题应注意的问题一、相关与回归的关系一、相关与回归的关系一、相关与回归的关系一、相关与回归的关系1.两种方法研究变量关系的角度不同。两种方法研究变量关系的角度不同。2.回回归归分分析析的的两两变变量量(x,y)地地位位不不同同,而相关分析的两变量地位无差别。而相关分析的两变量地位无差别。而而 ryxrxy3.r 无单位,无单位,b 有单位;有单位;r1,b 的范围较大。的范围较大。4.r 与与 b 的符号是一致的,都表达的符号是一致的,都表达变量的联系性质。变量的联系性质。5.r 显显著著性性检检验验与与回回归归关关系系显显著著性性检检验验结结果果一致。一致。回归:回归:相关相关6.r 为两个回归系数的几何平均数,它为两个回归系数的几何平均数,它包含了两个回归系数的信息。包含了两个回归系数的信息。二、应用相关与回归分析时应注意事项二、应用相关与回归分析时应注意事项二、应用相关与回归分析时应注意事项二、应用相关与回归分析时应注意事项1.研究变量间的关系,应注意其实际意义。研究变量间的关系,应注意其实际意义。2.必必须须严严格格控控制制被被研研究究的的两两变变量量以以外外的的各各因因素,使其尽可能地保持一致。素,使其尽可能地保持一致。3.一一个个不不显显著著的的相相关关系系数数只只能能说说明明 x 与与 y 不不具有直线关系,不能断然说其独立无关。具有直线关系,不能断然说其独立无关。4.一个显著的回归,并不一定具有实践上一个显著的回归,并不一定具有实践上的预测意义。例如,若一个样本容量的预测意义。例如,若一个样本容量 n102 的资料,当其的资料,当其r0.254 时便时便为极显著。而此资料的为极显著。而此资料的 y 的变异中只有的变异中只有 r20.2542 0.0645 6.45是由是由 x 决决定的,还有定的,还有93.55的变异部分是由其它的变异部分是由其它因素决定的。所以,实际应用中,因素决定的。所以,实际应用中,r2 至至少要大于少要大于 0.5。5.回归方程和相关系数的应用,要注意其回归方程和相关系数的应用,要注意其适用范围。适用范围。第五节第五节第五节第五节 可直线化的可直线化的可直线化的可直线化的曲线回归分析曲线回归分析曲线回归分析曲线回归分析一、曲线回归分析的意义一、曲线回归分析的意义一、曲线回归分析的意义一、曲线回归分析的意义变量的非线性关系如,变量的非线性关系如,曲曲线线回回归归分分析析:研研究究具具有有曲曲线线关关系系的的变变量量间联系形式的统计方法。间联系形式的统计方法。本本节节只只介介绍绍通通过过变变量量代代换换可可转转化化为为直直线线回回归问题的曲线回归(只有一个自变量)归问题的曲线回归(只有一个自变量)xyxy二、非线性回归分析的步骤二、非线性回归分析的步骤二、非线性回归分析的步骤二、非线性回归分析的步骤第一步第一步 描散点图,确定回归方程的模型:描散点图,确定回归方程的模型:回归模型回归模型xx1x2 xnyy1y2 ynxy第二步第二步 求方程中待定系数,建立回归方程:求方程中待定系数,建立回归方程:1.将曲线方程化为直线方程将曲线方程化为直线方程 例如,将例如,将 化直:化直:令令 则则2.求待定系数建立线性方程;求待定系数建立线性方程;3.对线性方程作回归关系显著性检验;对线性方程作回归关系显著性检验;4.将线性方程还原为非线性方程:将线性方程还原为非线性方程:如上例如上例 alg1a三、曲线回归的直线化三、曲线回归的直线化三、曲线回归的直线化三、曲线回归的直线化常见曲线方程类型及化直的方法:常见曲线方程类型及化直的方法:(一)幂函数(一)幂函数1.一般幂函数:一般幂函数:(a0)化直:化直:b1xy0b1-1b0b=-1bF0.01,所以推断直线回归关系,所以推断直线回归关系极显著,也说明用双曲线函数来拟极显著,也说明用双曲线函数来拟合合 x 与与 y 关系是有效的。关系是有效的。5、将方程还原成曲线方程:、将方程还原成曲线方程:毛细管水上升高度(毛细管水上升高度(x)与经历时数)与经历时数(y)的回归方程为)的回归方程为 也即也即测测 验验 题题对于茶树主干粗(对于茶树主干粗(y)与单株与单株产量(产量(x)的资料,求回归的资料,求回归系数的公式应为什么?系数的公式应为什么?
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!