资源描述
方差分析 (analysis of variance, 简称为ANOVA),方差分析是对多个样本平均数差异显著性检验的一种方法,也就是推断对多个样本均数是否相等的方法。,1,方差分析的适用条件 各处理组样本来自正态总体 各样本是相互独立的随机样本 各处理组的总体方差相等,即方差齐性,方差分析 (analysis of variance, 简称为ANOVA),2,方差分析 单因素方差分析 双因素方差分析(重复试验和非重复试验) 多因素方差分析 协方差分析,方差分析 (analysis of variance, 简称为ANOVA),3,单因素方差分析 单因素方差分析也叫一维方差分析,用以对单因素多个独立样本均数进行比较,给出方差分析表,并可以进行两两之间均数的比较(多重比较),本节将介绍如何利用单因子方差分析命令对数据进行统计处理。,方差分析 (analysis of variance, 简称为ANOVA),4,方差分析 (analysis of variance, 简称为ANOVA),1 在三个不同密度的小麦地里测量其株高2/3处的日平均温度,一共测量6天,所得数据如下表,分析不同密度的小麦地其株高2/3处的日平均温度有无显著差异。(密度1密度2密度3),5,方差分析 (analysis of variance, 简称为ANOVA),6,方差分析 (analysis of variance, 简称为ANOVA),7,方差分析 (analysis of variance, 简称为ANOVA),8,方差分析 (analysis of variance, 简称为ANOVA),9,单因素方差分析齐次性检验结果:t=0.357,p=0.7060.05,通过方差齐次性检验。即本例属于方差相等时的方差分析问题,这为下面的分析作准备。,方差分析 (analysis of variance, 简称为ANOVA),10,单因素方差分析结果,包括组间离差平方和、组内离差平方和总离差平方和。从表中可知,p=0.0330.05,说明三个不同密度的小麦群体中2/3高度的温度差异显著。进而可以进行多重比较。,方差分析 (analysis of variance, 简称为ANOVA),11,多重比较结果,从表中可知密度1和密度3两两之间差异显著;密度1和2,2和3之间差异不显著。,方差分析 (analysis of variance, 简称为ANOVA),12,方差分析 (analysis of variance, 简称为ANOVA),单变量单因子方差分析 单变量方差分析属于广义线性模型(General Linear Model)中的一部分, 本分析包括的范围非常广泛,既可以分析单因子,也可以分析多因子,还可以进行协方差,最后给出方差分析表,并可以进行多重比较。和单因子方差分析(One way ANOVA)相比,单因子方差分析中的都可以在本分析中实现。,13,1 在三个不同密度的燕麦地里测产,每个密度取样测了6块地,数据如下表,试问不同密度小麦地产量有无差异,差异来自那两个密度之间。(密度1密度2密度3),14,15,16,17,18,19,从表中可知,p=0.0470.05,说明三个不同密度的燕麦产量差异显著。进而可以进行多重比较。,20,多重比较结果,从表中可知密度1和密度3两两之间差异显著;密度1和2,2和3之间差异不显著。,21,22,回归分析与相关分析 回归和相关的概念,23,回归分析内容,24,相关分析,2 下表为青海一月平均气温与海拔高度及纬度的数据,试分析一月平均气温与海拔高度,一月平均气温与纬度是否存在线性关系(计算一月气温分别与海拔高度和纬度的简单相关系数)。,25,26,27,28,从上表可知,一月气温与海拔高度和纬度的相关系数分别为-0.728和-0.186,说明一月气温与海拔高度和纬度均呈负相关关系;进一步对照其所对应的显著性分别为0.0070.05,表明一月气温与海拔高度的相关性显著,而一月气温与纬度的相关性不显著。,29,2 下表为青海一月平均气温与海拔高度及纬度的数据,试分析一月平均气温与海拔高度和纬度的偏相关系数(因为第三个变量纬度(海拔)的存在所起的作用,可能会影响纬度(海拔)与一月平均温度之间的真实关系)。,30,31,32,33,将-0.728与-0.941对照;同时再与前面讲的例子对照看有什么不同,从表中可知-0.728是一月温度和海拔高度的简单相关系数;而-0.941是一月气温与海拔高度的偏相关系数,34,35,将-0.186与-0.875对照;同时再与前面讲的例子对照看有什么不同,36,3 一条河流流经某地区,其降水量X(mm)和径流量Y(mm)多年观测数据如表所示。试建立Y与X的线性回归方程,并根据降水量预测径流量。,回归分析(一元线性回归),37,38,39,40,41,从表中可知FF0.01(p0.01),说明方程通过了显著性检验,说明径流量与降水量之间存在着极显著的直线回归关系,方程检验表,42,从表中可知tt0.01(p0.01),说明方程中的回归系数通过了显著性检验,说明径流量与降水量之间有真实的直线回归关系。,系数检验表,43,4 随机抽测某渔场16次放养记录,结果如表(投饵量,放养量,鱼产量)。试求鱼产量对投饵量、放养量的多元回归方程。(要求进行方程和系数的显著性检验),回归分析(多元线性回归),44,45,46,47,方程检验表,从表中可知FF0.01(p0.01),说明方程通过了显著性检验,说明鱼产量依投饵量、放养量的二元线性回归达到显著水平,48,系数检验表,从表中可知X1和X2对应的t均大于t0.01(p0.01),说明投饵量和放养量对鱼产量的偏回归系数达极显著水平,偏回归系数通过显著性检验,即鱼产量与投饵量、放养量之间存在真实的多元线性关系。因此,所建方程为 Y=-4.349+0.584X1+2.964X2,49,
展开阅读全文