方差分析课件

上传人:6**** 文档编号:240918397 上传时间:2024-05-17 格式:PPT 页数:60 大小:344.71KB
返回 下载 相关 举报
方差分析课件_第1页
第1页 / 共60页
方差分析课件_第2页
第2页 / 共60页
方差分析课件_第3页
第3页 / 共60页
点击查看更多>>
资源描述
医学统计学方差分析Analysis of Variance医学统计学方差分析1利用统计学进行客观认知的模式总体同质、变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险利用统计学进行客观认知的模式总体总体参数样本随机样本统计量已2问题的提出ot检验的局限性两均数的比较单因素两水平问题的提出t检验的局限性3问题的提出ot检验实例某大学的学工部门想知道2007年进入该校就读的学生中,市区的学生和县区的学生成绩是否有差异。因素:生源的区域水平:市区,县区单因素两水平问题的提出t检验实例单因素4问题的提出ot检验实例不同药物的降血糖效果。分别给对照组和试验组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后血糖下降值的差异。因素:服用的药物水平:阿卡波糖,拜唐平单因素两水平问题的提出t检验实例单因素5问题的提出江苏、安徽、浙江三省的平均入学成绩安徽平均分571.23?单因素三水平江苏平均分592.79浙江平均分569.83问题的提出江苏、安徽、浙江三省的平均入学成绩安徽平均分5716问题的提出o假如安徽和江苏比,犯一类错误的概率是0.05,安徽和浙江比,犯一类错误的概率是0.05,浙江和江苏比,犯一类错误的概率是0.05。那么这三次相关的比较,犯一类错误的概率是问题的提出假如安徽和江苏比,犯一类错误的概率是0.05,安徽7问题的提出o一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。安慰剂组3.43mmol/l用药组12.72mmol/l用药组22.70mmol/l用药组31.97mmol/l?单因素四水平问题的提出一种新的降血脂药,120人分为安慰剂组,用药组1(8问题的提出o假如每次t检验犯一类错误的概率是0.05,那么要完全地进行比较须经过6次检验,则犯一类错误的概率是问题的提出假如每次t检验犯一类错误的概率是0.05,那么要完9方差分析o方差分析,又称变异数分析。oAnalysis of Variance,简写为ANOVA。o对变异进行分解和分析。o由英国统计学家R.A.Fisher提出。o又称为F检验。o应用:单因素多水平比较 多因素多水平比较 多因素多水平交互作用的比较方差分析方差分析,又称变异数分析。10R.A.Fisher18901962R.A.Fisher1890196211第一节第一节 方差分析的基本思想方差分析的基本思想方差分析课件12完全随机设计 o将观察对象随机分配为两组或多组,每组接受一种处理。o目的:通过两个或多个样本来推断相应的总体均数是否相等。完全随机设计 将观察对象随机分配为两组或多组,每组接受一种处13完全随机设计的相关概念o因素(factors):将试验对象按某种标准随机分为若干个组,加以不同的干预,这种标准称为处理因素。o在相同研究因素下的不同状态,称为不同的水平(level)。血型作为研究因素时,A型、B型、AB型和O型就是该因素的4个水平;性别作为研究因素时,男性和女性就是该因素的2个水平。完全随机设计的相关概念因素(factors):将试验对象按某14样本均数间存在差异的可能原因o一是随机因素引起的差异。包括抽样研究中的抽样误差,以及测量误差;o二是样本所属的总体确实存在实质性的差异,即差异由处理因素引起。随机因素是无法避免的,而实质性差异是我们需要得到的。如何排除随机因素的干扰,利用样本信息对总体均数间是否存在差异作出推断?样本均数间存在差异的可能原因一是随机因素引起的差异。包括抽样15方差分析的基本思想 o按照设计类型将总变异分解为处理因素引起的变异和随机因素造成的变异;o以处理因素变异与随机因素变异之比来构造检验统计量F。处理因素没有效应时,即处理因素变异主要表现为随机误差,此时F值近似为1;否则F值大于1。方差分析的基本思想 按照设计类型将总变异分解为处理因素引起的16方差分析的基本思想oF值要大到多少才表明这个差别并非随机因素造成?o需要查F界值表,通过比较F值与界值的大小来作出统计推断。方差分析的基本思想F值要大到多少才表明这个差别并非随机因素造17完全随机设计的数据结构完全随机设计的数据结构18变异分解o1、总变异(SST或SS总):k个处理组的所有观察值各不相同,这种变异为总变异,可用每一个变量值Xij与总均数的离均差平方和(简写为SS)来表示,即:SST的大小与总样本例数N的大小有关,N越大SST越大,相应的自由度为T=N-1。变异分解1、总变异(SST或SS总):k个处理组的所有观察值19变异分解o2、组间变异(SSTR或SS组间):k个不同处理组的样本均数 也不相等,其差异称为组间变异。o组间变异可能包含了处理因素的效应,也包括了自身的随机误差,其大小可用各组均数 与总均数 的离均差平方和表示,即:变异分解2、组间变异(SSTR或SS组间):k个不同处理组的20变异分解oSSTR的大小与组数以及各组例数的多少有关,相应的组间自由度TR=k-1。o为消除相应组数的影响,能客观反映组间变异的是组间均方:变异分解SSTR的大小与组数以及各组例数的多少有关,相应的组21变异分解o3、组内变异(SSe或SS组内):各个处理组内每个观察值并不相等,其差异来源于同一总体内的个体变异与测量误差,称为组内变异。o大小可用k个处理组中各组的每个观察值Xij与该组均数 的离均差平方和来表示,即:变异分解3、组内变异(SSe或SS组内):各个处理组内每个观22变异分解oSSe的大小也与各组例数ni有关,其自由度e=N-k,o为消除相应例数的影响,能客观反映组内变异的是组内均方:变异分解SSe的大小也与各组例数ni有关,其自由度e=N-23三种变异的关系 o通过数学上的证明可以表示为:SST=SSTRSSe,T=TReo构建检验统计量:F=MSTR/MSe 三种变异的关系 通过数学上的证明可以表示为:24方差分析的原理oF检验是从分析资料的变异来源入手,进而比较各种变异(组间和组内变异)的相对大小,再作出统计学结论的一类方法。o方差分析的应用条件为:各样本来自正态总体;各总体方差齐;样本独立性。方差分析的原理F检验是从分析资料的变异来源入手,进而比较各种25方差分析的优点 o不受比较组数的限制;o可同时分析多个因素的作用;o还可分析因素间的交互作用。方差分析的优点 不受比较组数的限制;26第二节第二节 单因素方差分析单因素方差分析方差分析课件27单因素方差分析o单因素方差分析:研究的是一个处理因素的不同水平间效应的差别。处理因素水平1水平2水平c水平1水平2单因素方差分析单因素方差分析:研究的是一个处理因素的不同水平28单因素方差分析o例1、某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者,A方案为每公斤体重每天口服2.5硫酸亚铁1ml,B方案为每公斤体重每天口服2.5硫酸亚铁0.5ml,C方案为每公斤体重每天口服3g鸡肝粉,治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见下表,问三种治疗方案对婴幼儿贫血的疗效是否相同?单因素方差分析例1、某地用A、B和C三种方案治疗血红蛋白含量29A、B、C三种方案治疗婴幼儿贫血的疗效观察表治疗方案血红蛋白增加量(g)A1.80.52.33.72.42.01.52.71.10.9n=201.41.22.30.70.51.41.73.03.22.5B5.00.20.50.31.91.02.4-0.42.01.6n=202.00.01.63.01.60.03.00.71.20.7C2.11.91.70.22.01.50.91.1-0.21.3n=20-0.71.31.10.20.70.90.8-0.30.71.4A、B、C三种方案治疗婴幼儿贫血的疗效观察表治疗方案血红蛋白30分析思路:o该数据要比较三组的均数,t检验不再适用,使用方差分析。可将变异分为三类:总变异(SST)组间变异(SSTR)组内变异(SSe)o计算检验统计量F=MSTR/MSe o如果三种治疗方案效果相同,F值在理论上应等于1。分析思路:该数据要比较三组的均数,t检验不再适用,使用方差31分析思路:o若三种疗法效果不同,则组间变异就会增大,F值则明显大于1。oF值大到什么程度才有统计学意义呢?根据自由度(TR,e),通过查F界值表得到P值,将其与事先规定的值比较后作出判断。若P,则可判断H0不成立,而接受H1;若P,说明上述概率并不太小,还不能认为H0不成立,故不拒绝H0。分析思路:若三种疗法效果不同,则组间变异就会增大,F值则明显32F检验步骤o建立检验假设o确立检验水准 o计算检验统计量F 计算各组基础数据 分别计算SST,SSTR,和SSe 列出方差分析表 o确定P值 o结论 F检验步骤建立检验假设33Attention:o上述结论仅说明三种治疗方案的效果总体有差别,并不表示任何两种治疗方案的效果均有差别,只能认为可能至少有两种治疗方案的效果之间有差别。o若要了解各种治疗方案相互间有无差别,还需作进一步的两两比较。Attention:上述结论仅说明三种治疗方案的效果总体有差34第三节第三节 多个样本均数的两两比较多个样本均数的两两比较方差分析课件35多个样本均数的两两比较o方差分析认为多组均数间差异有统计学意义,并不表示任何两种处理的效果均有差别,只能认为至少有两种处理的效果之间有差别。o那么在方差分析之基础上,若需了解究竟哪些组均数代表的总体之间有差别,还是各组间均有差别,可用多个样本均数的两两比较。多个样本均数的两两比较方差分析认为多组均数间差异有统计学意义36Attention:o组数大于2时用t检验分别对每两个对比组作比较,会加大犯一类错误的概率,即有可能把本来没有差别的两个总体判为有差别。o每次比较的第一类错误率为o多次比较后,至少范一次第一类错误的概率为1-(1-)m。如k=6,m=C62=15次,若=0.05,则至少有一次错误地拒绝H0(即犯一类错误)的概率为 1-(1-)m=0.54 0.05Attention:组数大于2时用t检验分别对每两个对比组作37多个样本均数的两两比较o一是各组均要相互比较,以了解任何两组间是否有差别q检验。o二是仅考虑某指定组与其它各组比较,例如有一组为对照组,意欲了解其它各实验组与该对照组间是否有差别q检验。多个样本均数的两两比较一是各组均要相互比较,以了解任何两组间38一、q检验 o多个样本均数间的两两比较常用的统计方法为q检验(又称Student-Newman-Keuls法,简称SNK法),其统计量为q:=e 一、q检验 多个样本均数间的两两比较常用的统计方法为q检验(39一、q检验o例、在前面对某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者的例题(完全随机设计方差分析例1)进行了方差分析,我们得出三组总体不等的结论。究竟哪些总体均数之间存在着差别,我们需要在前方差分析基础之上,再对该资料作两两比较的q检验。一、q检验例、在前面对某地用A、B和C三种方案治疗血红蛋白含40二、q检验 o多个实验组与一个对照组均数间的两两比较常用的统计方法为q检验,又称为Dunnett检验,其计算公式为:=e该公式与q检验统计量计算公式类似,区别仅在于算得q值后需查附表9的q界值表。二、q检验 多个实验组与一个对照组均数间的两两比较常用的统41二、q检验o例、设前面对某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者的例题中的A组为对照组,B、C两组为实验组,要求将B组、C组分别与对照组比较。二、q检验例、设前面对某地用A、B和C三种方案治疗血红蛋白42第四节第四节 两因素方差分析两因素方差分析方差分析课件43随机区组设计(配伍组设计)o为什么要配伍?配对的目的:排除干扰因素的影响;配伍的目的:使同一区组内除了研究因素外的其他其他特征尽可能相似,排除干扰因素的影响;o按窝配伍;o田间试验按区块配伍;当研究因素只有两水平时,配伍即配对 配伍设计方差分析=配对t检验(配伍是配对的延伸)随机区组设计(配伍组设计)为什么要配伍?44随机区组设计o随机区组设计(randomized block design)可以考察两个因素的作用。因素A称为处理因素;因素B称为区组因素(可能对实验效应产生影响的主要非处理因素)。o其数据可用随机区组设计的方差分析(或称两因素方差分析)作两因素多个样本均数间的比较,以提高检验功效。随机区组设计随机区组设计(randomized block 45随机区组设计的方差分析o随机区组设计资料的总变异可分解成三部分:SST=SSA+SSB+SSe,T=A+B+e o将因素B产生的变异分离出来,达到在分析因素A的作用时控制因素B干扰的目的。随机区组设计的方差分析随机区组设计资料的总变异可分解成三部分46随机区组设计的方差分析o例1、在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见下表,问三种药物有无抑瘤作用?随机区组设计的方差分析例1、在抗癌药筛选试验中,拟用20只小47第五节第五节 方差齐性检验方差齐性检验方差分析课件48两个方差的齐性检验o出现两个样本方差不等的两种可能性:1、对应的总体方差实质上不相等;2、对应的总体方差相等,由于抽样误差导致了两样本方差的不等。两个方差的齐性检验出现两个样本方差不等的两种可能性:49检验统计量F计算公式o式中 为较大方差,为较小方差,1、2为相应的自由度,n1、n2为相应的样本含量。o统计量F必然大于1。o须查附表5方差齐性检验专用F界值表,得P值,按所取 水准(一般取0.2)作出统计推断。检验统计量F计算公式50o例、某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),试判断正常人与病毒性肝炎患者血清转铁蛋白含量是否方差齐。例、某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名51多个方差的齐性检验o用方差分析比较多个样本均数前,须进行多个方差的齐性检验。o常用Bartlett检验。多个方差的齐性检验用方差分析比较多个样本均数前,须进行多个方52第六节第六节 方差分析的正确应用方差分析的正确应用方差分析课件53方差分析的正确应用o一、方差分析的应用条件 o二、变量转换 o三、两两比较o四、F值、t值、q值、q值之间的关系方差分析的正确应用一、方差分析的应用条件 54一、方差分析的应用条件o独立随机抽样(Independence);o正态性(Normality);o方差齐性(Homoscedascity);一、方差分析的应用条件独立随机抽样(Independence55二、变量转换o如果方差不齐,就不能直接进行方差分析;o变量变换目的:方差齐性化,正态化,线性化o常用方法:对数变换平方根变换倒数变换平方根反正弦变换二、变量转换如果方差不齐,就不能直接进行方差分析;56三、两两比较o从逻辑上讲,只有当方差分析拒绝H0,认为各组总体均数不等或不全相等时,才有必要进行两两比较。o两两比较不能用t检验,因为此时将人为地增加犯第一类错误的概率。o常出现模糊结论。o有时,方差分析拒绝H0,但两两比较却找不到有差异的任何两个样本。三、两两比较从逻辑上讲,只有当方差分析拒绝H0,认为各组总体57四、F值、t值、q值、q值之间的关系o在两样本均数比较时,。若此时用q检验或q检验会得到同样的结论。这说明在两样本均数比较时,t检验、F检验、q检验及q检验是等价的。o当k2时,q检验的检验功效高于q检验,因此,当实验研究按一个对照组与多个实验组均数比较而设计时,用q检验可得到较好的功效。四、F值、t值、q值、q值之间的关系在两样本均数比较时,58Thank You!59两种错误说法X1 X2 X3o样本2所代表的总体位于样本1所代表的总体和样本3所代表的总体之间;o样本1与样本2差异无统计学意义,样本2与样本3差异无统计学意义,所以样本1与样本3差异也没有统计学意义。抽样误差是不能递推的!只能说明无法判断样本2来自于何总体!两种错误说法X1 X2 X3抽样误差是不能递推的!60
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!