SPSS软件的操作示范及在医学研究中的应用课件

上传人:风*** 文档编号:241759155 上传时间:2024-07-21 格式:PPT 页数:138 大小:11.11MB
返回 下载 相关 举报
SPSS软件的操作示范及在医学研究中的应用课件_第1页
第1页 / 共138页
SPSS软件的操作示范及在医学研究中的应用课件_第2页
第2页 / 共138页
SPSS软件的操作示范及在医学研究中的应用课件_第3页
第3页 / 共138页
点击查看更多>>
资源描述
SPSS最新版:PASW Statistics 18-统计数据实例演示软件的操作及应用SPSS最新版:PASW Statistics 18-统1SPSS简介nSPSS的全称是:Statistical Program for Social Sciences,即社会科学统计程序;或 Statistical Package for the Social Science(社会科学统计软件包)。nSPSS 名为社会科学统计软件包,这是为了强调其在社会科学应用的一面(因为社会科学研究中的许多现象都是随机的,要使用统计学来进行研究),而实际上广泛应用于经济学、社会学、生物学生物学、教育学、心理学、医学医学以及体育、工业、农业、林业、商业和金融等多个领域。SPSS简介SPSS的全称是:Statistical Pro2SPSS简介nSPSS 和SAS、BMDP 并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS 软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。n和国际上几种统计分析软件比较,它的优越性更加突出。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab 的总体印象分的统计中,其诸项功能均获得最高分。SPSS简介SPSS 和SAS、BMDP 并称为国际上最有影3SPSS简介nSPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描描述述性性统统计计、均均值值比比较较、一一般般线线性性模模型型、相相关关分分析析、回回归归分分析析、对对数数线线性性模模型型、聚聚类类分分析析、数数据据简简化化、生生存存分分析析、时时间间序序列列分分析析、多多重重响响应应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS简介SPSS 的基本功能包括数据管理、统计分析、图表4目录:目录:nT检验检验n方差分析方差分析n2检验n非参数非参数检验n一元一元线性与回性与回归n多元多元线性回性回归目录:T检验5(一)(一)t检验检验n对于两组计量资料的均数作统计学检验可用t检验。它要求该两组资料都分别服从正态分布或近似正态分布,并且要求两组的方差具有齐同性。nT检验可分为配对配对t检验检验(Paired-samples T test)和两组独两组独立样本的立样本的t检验检验(Independent-samples T test)。(一)t检验对于两组计量资料的均数作统计学检验可用t检验。它6n配对配对t检验检验 例例1:有:有12名接种卡介苗的儿童,八周后用两批不同的结核菌名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(mm)如表如表1所示,问两种结核菌素的反应性有差别。所示,问两种结核菌素的反应性有差别。(一)(一)t检验检验配对t检验(一)t检验7n表表1.12名儿童分别用两种结核菌素的皮肤浸润反应结果名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)编号标准品新制品编号标准品新制品112.010.0710.58.5214.510.087.56.5315.512.599.05.5412.013.01015.08.0513.010.01113.06.5612.05.51210.59.5表1.12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm8n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件9n第二步:正态性检验设置第二步:正态性检验设置第二步:正态性检验设置10n第二步:正态性检验设置第二步:正态性检验设置第二步:正态性检验设置11n第二步:正态性检验结果第二步:正态性检验结果第二步:正态性检验结果12n第三步:作配对第三步:作配对t检验检验第三步:作配对t检验13n第三步:配对第三步:配对t检验设置检验设置第三步:配对t检验设置14n第三步:配对第三步:配对t检验结果检验结果第三步:配对t检验结果15n两组独立样本的两组独立样本的t检验检验 例例2:25例糖尿病患者随机分成两组,甲组单纯用药物例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(腹血糖(mmol/L),如表),如表2所示,问两种疗法治疗后所示,问两种疗法治疗后患者血糖是否相同?患者血糖是否相同?(一)(一)t检验检验两组独立样本的t检验(一)t检验16n表表2.25名糖尿病患者两种疗法治疗后二个月血糖值名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)编号编号甲组血糖值(甲组血糖值(X2)编号编号乙组血糖值(乙组血糖值(X2)18.415.4210.526.4312.036.4412.047.5513.957.6615.368.1716.7711.6818.0812.0918.7913.41020.71013.51121.11114.81215.21215.61318.7表2.25名糖尿病患者两种疗法治疗后二个月血糖值(mmol17n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件18n第二步:正态性检验设置第二步:正态性检验设置第二步:正态性检验设置19n第二步:正态性检验设置第二步:正态性检验设置第二步:正态性检验设置20n第二步:正态性检验结果第二步:正态性检验结果第二步:正态性检验结果21n第三步:两组独立样本的第三步:两组独立样本的t检验设置检验设置第三步:两组独立样本的t检验设置22n第三步:两组独立样本的第三步:两组独立样本的t检验设置检验设置第三步:两组独立样本的t检验设置23n第三步:两组独立样本的第三步:两组独立样本的t检验结果检验结果第三步:两组独立样本的t检验结果24(二)方差分析(二)方差分析n对于独立地来自于正态分布总体且总体方差相等的k(k3)个样本均数的比较,t检验不再适用。方差分析(analysis of variance,ANOVA)则是解决上述问题的重要分析方法。方差分析还可用于多因素多水平组间效应分析、回归分析等。n方差分析由R.A.Fisher(1923)首先提出,故又称为F检验。其基本思路是将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的推断。(二)方差分析对于独立地来自于正态分布总体且总体方差相等的k25(二)方差分析(二)方差分析n完全随机设计(completely random design)的方差分析,即单因素方差分析(one-way analysis of variance)。n方差分析中均数的两两比较。n随机区组设计(randomized block design)的方差分析(配伍组设计)。n22析因设计的方差分析:析因设计(factorial design)将多个因素的各个水平进行排列组合,在每一种可能的水平组合下进行试验,以探讨各因素的效应以及各因素之间的交互效应,而且通过比较各种组合效应,找出最佳组合。(二)方差分析完全随机设计(completely rando26(二)方差分析(二)方差分析n单因素方差分析(单因素方差分析(one-way ANOVA)例例3:某研究者拟探讨枸杞多糖(:某研究者拟探讨枸杞多糖(LBP)对酒精性脂肪肝()对酒精性脂肪肝(AFL)大鼠大鼠GSH(mg/gprot)的影响,将周龄)的影响,将周龄7周的周的Wistar大鼠大鼠36只随只随机分为甲、乙、丙三组,其中甲组(正常对照组)机分为甲、乙、丙三组,其中甲组(正常对照组)12只,其余只,其余24只用乙醇灌胃只用乙醇灌胃10周造成大鼠慢性周造成大鼠慢性AFL模型后,再随机分为模型后,再随机分为2组,乙组,乙组(组(LBP治疗组)治疗组)12只,丙组(戒酒组)只,丙组(戒酒组)12只,只,8周后测量周后测量GSH值,结果见表值,结果见表3,处理方式不同的大鼠的,处理方式不同的大鼠的GSH值是否相同?值是否相同?(二)方差分析单因素方差分析(one-way ANOVA)27n表表3.三组大鼠三组大鼠GSH值值甲乙丙甲乙丙79.8187.5860.2960.7087.5835.4580.6070.7362.6387.0464.4556.9665.2168.1838.2591.3468.5737.4889.0993.8849.0385.5479.0554.5393.3269.4564.98104.2880.3646.5688.6081.3465.8572.2956.4055.23表3.三组大鼠GSH值甲乙丙甲乙丙79.8187.586028n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件29n第二步:正态性检验(参考第二步:正态性检验(参考“两独立样本两独立样本t检验中的正态性检验检验中的正态性检验”)第二步:正态性检验(参考“两独立样本t检验中的正态性检验”)30n第三步:单因素方差分析及方差齐性检验设置第三步:单因素方差分析及方差齐性检验设置第三步:单因素方差分析及方差齐性检验设置31n第四步:单因素方差分析及方差齐性检验结果第四步:单因素方差分析及方差齐性检验结果第四步:单因素方差分析及方差齐性检验结果32(二)方差分析(二)方差分析n方差分析中均数的两两比较方差分析中均数的两两比较 用方差分析对多组均数作显著性检验,如果差异有显著性意义,只说明总体来说各组均数之间有差异显著性,并不意味着任意两两之间的均数差异都有显著性意义。如果需要进一步了解哪两个均数之间的差异有显著性意义,则需要进一步地作样本均数之间的两两比较,常用的统计方法是Student Newman Keuls Test(简写为NK或 SNK)和Least Significant Difference Procedure(简写为LSD)(二)方差分析方差分析中均数的两两比较33n方差分析中均数的两两比较设置方差分析中均数的两两比较设置方差分析中均数的两两比较设置34n方差分析中均数的两两比较结果方差分析中均数的两两比较结果方差分析中均数的两两比较结果35(二)方差分析(二)方差分析n随机区组设计的方差分析随机区组设计的方差分析 例例4:为探讨:为探讨Rgl对镉诱导大鼠睾丸损伤的保护作用,某研究者将对镉诱导大鼠睾丸损伤的保护作用,某研究者将同一窝别的同一窝别的3只大鼠随机地分到只大鼠随机地分到T1、T2、T3三组,进行不同处理三组,进行不同处理(T1:对照组,:对照组,T2:氯化镉组,:氯化镉组,T3:Rgl+氯化镉组),共观察氯化镉组),共观察了了10个窝别大鼠的睾丸个窝别大鼠的睾丸MT含量(含量(g/g),数据如表),数据如表4所示,试问所示,试问不同处理对大鼠不同处理对大鼠MT含量有无影响?含量有无影响?(二)方差分析随机区组设计的方差分析 36n表表4.三组大鼠三组大鼠MT含量值(含量值(g/g)窝别窝别T1T2T3140.678.3116.3244.886.0124.6336.772.1149.0449.995.4128.8559.899.2134.1654.595.9133.0738.476.4115.6841.679.9117.0946.886.5128.41044.785.3124.3表4.三组大鼠MT含量值(g/g)窝别T1T2T31437n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件38n第二步:正态性检验(参考第二步:正态性检验(参考“两独立样本两独立样本t检验中的正态性检验检验中的正态性检验”)第二步:正态性检验(参考“两独立样本t检验中的正态性检验”)39n第三步:双因素方差分析设置第三步:双因素方差分析设置第三步:双因素方差分析设置40n第三步:双因素方差分析设置:本部分的操作是认为第三步:双因素方差分析设置:本部分的操作是认为group与与block是是无交互作用无交互作用的,只考虑本因素的的,只考虑本因素的主效应主效应。第三步:双因素方差分析设置:本部分的操作是认为group与b41n第四步:双因素方差分析结果:第四步:双因素方差分析结果:组间的差异、区组间的差异组间的差异、区组间的差异都有统计学意义都有统计学意义。第四步:双因素方差分析结果:组间的差异、区组间的差异都有统计42n第五步:双因素方差分析设置:保留区组的条件下,进一步第五步:双因素方差分析设置:保留区组的条件下,进一步作组间的两两多重比较。作组间的两两多重比较。第五步:双因素方差分析设置:保留区组的条件下,进一步作组间的43n第六步:双因素方差分析结果:各组组间的差异都有统计学意义。第六步:双因素方差分析结果:各组组间的差异都有统计学意义。第六步:双因素方差分析结果:各组组间的差异都有统计学意义。44(二)方差分析(二)方差分析n22析因设计的方差分析析因设计的方差分析 例例5:某研究中,:某研究中,40只只5周龄雌性周龄雌性BALB/c小鼠被随机分为小鼠被随机分为4组,接组,接受不同的处理:受不同的处理:A1B1、A1B2、A2B1、A2B2,观测小鼠,观测小鼠BALF中中IL-4(pg/ml)水平,观测结果见表水平,观测结果见表5。(二)方差分析22析因设计的方差分析 45n表表5.小鼠小鼠BALF中中IL-4值(值(pg/ml)BB1B2AA137.4335.0432.0237.9439.2139.5833.3036.8336.8839.7733.6332.6230.5838.1936.3243.5027.4139.3036.6046.43A230.5736.2737.7645.1154.1551.6130.6335.9533.9552.4546.7747.6629.6936.0632.4454.9950.6542.7134.6948.60表5.小鼠BALF中IL-4值(pg/ml)BB1B2AA46n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件47n第三步:第三步:22析因设计的方差分析设置析因设计的方差分析设置第三步:22析因设计的方差分析设置48n第三步:第三步:22析因设计的方差分析设置:析因设计的方差分析设置:A和和B之间既有之间既有交互作用交互作用,又考虑又考虑A、B因素的因素的主效应主效应。第三步:22析因设计的方差分析设置:A和B之间既有交互作用49n第四步:第四步:22析因设计的方差分析结果:析因设计的方差分析结果:(1)A1和和A2组组IL-4值总体均数不相等;(值总体均数不相等;(2)B1和和B2组组IL-4值总体均数不相等;值总体均数不相等;(3)A与与B间存在交互效应间存在交互效应。第四步:22析因设计的方差分析结果:(1)A1和A2组I50(三)(三)2检验检验 n2检验(chi square test)也称卡方检验,是英国统计学家Pearson提出的一种用途广泛的假设检验方法。该检验以2分布(chi square distribution)为理论依据,可以推断两个(或多个)总体率以及构成比之间有误差别。(三)2检验 2检验(chi square test)也51(三)(三)2检验检验 n四格表资料的四格表资料的2检验检验n配对四格表资料的配对四格表资料的2检验检验n行行列表列表资料的料的2检验检验(三)2检验 四格表资料的2检验52(三)(三)2检验检验 n四格表资料的四格表资料的2检验检验 例例6:为了解某中药治疗原发性高血压的疗效,将:为了解某中药治疗原发性高血压的疗效,将70名高血名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表安慰剂加辅助治疗,观察结果见表6,问该药治疗原发性高,问该药治疗原发性高血压是否有效?血压是否有效?(三)2检验 四格表资料的2检验53n表表6.两种疗法治疗原发性高血压的疗效两种疗法治疗原发性高血压的疗效组别有效无效合计对照组202444试验组21526合计412970表6.两种疗法治疗原发性高血压的疗效组别有效无效合计对照组54n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件55n第二步:加权个案设置第二步:加权个案设置第二步:加权个案设置56n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置57n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置58n第四步:卡方检验结果第四步:卡方检验结果第四步:卡方检验结果59(三)(三)2检验检验 n四格表资料四格表资料2检验的校正公式检验的校正公式 例例7:某医学院抽样调查大学四年级和五年级学生近视眼患病:某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生调查情况,四年级学生调查28人的近视率人的近视率2人,五年级学生调查人,五年级学生调查14人的近视率人的近视率5人,调查结果见表人,调查结果见表7所示。问该大学四年级与五所示。问该大学四年级与五年级学生的近视眼患病率是否不同?年级学生的近视眼患病率是否不同?(三)2检验 四格表资料2检验的校正公式60n表表7.四年级与五年级学生的近视眼患病率四年级与五年级学生的近视眼患病率年级近视非近视合计四年级22628五年级5914合计73542表7.四年级与五年级学生的近视眼患病率年级近视非近视合计四61n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件62n第二步:加权个案设置第二步:加权个案设置第二步:加权个案设置63n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置64n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置65n第四步:卡方检验结果:当总例数第四步:卡方检验结果:当总例数N40但有期望值但有期望值T在在1T5时(时(T为理论频率),应该用四格表资料为理论频率),应该用四格表资料2检验的校正公式。检验的校正公式。第四步:卡方检验结果:当总例数N40但有期望值T在1T66(三)(三)2检验检验 n配对四格表资料的配对四格表资料的2检验检验 例例8:现有:现有198份痰标本,每份标本分别用份痰标本,每份标本分别用A、B两种培养基两种培养基培养结核菌,结果见表培养结核菌,结果见表8。问。问A、B两种培养基的阳性培养率两种培养基的阳性培养率是否不等?是否不等?(三)2检验 配对四格表资料的2检验67n表表8.A、B两种培养基的培养结果两种培养基的培养结果A培养基B培养基合计+48(a)24(b)7220(c)106(d)126合计68130198表8.A、B两种培养基的培养结果A培养基B培养基合计+68n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件69n第二步:加权个案设置第二步:加权个案设置第二步:加权个案设置70n第三步:配对四格表资料的卡方检验设置第三步:配对四格表资料的卡方检验设置第三步:配对四格表资料的卡方检验设置71n第四步:卡方检验结果:使用配对检验的第四步:卡方检验结果:使用配对检验的McNemar Test,双侧确切,双侧确切概率为概率为P=0.652,差异无显著性意义。,差异无显著性意义。第四步:卡方检验结果:使用配对检验的McNemar Test72(三)(三)2检验检验 n四格表的确切概率法四格表的确切概率法 例例9:将:将17名腰椎间盘突出症患者随机分成两组,分别用两名腰椎间盘突出症患者随机分成两组,分别用两种方法治疗,结果见表种方法治疗,结果见表9,问两种疗法的疗效是否不同?,问两种疗法的疗效是否不同?(三)2检验 四格表的确切概率法73n表表9.17名腰椎间盘突出症患者两种疗法的疗效表名腰椎间盘突出症患者两种疗法的疗效表疗法疗法治愈治愈未治愈未治愈合计合计新新疗法法729保守保守疗法法268合计合计9817表9.17名腰椎间盘突出症患者两种疗法的疗效表疗法治愈未治74n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件75n第二步:加权个案设置第二步:加权个案设置第二步:加权个案设置76n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置77n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置78n第四步:卡方检验结果:当四第四步:卡方检验结果:当四格表资料中出现格表资料中出现N40或或T1时(时(T为理论频率),需改用为理论频率),需改用四格表资料的四格表资料的Fisher确切概率确切概率法(法(Fishers Exact Test)。)。该法是一种直接计算概率的假该法是一种直接计算概率的假设检验方法。设检验方法。第四步:卡方检验结果:当四格表资料中出现N40或T1时(79(三)(三)2检验检验 n行行列表列表资料料2检验 例例10:某医院用:某医院用3种方案治疗急性无黄疸型病毒肝炎种方案治疗急性无黄疸型病毒肝炎254例,例,观察结果见表观察结果见表10,问,问3种疗法的有效率是否不同?种疗法的有效率是否不同?(三)2检验 行列表资料2检验80n表表10.不同方案治疗急性无黄疸型病毒肝炎的疗效不同方案治疗急性无黄疸型病毒肝炎的疗效组别组别有效有效无效无效合计合计西药组西药组5149100中中药组354580中西中西药结合合组591574合计合计145109254表10.不同方案治疗急性无黄疸型病毒肝炎的疗效组别有效无效81n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件82n第二步:加权个案设置第二步:加权个案设置第二步:加权个案设置83n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置84n第三步:卡方检验设置第三步:卡方检验设置第三步:卡方检验设置85n第四步:卡方检验结果:第四步:卡方检验结果:总的来说,西药、中药和总的来说,西药、中药和中西药疗效差异有统计学中西药疗效差异有统计学意义。但不知道究竟哪两意义。但不知道究竟哪两个组之间差异有统计学意个组之间差异有统计学意义。因此,还要进行两两义。因此,还要进行两两比较,即需要进行行比较,即需要进行行列列分割,对每两组之间的差分割,对每两组之间的差异做统计分析。异做统计分析。第四步:卡方检验结果:总的来说,西药、中药和中西药疗效差异有86补充知识:多个样本率间多重比较补充知识:多个样本率间多重比较n重复多次的假设检验,将使第一类错误重复多次的假设检验,将使第一类错误扩大,必大,必须重新重新规定定检验水准。水准。n多个样本率间多重比较有2分割法分割法和Bonferroni法法,根据重复检验的次数重新规定检验水准,以保证检验假设中第一类错误的概率不变。根据分析目的不同,k个样本率两两比较的次数不同,重新规定的检验水准的估计方法亦不同。通常有两种情况:(1)多个多个实验组间的两两比的两两比较:,k为参加检验的组数。(2)实验组与同一个与同一个对照照组的比的比较:,k为参加检验的组数。补充知识:多个样本率间多重比较重复多次的假设检验,将使第一类87补充知识:多个样本率间多重比较补充知识:多个样本率间多重比较n例10中进行3个实验组间的两两比较,检验水准用公式:计算得出:=0.0167然后,对变量“Plan”设不同的“Missing value”,进行“行列分割”计算。补充知识:多个样本率间多重比较例10中进行3个实验组间的两两88n第五步:进行西药、中药组之间的比较设置第五步:进行西药、中药组之间的比较设置第五步:进行西药、中药组之间的比较设置89n第五步:卡方检验设置第五步:卡方检验设置第五步:卡方检验设置90n第五步:卡方检验设置第五步:卡方检验设置第五步:卡方检验设置91n第五步:卡方检验结果:第五步:卡方检验结果:P=0.333 0.0167,差异无,差异无统计学意学意义,即西即西药组和中和中药组疗效无效无显著性差异!著性差异!第五步:卡方检验结果:P=0.333 0.0167,差异92n第五步:卡方检验结果:第五步:卡方检验结果:P 0.001 0.0167,差异有,差异有统计学意学意义,即中即中药组和中西和中西药组疗效差异有效差异有显著性!著性!第五步:卡方检验结果:P 0.001 0.0167,差93n第五步:卡方检验结果:第五步:卡方检验结果:P 0.001 0.0167,差异有统计学意义,差异有统计学意义,即西药组和中西药组疗效差异有显著性!即西药组和中西药组疗效差异有显著性!第五步:卡方检验结果:P 0.001 0.0167,差94(四)非参数检验(四)非参数检验 n非参数检验方法(nonparametric test)可以不考虑总体的参数和总体的分布类型,对总体的分布或分布位置进行检验。有时也称为任意分布检验(distribution-free test)。非参数检验通常适用于下述资料:(1)总体分布为偏态或分布未知的计量资料;(2)等级资料;(3)个别数据偏大或数据的某一端无确定的数值,如“0.01mg”、“150mg”等,只有一个下限或上限,而没有具体数值;(4)各组离散程度相差悬殊,即各总体方差不齐。(四)非参数检验 非参数检验方法(nonparametric95(四)非参数检验(四)非参数检验 n配对资料的符号秩和检验配对资料的符号秩和检验n两样本比较的秩和检验两样本比较的秩和检验n多个样本比较的秩和检验多个样本比较的秩和检验(四)非参数检验 配对资料的符号秩和检验96(四)非参数检验(四)非参数检验n配对资料的符号秩和检验配对资料的符号秩和检验 例例11:临床某医生研究白癜风病人的白介素:临床某医生研究白癜风病人的白介素6(IL-6)指标在)指标在白斑部位与正常部位有无差异,调查的资料如表白斑部位与正常部位有无差异,调查的资料如表11所示。所示。(四)非参数检验配对资料的符号秩和检验97n表表11.白癜风病人的不同部位白介素白癜风病人的不同部位白介素6(IL-6)指标)指标病人号病人号白斑部位白斑部位正常部位正常部位140.0388.57297.1380.00380.32123.72425.3239.03519.6124.37614.5092.75749.63121.57844.5689.76表11.白癜风病人的不同部位白介素6(IL-6)指标病人号98n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件99n第二步:非参数检验设置第二步:非参数检验设置第二步:非参数检验设置100n第三步:非参数检验设置:使用第三步:非参数检验设置:使用“Wilcoxon Signed Ranks Test”方法方法第三步:非参数检验设置:使用“Wilcoxon Signed101n第四步:非参数检验结果:平第四步:非参数检验结果:平均秩次分别为均秩次分别为3和和4.71,Z为检为检验统计量,双侧检验的概率为验统计量,双侧检验的概率为P=0.036 0.05,即差异有显著,即差异有显著性意义。性意义。第四步:非参数检验结果:平均秩次分别为3和4.71,Z为检验102(四)非参数检验(四)非参数检验n两独立样本比较的秩和检验两独立样本比较的秩和检验 例例12:对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察:对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其生存时间如表其生存时间如表12所示,问两组患者的生存时间是否不同?所示,问两组患者的生存时间是否不同?(四)非参数检验两独立样本比较的秩和检验103n表表12.两组患者生存时间(月)两组患者生存时间(月)无淋巴细胞转移无淋巴细胞转移有淋巴有淋巴细胞胞转移移无淋巴细胞转移无淋巴细胞转移有淋巴有淋巴细胞胞转移移1254624258562927126030291234381236421740462148表12.两组患者生存时间(月)无淋巴细胞转移有淋巴细胞转移104n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件105n第二步:非参数检验设置第二步:非参数检验设置第二步:非参数检验设置106n第三步:非参数检验设置第三步:非参数检验设置第三步:非参数检验设置107n第四步:非参数检验结果:双侧第四步:非参数检验结果:双侧检验检验P=0.030,双侧确切概率,双侧确切概率P=0.031,两组患者的生存时间,两组患者的生存时间差异有显著性。由于无淋巴细胞差异有显著性。由于无淋巴细胞转移组的平均秩次为转移组的平均秩次为16.20,大,大于有淋巴细胞转移组平均秩次于有淋巴细胞转移组平均秩次(9.86),故无淋巴细胞转移组),故无淋巴细胞转移组患者的生存时间明显大于有淋巴患者的生存时间明显大于有淋巴细胞转移组。细胞转移组。第四步:非参数检验结果:双侧检验P=0.030,双侧确切概率108(四)非参数检验(四)非参数检验n多个样本比较的秩和检验多个样本比较的秩和检验 例例13:研究白血病时,测定四组鼠脾:研究白血病时,测定四组鼠脾DNA含量,结果如表含量,结果如表13所示:试分析各组所示:试分析各组DNA含量有无差别?含量有无差别?(四)非参数检验多个样本比较的秩和检验109n表表13.各组鼠脾各组鼠脾DNA含量(含量(mg)的秩和计算)的秩和计算正常脾正常脾患自反性白血病的脾患自反性白血病的脾患抑制白血病的脾患抑制白血病的脾(甲组)(甲组)患移植白血病的脾患移植白血病的脾(乙(乙组)12.310.89.39.513.211.610.310.313.712.311.110.515.212.711.710.515.813.511.710.516.913.512.010.917.314.812.311.017.412.411.513.6表13.各组鼠脾DNA含量(mg)的秩和计算正常脾患自反性110n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件111n第二步:非参数检验设置第二步:非参数检验设置第二步:非参数检验设置112n第三步:非参数检验设置第三步:非参数检验设置第三步:非参数检验设置113n第四步:多个样本比较的秩和第四步:多个样本比较的秩和检验结果:用检验结果:用“Kruskal Wallis Test”(实质上用(实质上用chi-square作近似计算),作近似计算),P 0.001,差异有显著性意义。,差异有显著性意义。第四步:多个样本比较的秩和检验结果:用“Kruskal Wa114(五)一元线性相关与回归(五)一元线性相关与回归n线性相关线性相关:用来分析直线型相关关系的统计方法称为线性相关,它要求两个变量都是正态分布资料。线性关系可用统计量相关系数来定量地描述。n线性回归线性回归:线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛。分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。【在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。】(五)一元线性相关与回归线性相关:用来分析直线型相关关系的统115(五)一元线性相关与回归(五)一元线性相关与回归n例例14:从男青年总体中随机抽取:从男青年总体中随机抽取11名男青年组成样本,分名男青年组成样本,分别测量每个男青年的身高和前臂长,身高和前臂长均以别测量每个男青年的身高和前臂长,身高和前臂长均以cm为单位,测量结果如表为单位,测量结果如表14所示,试计算身高与前臂长之间所示,试计算身高与前臂长之间的相关系数。的相关系数。(五)一元线性相关与回归例14:从男青年总体中随机抽取11名116n表表14.11名男青年身高与前臂长的测量结果名男青年身高与前臂长的测量结果编号号身高(身高(cm)()(X)前臂前臂长(cm)()(Y)11704721734231604441554151734761885071784781834691804910165431116644表14.11名男青年身高与前臂长的测量结果编号身高(cm)117n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件118n第二步:用第二步:用“One Sample Kolmogorov-Smirnov Test”方法,方法,分别对分别对“height”和和“length”作正态性检验。作正态性检验。第二步:用“One Sample Kolmogorov-Sm119n第三步:线性相关分析设置第三步:线性相关分析设置第三步:线性相关分析设置120n第四步:线性相关分析结果:相关系数第四步:线性相关分析结果:相关系数r=0.801,双侧,双侧Pearson检验检验P=0.003 0.01,有统计学意义。即身高与前臂长有关。,有统计学意义。即身高与前臂长有关。第四步:线性相关分析结果:相关系数r=0.801,双侧Pea121n第五步:线性回归分析第五步:线性回归分析第五步:线性回归分析122n第五步:线性回归分析第五步:线性回归分析第五步:线性回归分析123n第六步:线性回归分析结果(第六步:线性回归分析结果(1):有关模型的参数,):有关模型的参数,R表示相关系表示相关系数为数为0.801,R Square即即R平方值,也称为确定系数,其公式为:平方值,也称为确定系数,其公式为:R2=SS回归回归/SS总总n此处此处R2=0.641表示因变量的变异种有表示因变量的变异种有64.1%可由自变量的变化来解可由自变量的变化来解释,一般来说,释,一般来说,R2值越大,回归方程越有价值。但是,是否真有意值越大,回归方程越有价值。但是,是否真有意义还有待对回归方程作显著性检验。义还有待对回归方程作显著性检验。第六步:线性回归分析结果(1):有关模型的参数,R表示相关系124n第六步:线性回归分析结果(第六步:线性回归分析结果(2):用方差分析对包含常数项):用方差分析对包含常数项的回归方程作显著性检验,的回归方程作显著性检验,F=16.097,P=0.003 0.01,可,可见经见经F显著性检验,差异有统计学意义,即此回归方程有意义显著性检验,差异有统计学意义,即此回归方程有意义(此回归方程可建立)(此回归方程可建立)。第六步:线性回归分析结果(2):用方差分析对包含常数项的回归125n第六步:线性回归分析结果(第六步:线性回归分析结果(3):回归方程的系数,常数项):回归方程的系数,常数项为为45.286,P=0.186,自变量,自变量“length”的系数为的系数为2.786,P=0.003 0.01,其标准化系数为,其标准化系数为0.801,故该回归方程为:,故该回归方程为:Y(Height)=45.286+2.786(Length)第六步:线性回归分析结果(3):回归方程的系数,常数项为45126(五)多元线性回归(五)多元线性回归n例例15:20名糖尿病人的血糖、胰岛素及生长素的测名糖尿病人的血糖、胰岛素及生长素的测定值列于表定值列于表15中,试建立血糖对于胰岛素及生长素中,试建立血糖对于胰岛素及生长素的二元线性回归方程。的二元线性回归方程。(五)多元线性回归例15:20名糖尿病人的血糖、胰岛素及生长127n表表15.糖尿病人的血糖、胰岛素及生长素的测定值糖尿病人的血糖、胰岛素及生长素的测定值病例号病例号i血糖血糖(y,mmol/L)胰胰岛素素(x1,mu/L)生生长素素(x2,ug/L)112.2115.29.51214.5416.711.43312.2711.97.53412.0414.012.1757.8819.82.33611.1016.213.52710.4317.010.07813.3210.318.89919.595.913.14109.0518.79.63116.4425.15.10表15.糖尿病人的血糖、胰岛素及生长素的测定值病例号i血糖128n第一步:建立数据文件第一步:建立数据文件第一步:建立数据文件129n第二步:用第二步:用“One Sample Kolmogorov-Smirnov Test”方法,方法,分别对分别对“x1”、“x2”和和“Y”作正态性检验。作正态性检验。第二步:用“One Sample Kolmogorov-Sm130n第三步:线性回归分析设置第三步:线性回归分析设置第三步:线性回归分析设置131n第三步:线性回归分析设置第三步:线性回归分析设置第三步:线性回归分析设置132n第四步:线性回归分析结果(第四步:线性回归分析结果(1):用方差分析对包含常数项的):用方差分析对包含常数项的回归方程作显著性检验,回归方程作显著性检验,F=16.310,P=0.002 0.01,可见经,可见经F检验,回归方程(含有常量的)有统计学意义,即此回归方程检验,回归方程(含有常量的)有统计学意义,即此回归方程可建立可建立。第四步:线性回归分析结果(1):用方差分析对包含常数项的回归133n第四步:线性回归分析结果(第四步:线性回归分析结果(2):自变量胰岛素、生长素所):自变量胰岛素、生长素所对应的对应的P值分别为值分别为0.003和和0.817,可见自变量生长素无统计学,可见自变量生长素无统计学意义。意义。因此,我们把生长素去掉,做只有胰岛素的回归方程因此,我们把生长素去掉,做只有胰岛素的回归方程。第四步:线性回归分析结果(2):自变量胰岛素、生长素所对应的134n第五步:线性回归分析结果(第五步:线性回归分析结果(1):用方差分析对包含常数项):用方差分析对包含常数项的回归方程作显著性检验,的回归方程作显著性检验,F=36.372,P 0.001,可见经,可见经F检检验,回归方程(含有常量的)有统计学意义,即此回归方程可验,回归方程(含有常量的)有统计学意义,即此回归方程可建立建立。第五步:线性回归分析结果(1):用方差分析对包含常数项的回归135n第五步:线性回归分析结果(第五步:线性回归分析结果(2):自变量胰岛素对应的):自变量胰岛素对应的P 0.001,可见自变量胰岛素有统计学意义。可得回归,可见自变量胰岛素有统计学意义。可得回归方程为:方程为:Y(血糖血糖)=21.3590.621X1(胰胰岛素素)第五步:线性回归分析结果(2):自变量胰岛素对应的P 0136n第五步:线性回归分析结果(第五步:线性回归分析结果(3):):R Square称为确定称为确定系数。此处系数。此处R2=0.802,表示因变量的变异中有,表示因变量的变异中有80.2%可可由自变量的变化来解释。一般来说,由自变量的变化来解释。一般来说,R2值越大,回归方值越大,回归方程越有价值。程越有价值。第五步:线性回归分析结果(3):R Square称为确定系数137THE ENDn谢谢!谢谢!THE END谢谢!138
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!