SPSS软件应用教程DOC

上传人:小** 文档编号:58993336 上传时间:2022-03-01 格式:DOC 页数:56 大小:2.63MB
返回 下载 相关 举报
SPSS软件应用教程DOC_第1页
第1页 / 共56页
SPSS软件应用教程DOC_第2页
第2页 / 共56页
SPSS软件应用教程DOC_第3页
第3页 / 共56页
点击查看更多>>
资源描述
实习七生存分析SPSS统计软件使用指导(第三版)主 编 贾 红泸州医学院SPSS统计软件使用指导(第三版)主编贾红副主编刘军祥叶运莉张俊辉刘娅杨超编委刘军祥叶运莉张俊辉刘娅杨超陈冬富夏英华李爱玲李丽刘杰秘书李丽刘杰泸州医学院目 录实习一SPSS统计软件概述 1实习二计量资料的统计分析 7实习三分类资料的统计分析 18实习四方差分析 26实习五回归与相关分析 46实习六非参数统计分析 56实习七生存分析 67实习八Logistic回归分析 75-69 -实习七生存分析使用说明随着科学技术的发展和计算机技术的普及,使对数据处理的技术要求也越 来越高,相应的一些数据处理的软件发展也非常迅速。目前,世界上通用的数 据分析软件主要有 SAS(Statistics Analysis System)、SPSS(Statistical Product and Service Solutions) Stata等,其中SPSS软件以其统计分析方法齐全,用户界面 极其友好,操作易学易懂而被各行各业广泛使用。作为医学生至少应该掌握一 种统计软件的使用方法。鉴于医学科研数据分析的需求和可操作性,故选用 SPSS软件作为医学统计学的计算工具。目前,随着医学研究结果报道对数据统计处理要求的提高,如对P值的报道必须有具体的数值,因此数据分析必须使用统计软件进行。有些医学研究, 如新药临床试验还对数据的管理提出了更高的要求,SPSS软件都能满足这些分析的要求。但是,统计软件必须在掌握了统计学的基本理论和基本方法的基础 上来使用,否则会导致方法的错用和结果的不合理解释。因此,建议同学们.在 学习统计学理论和方法的基础上来学习统计软件的使用。根据作者的经验,对数据分析的策略,应该遵从以下基本思路: 在进行数据统计分析之前,首先需要考虑如下几个方面的问题: 1变量的类型,是数值变量还是分类变量,是有序变量还是无序变量。2、所分析的变量是单变量、双变量还是多变量。3、资料设计类型,是完全随机设计、配伍(对)设计、析因设计还是其他 设计,是否需要分析交互作用。4、主要分析的目的:是分析数据间的关系,还是比较指标的大小,或建立 某种数学诊断模型。5、考察数据是否满足相应统计分析方法的前提条件。综合以上情况,选择统计分析方法。本实习指导主要供研究生和公共卫生学院本科生统计学上机操作练习使 用,也可为教师和其他专业学生进行科研数据分析提供参考。2011年8月修订说明为了方便医学统计学的教学与实验课上机操作练习,我们于2004年8月根据高等教育出版社出版的医学统计学(第一版)教材的内容与例题,编写了 第一版SPSS统计软件使用指导,供预防医学专业本科生和研究生使用,内容 主要包括各种常用医学统计分析方法及数据管理。随着现代生物统计方法的不 断发展和完善,多元统计分析方法在医学数据信息分析中的使用越来越多,2006年8月我们在第一版的基础上,增加了重复测量资料的方差分析和多元 Logistic回归分析两个内容,并添加了部分案例,编写了SPSS统计软件使用 指导第二版。实习指导经过 8年多的使用,学生普遍反映良好,对培养学生 数据分析处理能力起到了很大的作用,并成为研究生毕业课题数据分析的参考 用书。近年来,数据管理和数据分析已日益成为医学科研的重要组成部分。我们 根据目前国内医学统计学实验教学的改革趋势,并考虑到SPSS统计版本不断更新,功能模块增加的情况,根据高等教育出版社出版的 医学统计学(第二版) 的例题,对案例进行了全部更新,并完善了菜单中数据管理功能部分内容,从 而完成了第三版本的修订,以满足学生医学统计学实验课教学的需要。本教材 编写简洁明了,提供了案例的分析路径和方法。不仅可以作为研究生和公共卫 生学院的本科生实验课教学使用,并可为掌握了医学统计学基本原理和方法的 教师和学生自己进行数据管理分析提供参考。由于时间仓促,错误难免,敬请批评指正。编者2011年8月实习一 SPSS统计软件概述主要内容:1、SPSS for Windows简介2、SPSS软件的使用特点3、软件的安装、运行及窗口功能4、SPSS软件的数据管理功能一、SPSS for Windows 简介SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the SocialSciences即社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服 务深度的增加,SPSS公司已于2000年正式将英文全称更改为 Statistical Product and Service Solutions意为统计产品与服务解决方案”。其客户分布于通讯、医 疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业, 是世界上应用最广泛的专业统计软件。SPSS软件最早由美国斯坦福大学的三位研究生于20世纪60年代末研制,迄今已有30余年的成长历史。软件的1.05.0为DOS版本,6.0以后的版本为 windows版本,目前已被IBM公司收购,最新版本为20.0,随着版本的升级, 软件的统计分析功能也不断增强。本书内容以17.0版本进行介绍。二、SPSS软件的使用特点在操作使用上,SPSS软件尤其适合非专业统计人员使用,主要有以下特点: 用户界面友好 下拉式采单,操作简单,可以通过 Paste将菜单功能转 换为标准的SPSS源程序并进行保存,满足了某些重要技术资料档案保存的要求。数据的输入和管理方便除本身具有类似于Excel电子表格的数据输入和管理界面外,还可以很方便的与 DBASE、FoxPro、Excel、MS Acess97 Lotus 等数据库交换。结果输出精美除可以保存为专门的SPV格式外,也可以转换为文本 文件和HTML的格式文件,以便编辑。并可以通过剪切、粘贴等方式将输出的 表格复制到Word文档上,进行编辑。统计分析方法较为齐全几乎涵盖了各种成熟的统计分析方法,但对新方法的开发和使用不及SAS。更新及时 近年来,SPSS软件的版本更新加快,融合了许多新的统计 方法和技术,每次新出来的试用版及其特点都可以在SPSS公司的官方网站上(http:/www-01.ibm.eom/software/analytics/spss/ 得到及时信息。完善的帮助功能在SPSS软件中,其Tutorial模块提供了用户自学的所有内容,用户如果想要学到原汁原味的统计学原理、方法和技术,均可在里 面全部学到。三、SPSS仃.0安装和启动SPSS17.0运行环境的基本要求是:Win 98或以上的版本操作平台,32MB以上的内存,80MB以上的硬盘空间。其安装过程非常简单,一路按 next即可 完成,但其显示属性至少应在 800為00像素,并在安装前设置好。安装以后, 点击SPSS Statistics即可进入SPSS四、SPSS的主要窗口及功能SPSS主要有三大窗口,分别是数据编辑窗口( SPSS Statistics Data Edito)、 结果窗口( SPSS Statistics Viewer、程序语句编辑窗口( SPSS Statistics Syntax Editor),以下将分别作介绍。(一)数据编辑窗口 SPSS Statistics Data Editor启动SPSS以后,程序将自动打开数据编辑窗口,在窗口的左上角上有SPSS Statistics Data Editor的标示。如图1,在窗口下方的工具条有数据编辑窗口的两 个子窗口 Data View和Variable View,可分别定义变量的值(即数据)和变量(名 称和类型等)。图1.1数据编辑窗口示图1. 数据窗口 Data View SPSS启动后,首先停留在数据窗口,该窗口类似 Excel表格,可以用来输入、修改、查看和保存数据。表格的左侧为记录号,表 格的最上面为变量。统计数据的输入通常遵从以下原则:(1) One case one line即一条记录占一行,同一观察对象的数据在同一行上 显示;(2) One variable one column即一个变量或指标独占一列;(3) 同一指标的不同次测量应录入为不同的变量列。SPSS的数据文件可以直接通过 SPSS的数据编辑窗口建立,也可以由其他 文件转换,其数据文件保存的默认文件名为*sav。2. 变量窗口 Variable View 用鼠标点击窗口下方的工具条的 Variable View 即可切换到变量窗口,该窗口主要用来对变量进行定义,见图 1.2,该窗体的左 侧编号表示变量序号,上方用以定义变量的属性,将在下面的变量定义中介绍。图1.2变量窗口示图(二) 结果窗口 SPSS Statistics Viewer结果窗口用于显示SPSS处理的结果信息和运行失败以及运行错误的信息, 见图1.3,并可以在该窗口中对处理的结果进行编辑。 在该窗口保存结果文件时, 默认的文件名后缀为*.spv。图1.3结果窗口图示(三)程序语句编辑窗口 SPSS Statistics Syn tax Editor该窗口主要用于编辑 SPSS程序,可以通过选择 FileNew Syntax打开, 或在SPSS过程对话框,点击Paste按钮打开,见图1.4。编辑以后的程序可以 保存为*.sps文件。图1.4程序语句编辑窗口五、数据管理1数据文件的建立SPSS的数据文件可以通过File New Data建立和输入,也可以通过其他Excel数据、Foxbase数据等转换而来。2. 变量的定义 通过SPSS建立的数据需要对输入的变量进行定义,变量 的定义在Variable View窗口进行,需要定义的内容有:Name:变量名,SPSS的变量名最好用英文字母表示,系统不区分大小写, 但不能使用SPSS的函数符号作变量名,如 all、and、ge、ne、le、to等。Type:变量属性,用以定义数据的类型。SPSS的变量类型从Numeric (数 值型)到String(字符型)共有8种,当进行数据统计分析时,通常定义成Numeric, 便于分析;Width :变量宽度,宽度应包括小数点,定义方法同数据库;Decimals:小数点位数,顾名思义,用以定义变量的小数点位数;Label :变量标签,对变量名进行标示,如常将Group定义为分组变量;Values:变量值标签,用以对变量的取值进行定义,如当Group= 1时,表示对照组,如当Groups2时,表示实验组;Missing:缺失值,用以对缺失数据的定义,常用9或99等表示缺失值;Colum ns:列的宽度,定义列的显示宽度;Align :定义数据显示的对齐方式,默认为右对齐方式;Measure:定义变量的测量尺度,有三种 Scale Ordinal、Nominal三种, 是对变量进行精确的定义,在绘制统计图时非常有用,一般情况下少有。在以上的属性定义中,Name、Label、Measure三项常用,其他可忽略。3. 数据的录入 数据的录入在Data View窗口进行,录入方式基本同Excel 电子表格类似。可以利用 Editer菜单中的Cut、Copy、Past Clear、Find等功能 进行剪切、拷贝、粘贴、清除、查找等功能进行编辑。4. 数据的编辑 输入以后的数据可以利用 Data菜单进行编辑。Data菜单 见图1.5。主要功能有:Define Variable Properties 定义变量属性Sort Cases按指定的变量排序Tran spose数据转置-75 -实习七生存分析Merge Files 合并数据库Split File 分割数据库Select Cases选择记录Weight Cases指定为频数5. 数据的转换 Transform菜单见图1.6,常用的功能有:Compute VariableCount Values within Cases Recode into Same Variables、Recode into DifferentVariables、Rank Cases都是用于根据原变量产生新变量的,其使用方法将在具体 的例题中介绍。除此外,还有产生随机数字的功能Ra ndom Number Gen erators自动生成时间序列变量功能Create Time Series等菜单,在此不作一一介绍。总之,要正确使用SPSS软件,学会正确建立数据文件是非常重要的,不同的统计分析,其数据格式要求是不一样的,我们将在每一具体的统计分析方法 例题中介绍。图1.5 Data菜单功能Lrensform Analyze graphs UtilitiesCompute Variable.X? Count Values within Cases .Shift Values,.x*x Recode into Same Variables 軒y Recode into Different Variables.爲 Automate Recode.;; Visual Binning.Optimal Binning.號 Rank Cases.鳳 Date and Time Wizard.Z Create Time Series.3 RepllaceMissing Values.聲 Random Number Generertors. Run Pending TransformsCtrLG图 1.6Transform 菜单实习一 计量资料的统计分析主要内容:1、 计量资料的统计描述(Descriptive Statistics2、 样本均数与总体均数的比较(One-Sample T Tes)3、配对设计均数的比较(Paired-Samples T Test4、 两独立样本均数的比较(Independent-Samples T Test、计量资料统计描述(一)计量资料常用统计指标的计算: 计量资料的统计描述是统计分析的基础,在 SPSS中 Descriptive 禾口 Frequency等 几个过程中都可以做,但常用的是 Descriptive 过程。1. Descriptive过程在此过程中可以 做以下几个方面的分析,见图2.1。计算均数(Mean)、总和(Sum)描述其离散趋势Dispersion:包括 标准差(Std.deviation)、方差(Varianee)、 全距(Rang)、最大值(Maximum )、最小 值(Minimum )、标准误(S.E.mear)描述其分布 Distribution :峰度 (Kurtosis、和偏度(Skewnes9图2.1 Descriptive 的功能选择定义显示的顺序等基本操作步骤:An alyze DescriptiveStatistics Descriptives。例2.1 (教材例4.2)在某市2005年进行的小学生体质评价研究中,测定了-79 -实习七生存分析120名9岁男孩的肺活量(L),资料如下,根据该资料计算常用统计指标。表2.1某市2005年120名9岁男孩的肺活量测定结果(L)1.7061.3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.9892.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.3521.8321.4441.7371.4591.4501.7821.5551.6341.5082.3431.5091.7451.9531.7441.6951.7071.9011.8251.5972.3381.7081.7111.8561.6441.7161.9781.5341.9001.5951.6461.9051.6101.6141.4222.3012.1271.3481.3171.0621.8301.9801.5701.4951.8642.1702.0001.7051.8631.4242.0222.0681.5761.8331.6592.2121.3992.1281.5431.5621.3821.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735数据文件的建立和数据录入此数据是一个单变量的数值资料,在数据窗口先建立一个文件名为 feihuoliang的数据库,并定义变量名为X,小数点位数是3,其他定义忽略,进 行数据录入。数据分析依次选取 AnalyzeDescriptive Statistic Descriptive 菜单,见图 2.2,打开 对话框,如图2.3,将变量x调入分析变量框,并打开Options选择框,如图2.4, 选择均数 Mean、标准差Std deviation、最小值Minimum、最大值Maximum,还 可以对其分布(Distribution )进行分析。选择后,点Countinue返回对话框,按 OK提交执行。图 2.2 调用 Analyze Descriptive Statistic Descriptive 过程图2.3变量调入对话框图2.4 Options选择框结果解释在结果窗口可以得到如下分析的结果表,总例数N是120例,最小值Minimum是 0.989,最大值 Maximum 为 2.406,均数 Mean 是 1.67236,标准差 Std. Deviation 是0.298299,见下表。Descriptive StatisticsNMinimumMaximumMeanStd. Deviationx120.9892.4061.67236.298299Valid N (listwise)1202. Freque ncies 过程其主要功能与Descriptive基本类似,所不同的是还可以对频数分布的情况 进行描述,包括计算四分位间距及所有变量值的累计频率。此外,还能利用其Charts 功能作图,包括条图(Bar charts)饼图(Pie charts)直方图(Histograms,见图2.5。图2.5 Frequency过程的统计功能和图形功能二、频数分布表和直方图的编制以例2.1的数据绘制频数分布表和直方图1. 将原变量x转换为变量z依次选取Transform Compute Variable菜单,打开对话框,见图2.6,输入如下代码: z=x-MOD(x-0.980 , 0.130),其中MOD(x-0.980, 0.130)为两数相除的余数函数,0.980为频数表的最低下限,0.130 为组距i,上面代码的含义为将x变量转换为z变量,即原数据(x)中在0.980(0.980+0.130范围内的数据将转换为 z变量中的“0.980”,1.110( 1.110+0.130 范围内的数据将转换为z变量中的“ 1.110”,以此类推。点OK提交执行,结果如图2.7goIriansformAnalyze rflph? ait 底s Addj Cctwule Varieiale.x? Ciiri VaJues wthi仃匚昭Sif| Venues .172.0161.8151719192.0121619Recode into Same Variables .Esc ode irto Dillcrcnt Varabtes. 爲 AutamarticRecode. yi瞽址1旦mlng . 直 Opiimfll Efirning|4- Rank Cases.希 Date and THne Wizard .Oresrte lime Series . 噩 MiMhg values . 曲 Raridm Nuittber Gerwtatars. Rui p Riding Trcnslorms图 2.6 Compute Variable 菜单-81 -实习七生存分析图2.7 x转换为z的结果2. 描述频数:依次选取 Analyze Descriptive Statistic Frequencies 打开Frequencies对话框,如图2.8,将变量Z调入分析变量框,勾选Display frequency tables选项,打开Charts对话框,如图2.9,勾选Histograms选项,点Continue 返回对话框,点OK提交执行,结果如图2.100图2.8 Frequencies对话框图2.9 Charts对话框HistogramCunwyl睥昨 PctonrcVblid用酉1 1111 Z41-371詢1 7A1 M迪PTata:57博441伽砒5.811J24213J呂33lend424 J!5.i811 j远13192!503J33iwd423U2F92MJM,7图2.10输出的频数分布表与直方图三、计量资料的统计推断计量资料的统计推断包括可信区间的估计和假设检验,两者常在同一菜单 中完成,利用Analyze菜单中的Compare Means过程完成的。包括样本均数与 总体均数比较的t检验(On e-Sample T Test)、两独立样本均数比较的t检验(Independent-Samples T TeS)、配对设计样本的 t 检验(Paired-Samples T TeS) 和多样本比较的方差分析(One-Way ANOVA )。见图2.11。(一) 样本均数与总体均数比较的 t检验(One-Sample T Tes):例2.2据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了 25名健康成年男子,其脉搏均数分别是76 74 77 79 76 72 73 69 74 76 74 77 79 76 72 73 69 74 77 79 76 72 73 69 7,能否认为该山区成年男子的脉搏 高于一般人群?数据文件的建立和数据录入定义1个变量为maibo,并录入数据。统计分析依次选取 AnalyzeCompare Means One-Sample T Test,并打开对话框,如图2.11和2.12,将分析变量maibo调入右侧检验变量框内, 在对话框的下方Test Value选择框中填入所要比较的总体均数72,并点击Options子框,在该对话框中,设置总体均数的可信区间,默认为95%Confidenee Interval,如图2.13。按Continue返回,然后提交OK执行。dialyze Graphs liifties Add-firis Viflncbw HelpReportsDescriptive StatisticsTatotesRFM AnalystCorripareQener创 Linear ModelGeneralised Llrear ModelsMled ModelsCorrelateesressionLajiin&arM Uans.i Ore-Sample T TMJE Independent-Samples T Test. n Peireci-Saniples T Test.$ Qne-Wey AMOVA.图2.11 Compare Means过程的功能-83 -实习七生存分析-# -实习七生存分析图2.13 Options子框图 2.12 One-Sample T Test 对话框结果解释One-Sample StatisticsNMeanStd. DeviationStd. Error Meanmaibo2574.322.982.596该表是对变量的描述,计算例数一N、均数一Mean、标准差一Std. Deviation、 标准误一Std. Error Mea n。One-Sample TestTest Value = 72tdfSig. (2-tailed)Mean Difference95% Confidence Interval of theDiffere neeLowerUppermaibo3.89024.0012.3201.093.55该表是t检验结果表,分别计算出统计量t值、自由度一df、双侧检验的概 率P值一Sig. (2-tailed)、均数之差一Mean Differenee、以及差值的95%可信区间 95% Con fide nee In terval of the Differe nee。本例经检验 t 值等于 3.890,概率 P 等于0.001,由此可认为:根据该样本所提供的数据,可认为某山区健康成年男 子脉搏比一般地区要高。(二) 配对设计样本的t检验(Paired-Samples T Tes)例2.3 (教材例8.2)对24名儿童接种卡介苗,按同年龄、同性别配成12对,每对中的2名儿童分别接种两种结核菌素,一种为标准品,另一种为新制 品,分别注射在儿童的前臂,72小时后记录两种结核菌素的皮肤反应平均直径, 如下表,问儿童皮肤对两种不同结核菌素的反应性有无差别?表2.2 24名儿童分别接种两种不同结核菌素后皮肤的反应直径(mm)编号标准品新制品编号标准品新制品112.010.0710.58.5214.510.087.56.5315.512.599.05.5412.013.01015.08.0513.010.01113.06.5612.05.51210.59.5数据文件的建立和数据录入对于配对设计的数据,其数据的录入是采用成对的方式录入,本例首先在变量窗口定义两个变量,即BZP和XZP,再将两列数据成对的输入,见图3.4-85 -实习七生存分析图2.14配对设计数据录入方式数据分析依次选取 AnalyzeCompare mean Paired-Samples T Test 并打开对话框, 将分析变量BZP和XZP成对调入右侧paired variables框内,Option选默认,提 交OK执行运算。结果解释计算后的结果见下面的表格:Paired Samples StatisticsMeanNStd. DeviationStd. Error MeanPair 1BZP12.0417122.39752.69210XZP8.7917122.50870.72420本表是对两个变量的基本描述,包括均数、例数、标准差、标准误Paired Samples CorrelationsNCorrelationSig.Pair 1BZP & XZP12.485.110本表是分析两变量间的相关性,计算了相关系数 Correlatio n,显著性检验 的概率。本例两变量的相关系数为 0.485,概率P=0.110,说明两变量之间无相 关性。Paired Samples TestPaired DifferencestdfSig.(2-tailed)MeanStd.DeviationStd. ErrorMean95% Confidence Interval of the DifferenceLowerUpperPair 1 BZP - XZP3.250002.49089.719061.667364.832644.52011.001本表是计算配对检验的结果,包括差值的均数、标准差、标准误、差值的可信区间、t值、自由度、概率等。本例经配对t检验,t=4.520, P= 0.001,可 以认为儿童皮肤对两种不同结核菌素的反应性有差别。(三)两独立样本均数比较的 t检验(Independent-Samples T TeSt例2.4某医生为了比较冠心病人和健康人踏板试验的时间,测定两组人群的数据如下,问两者踏板试验的时间差别有无统计学意义?健康人1014 684 810 990 840 97810021110冠心病人864 636 638 708786 600 1320 750 594 750-87 -实习七生存分析1 : QFOUR1 0grouptimeL i匚1101421G8431810419905184 口E1970711002&1111092854102636112633122703图2.15两个样本比较数据录入方式数据文件的建立和数据录入在变量窗口定义两个变量,分析变量 time和分组变量group,将两个样本人群的 时间值都输入在time变量下,在分组变量 group 中,分别用1和2指示健康人和病人, 然后录入数据,见图2.15。数据分析依次选取 Analyze Compare meansIn depe-nde nt-Samples T Test,并打开对话框,如图 2.16,将分析变量time调入右侧test variables框内,分组变量调入 groupingvariable框内,并点击define group,打开子框,定义分组变量,在groupl和group2Option子框可以选定默认,提交中输入1和2,见图2.17,按Continue返回,OK执行运算图 2.16 Independent-Samples T Test 对话框图 2.17 define groups对话框结果解释Group StatisticsgroupNMeanStd. DeviationStd. Error Meantime18928.50138.12148.833210764.60213.75067.594该表是对两组分析变量的描述,内容基本同单样本均数检验Indepemdert Sampks TestLeones TL far Eeuslft of VaiarctiHntbr Equal 劇册临95K C&rMew hfe记 of tvDHfennaFSig.ISig |2 taiies I檢HC-lmrceStu Era DitfnceLwEqu Eg,13?.?15117316MO163 9W41釧Equa亦旷出诚* flcj1U39163 9W&3.3W翊JHmum该表统计推断的计算表,表的左侧有两行,分别是方差齐性(Equal variances assumed 和方差不齐(Equal variances not assume)的结果,表的右侧也分为 两列,分别是方差齐性检验(Test for Equality of Variances)和t检验(t-test for Equality of Means)的结果。方差齐性检验计算了F值以及对应的P值。t检验下分别计算出了 t值、自由度df、双侧检验的P值Sig. (2-tailed)、均数之差(Mean Differenee)、均数差的标准误(Std. Error Differenee)和均数差的95%可信区 间 95% Con fide nee In terval of the Differe nee。本例方差齐性检验F= 0.137, P=0.716,提示两组资料方差是齐性的,因此 看方差齐那一行的t检验结果;t=1.873, P=0.080,按0.05的检验水准,还不能 认为两组人群踏板试验的时间差别有统计学意义。(四) 多个独立样本均数的比较一一见实习四方差分析(One-WayANOVA )。-89 -实习七生存分析实习三 分类资料的统计分析主要内容:1交叉表的产生及四格表的卡方检验(Crosstabs2 、配对设计的卡方检验(2 Related Sample Tes)3 、行列表的卡方检验(Crosstabs、交叉表的产生及四格表的X检验例3.1 (教材例11.1) 某研究者欲比较甲、乙两药治疗小儿上消化道出血 的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗, 一个疗程后观察结果,见表 11.1。问两药治疗小儿上消化道出血的有效率是否 有差别?表3.1甲、乙两药治疗小儿上消化道出血的效果组别有效无效合计有效率()甲药27184560.00乙药4054588.89合计67239074.44本例是最常见的一种分类资料的分析,即两组有效率的比较,即通常所采用的2x2表格的卡方检验,先将数字整理为表3.1,然后建立数据文件进行分析数据文件的建立和数据录入此处需要先定义三个变量,分别是分组变量用 g表示、结局变量用c表示 和频数变量用f表示。g=1表示A药组,g=2表示B药组;c=1表示有效,c=2 表示无效。录入数据如图3.1。图3.1四格表数据的录入统计分析:1 .首先依次选取 Data Weight Cases打开对话框,选择 Weight cases by, 将F调入Frequency Variable框中,见图3.2,点击OK。此目的是使计算机知 道F栏的数据是频数。图3.2定义频数过程2. 选择 Analyze Descriptive Statistics Crosstabs 打开对话框,如图 3.3,将g调入Rows框,c选入Columns框,再对下面的子框选择。-91 -实习七生存分析hBMatistics Datd Editor123 Frcquencies Per Descriptive. A Qiotore.S Crosstabs. 西 Riio.圉 E-PPlots. 为 0-Ploii.1 Analie Graphs jjitties Add-ons wndowRegorlsDescrfJlive StatisticsTablesRfM AnalysisCcnpare MeansGenBral Lineer MddelGeneraksed Linear ModtetsMixed Modelsor relate图3.3 Crosstabs对话框Eeflresslon3.子框的选择【Statistics子框内有许多重要指标的计算,见图3.4常用的有X检验(Chi-square)、Pearson 相关系数(Correlation)、Kappa值(Kappa)、相对危险度(Risk)等的计算。可根据需要点击选择。本例选择Chi-square (X)检验開 Crosstabs Statistics0 |Chi-squaneNominalContingency coefficiert Eh and Ctflirisrs V_ Lambda| lKBrtsinty coefficientrNominal by Interval訓CorrelationsOrdinalGammaSomers d| Kendalls tau-b Kondalls tsu-Kappa RiskMcNemarCochran1 and Mantel-Haenszd statifticsTest common odds ratio equals图 3.4 Crosstabs Statistics 子框【Cell子框中选择计算实际频数 Observed理论频数Expected行百分比Row、列百分比Column、全部百分比Total、及各种残差,见图3.5.-Counts;1叵 bservec:ExpectedPercentagesirFtesiduals -回RowQnstandardizetiy olunn过and讲血就f*7 Total1 Adjusted standardizedNoninteyer WeightsCrosstabs; Cell Display * Round cH comts Rourni case weightsQ Truncate cep counts Q Truncats case weightsNo 40jus1rtientfContinueCancelHelp图3.5 Cell子框【Format用于制定顺序【Exact用于确切概率法4提交OK执行结果解释Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPercent分组变量*治疗效果90100.0%0.0%90100.0%该表是对数据利用的说明分组变量 *治疗效果 CrosstabulationCount治疗效果Total无效有效分组变量A药组182745B药组54045Total236790本表是根据数据生存的2X2交叉表,因没有选择计算百分比,所以,单元 格内无其他数据,可根据需要选择计算行、列和总的百分比。Chi-Square TestsValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-Square9.870a1.002bContinuity Correction8.4101.004Likelihood Ratio10.3381.001Fishers Exact Test.003.002Linear-by-Linear Association9.7611.002N of Valid Cases90a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11.50.b. Computed only for a 2x2 table本表是卡方检验结果表,通常计算的都是第一行的pears on X值,列中分别报道了 X值Value、自由度df、概率值Asymp.Sig.,最后是确切概率法的概率 值。在行中还列出了其他一些计算结果,包括常用的连续性校正X (ContinuityCorrection)、Fisher 确切概率检验结果等。本例题 X9.87,P=0.002,如果按 照a 0.05的水准,两种药物的治疗效果差异有统计学意义。二、配对设计的x 2检验例3.2 (教材例11.6) 某研究者欲比较心电图和生化测定诊断低钾血症的 价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表 11.9。问两种方法的检测结果是否不同?表3.2两种方法诊断低血钾的结果心电图生化测定-合计+ +452570459合计493079数据文件的建立和数据录入本例需要定义三个变量,m1为心电图法(m1=0表示血钾正常, m1=1表示低血钾)、m2为生化测定法(m1=0表示血钾正常,m1=1表示低血钾)、变量f用于表示频数。数据的录入格式如图3.6。開 ell_6.5av DataSet9 - SPSSDatd Editor .* .Hie Edit Wew Data Transform Analyze Graphs Lttilitces Add-ons VH A 圈 &尸丄创!?聘+H宙 晉工暫 零J10:mlm2fvarva1114521025301A4005567 I图3.6配对四格表数据的录入统计分析:1 与前面相同,先指定频数变量,选择 Data Weight Cases打开对话框, 选择 Weight cases by 将 f 调入 Frequency Variable 框中,点击 OK。2.依次选择 An alyzeNon parametric tests Two-Related Samples Test,打 开对话框,将m1和m2调入右边的框内,并选中 McNemar方法,见图3.7。图 3.7 Two-Related Samples Tests寸话框-95 -实习七生存分析3提交0K执行结果解释:执行后,得到如下的结果表格:心电图检测结果 &生化测定结果心电图检测结果生化测定结果血钾正常低血钾血钾正常54低血钾2545该表与原数据表完全相同bTest Statistics心电图检测结果 &生化测定结果N79Chi-Squarea13.793Asymp. Sig.000此表得出了 X值和概率值,本例13.793,Pv0.001,可认为两种血清的检 验结果是不同的。三、行列表的X检验行列表的卡方检验与四格表的 X检验基本相同,只是在变量的定义中不是 两分类,而是多分类,不再赘述。四、二项分布与Poisson分布的累计概率计算例3.3 (教材例10.4) 已知某省地中海贫血基因携带率为 10%,现在该省 A市进行抽样调查,基因检测结果显示在参与调查的 30人中有1人携带该基因。 试判断A市的地中海贫血基因携带率是否低于该省平均水平。本例已知总体发生率P=0.1,样本数n=30,发生数q=1。利用SPSS的自带 函数CD.BINOM即可计算。操作如下:1. 现在数据表中任意输入一些数据,以便调用函数功能,2. 依次选择Transform Compute,打开对话框,在 Target Variable中填写一需要计算的变量名如:Pro,然后在下面的函数框中找到二项分布函数CDF.BINOM(q,n,p),调入 Numeric Expression框中后,依次填入 1, 30, 0.1 , 见图3.8。图3.8二项分布累计概率的计算3提交OK执行,在数据栏中即可得到计算的变量Pro的值。本例为P=0.18370.05,尚不能认为A市的地中海贫血基因携带率低于该省平均水平-99 -实习七生存分析实习四方差分析主要内容:1、 完全随机设计资料的方差分析(One Way Anova)2、 随机区组设计资料的方差分析(Two Way Anova)3、交叉设计资料的方差分析 (Cross-Over Design4、析因设计资料的方差分析 (Factorial Desigr)5、重复测量资料的方差分析 (Reapeated Measure一、完全随机设计资料的方差分析(One Way Anova)例4.1 (教材例9.1)为研究大豆对缺铁性贫血的恢复作用,某研究者进行 了如下实验:选取已做成贫血模型的大鼠 36只,随机等分为3组,每组12只, 分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。喂养一周后,测定大鼠红细胞数(1012/L),试分析用三种不同饲
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!