SPSS操作步骤汇总

资源描述

第一章数据文件的建立数据编码Type： Numeric :数值型 stringMissing :Measure： scale 定量变量 nominal根据已有的变量建立新变量1、对于数据进行重新编码Transform 一recode into different variables字符串型定性变量选择 input variable outputvariable -定义新变量的名称一 change一幵始定义新旧变量一 continue2、通过SPSS函数建立新变量Transform 一 compute variable -从 function group 中选择公式范围下面选择具体的公式一 if中设置要改变一 continue 0K何以对变量进行各种计算）第二章清除数据与基本统计分析1、对不合理的数据检查并清理检查：analysis-description statistic-frequencies 一选入要检查的数据一 OK结果：频数统计表一看是否有错误一 missing system清理：1. 对系统缺失值的清理Dataselectcase一if condition is satisfied if 一function group(missing)一一下面选(missing)-一continue 一 output(delete unselected cases)OK 对num为哪一位的进行修改2.对sex=3的清理（直接就清除了）Data,select case一 if condition is satisfied if 一sex 调入再输入=3一continue一 output (delete unselected cases ) -OK 一对 num 为哪一位的进行修改2. 对相关变量间逻辑性检查和清理Data,select case 一if condition is satisfied if 一输入表达式(前后逻辑不相符合的表达式)- continue- output ( delete unselected cases ) - -OK 一对num为哪一位的进行修改3. 统计描述正态分布统计描述1、正态性检验： Analysis 一nonparametrie tests legacy dialogs 一1-sample KS一 on e-sample Kolomogorov Smir nov test 一 no rmal 一 ok/2、统计描述： Analysis 一descriptivestime 选入一 options ok3、按照男女统计描述：data split file - compare group - sex 调入一 okAnalysis-descriptive statistic descriptivetime 调入一 options选择一 OK非正态分布资料统计描述1、正态性检验nonparametric2、Analysis 一descrip tive st at is tics frequencies 选入 - statistics 选择一OK第三章T检验1、单样本t检验正态性检验一 analyze 一compare means一one-sample t test test value 选择要对比的数值一OK terms （ main effects ）再把 group 和 block 调入 model 卜的矩形扌匡 continue OK如果区组间无差别，组间进行两两比较首先进行方差齐性检验：Option 调入一homogentity test continue ok分析： univariatepost hoc一univariate 调入 group 一 SNKLSD一 continue 一ok4、多因素分析以time为观察值分析pt、da sex间的差别General liner model一univariate time （dependent variance） , pt 、 da sex（fix fac tor） model一mi an fac tors 调入一 continue OK将无关的逐一排除一选择出最终有差异的一求得R square第五章卡方检验1、行X列卡方检验（也就是几组数据差异性比较）输入数据一第一列（列123）第二列（行1234）一第三列（频数）定义频数变量：Dataweight case 一调入频数分析：analyze 一 descrip tive statistics cross tabs 第一行调入 row一第二歹 U 调入 columnstatistics 选择 chi-square 一 continue 一 cells 选项一选择row一 ok结果中，最后一行英文，理论值小于5的各数和最小理论值如果有统计学意义，可以进行两两比较：在数据设置那里，找到missing value discrete missing value 下的格子中填入3 （表示把3取掉了，只是1和2进行比较）-后续操作同上2、四格表卡方检验输入数据一第一列（处理因素）一第二列（疗效）一第三列（频数）定义频数变量：Dataweight case 一调入频数分析：analyze 一 descrip tive statistics cross tabs 第一行调入 row一第二歹 U调入 columnstatistics选择 chi-square 一 continue cells 选项一选择row、 expected 一ok结果中，最后一行英文，理论值小于5的各数和最小理论值。确切概论法，continuity correction表示校正卡方的结果Ps:诸如第一个例题中，如果分析性别与感染率的显着性差异，步骤同四个表卡方检验，由于分开写了，不用转换为频数资料而已3、配对卡方检验输入数据一第一列（G 第二列（b）第三列（频数）定义频数变量：Dataweight case 一调入频数分析方法一 : an alyze 一 non parametric 一 legacy dialogy一2-rela.ted sample tested 一a和b分别选入配对一激活下列的选项McNemar 分析方法二： analyze 一descriptive statistics crosstabs ab 填入一 statistics 点击右下 McNemra一 ok第六章秩和检验1、配对秩和检验（定量）输入数据一第一列（前）一第二列（后）分析： analyze 一nonparametrie 一legacy dialogy一2related sample testeda和b分别选入配对结果：第一个表格是比较大小的数量，第二个表格是统计分析结果两独立样本比较秩和检验（定量）输入数据一第一列（group）第二列（数值）分析： analyze 一nonparametrie 一legacy dialogy 一一2 independent samples 一输入分析的数据和分组情况一0K2、有序变量两独立样本比较秩和检验（定性）输入数据一第一列（group ）第二列（有序变量）-第三列（频率）定义频数变量：Data weight case 一调入频数分析：an alyze 一 non parametrie 一 legacy dialogy -2 in depe ndent samples 有序变量调入test variables list group调入分组并定义一 ok多个独立样本的比较（定量）比如：甲乙丙三个样本进行比较输入数据一第一列（group ）第二列（数值）n alyze 一 non parametrie 一 legacy dialogy 一K in depe ndent samples- 数值调入test variable test 一 group调入分组矩形框给出分组范围13 一 Ok如果差别有统计学意义，那么进行两两比较，方法参考卡方的两两表，用miss ing来定义第七章相关与回归第一节一元线性回归1、例题：有12组发硒值和血硒值的含量表输入数据一第一列（发硒）一第二列（血硒）分析：正态性检验，相关和回归的前提是正态性正态性检验： An alysis 一 non parametrie tests legacy dialogs 一 1- sampleKS一 on e-sample Kolomogorov Smir nov test一 n orma.1 一 ok相关分析 :correla.te Bivariate Bivariate correlation 月艮从正态分布的选择 pears on, 不月艮从的选择 spearma n回归分析：regression regression 一 linear 一将 y 变量调入 dependent, x 变量调入in depe nden tstatisti linear regressi ondescriptive OK结果分析：P值v差别有统计学意义，可以建立回归方程2、频数资料的相关与回归建立数据库一第一列（X）第二列（y）第三列（f）分析：先将频数通过weight case进行操作Analyze 一 regression 一 linear 一选入自变量因变量一 0KPs:这样的回归模型有常数项，也可以去掉，options include constant in equation 前面的 V 去掉一 statistic 一 R square change 一 OK 这样去去掉了常数项，但是要强调的是，有无常数项是两个完全不同的数学模型，R square也不能作为直接的比较，选择哪个回归方程最为合适，必须要把他们放在医学的实际环节中去检验才可以。3、多元相关回归好多个X的回归分析，分析X之间的相关关系Analyze 一correlate bivariate 将所数字调入一 options means and standard deviations ok结果显示了 6个X之间两两的相关系数。第二节多元线性回归研究一个Y和多个X的关系输入数据，x和y 回归分析：analyse 一regression 一linear 一输入自变量，因变量一 0K结果：B表示偏回归系数，pv有统计学意义，否则排除掉，不纳入回归方程中第三节多元逐步回归回归分析：analyse 一 regression 一linear 一输入自变量，因变量一 method中输入 stepwise 0K结果：将所有有意义的分布引入，都有相关系数和回归方程第丿章 Logistic 回归研究因变量（二值变量）与自变量（二值或等级或计量资料）的关系例如：例子中因变量为infect ,自变量为一堆（9个），笔者认为，由于自变量较多，logistic回归可分为两步，先用单因素分析对自变量进行筛选，然后对经单因素分析有统计学意义的自变量再做多因素logistic回归。1、将数据分类计数资料等级资料计量资料1、单因素分析对于计数资料采用卡方检验的方法：Descriptive statistic 一crosstabs 一 infect调入到rows,计数资料调入columns 一 statistic 一chi-square 一ok结果显示：每项计数资料是否有统计学意义，经有统计学意义的资料记下来Ps:夕卜力口一个分层资料合并步骤： transform 一 recode 一 recode into different variables 一old to new,就跟数据合并一样，分组合并一样对于等级资料采用秩和检验的方法：analyze 一nonparametric 一legacy dialogy -2 independent samples一输入分析的数据和分组情况（按照Y变量分为0-1两组）一0K对于计量资料采用显着性检验的方法：An alyze 一 compare means一in depe ndent sample t test -调入计量资料一并分组（0/1 ） -0K结果看p值是否有统计学意义logistic 回归。2、logistic 回归通过单因素分析，找出了有统计学意义的观察项，然后进行分析：An alyze 一 regressi on 一 binary logistic 一调入因变量一调入自变量（covaria. tes ）一met hod （默认 ent er）一 opti ons 激活 hosmer- lemeshow goodness of fit、CI for exp （B）、at last step - ok （也可以根据需要在其中选择）查看结果，P小于，变量差别具有统计学意义，可以纳入回归方程。结果解释注意事项：logistic回归是非线性回归，自变量作用的大小视为exp （B）值，此处输血次数的回归系数为正表示输血次数多则感染的可能性大，手术部位（结肠和直肠），结肠发生感染的可能性大于直肠部位。第一章诊断试验评价和TOC曲线分析1、诊断试验建立数据库一第一列（金标准）一第二列（待评价方法）一第三列（f ）现将频数通过weight case定义为频数变量分析：analyze 一 descrip tive statistic cross tabs 现实中表格左边的调入 row,表格上面的调入columncells中选择计算row、column、total的百分比一 OK结果分为四行：四小行分表表示，观察值，行百分比，列百分比，总百分比新方法金标准阳性阴性阳性行百分数阳性预测值列百分数灵敏度误诊率阴性行百分数阴性预测值列百分数漏诊率特异度2、诊断试验一致性检验一 Kappa值Kappa冬差，后每增加分别为一般、中等、好、很好分析：其他过程同上，在cells之后，点击statistic 选择右下Kappa0K结果:value即为Kappa值，要注意Kappa值也要注意对卡帕检验的p值和样本量3、roc 曲线分析即为：受试者操作特征曲线，通过曲线下面积反应诊断试验的诊断价值。曲线下面积等于表示完全无诊断价值，后每增加表示低中高。例子中将医生诊断水平与病例诊断水平做比较建立文档一定义频数变量一 analyze-ROC curve 一待评价的调入test variable 一标准选入state variable并在下面的对话框中选择1表示恶性-在 display 一 withdiagonal reference line and standard error and confidence interval一 ok例子2是血清钠对普通感冒和rmsf发热是否有诊断作用建立文档一定量资料一 analyze一 ROC curve 一待评价的调入 test variable 一分组选入 state variable 并在下面的对话框中选择1 -在display全选一 options中修改默认选项为smaller test resuIt indicate more positive test（因为血清钠越低越表示阳性，而系统默认越高越为阳性）一0K结果分析：看曲线下面积第十二章生存分析1、基本概念：事件：研究规定的生存时间的重点删失：失访或截尾生存时间：从某一起点开始到所关心时间发生经历的时间中位生存时间：半数生存期，表示恰好有50%的而个体存活的时间生存曲线：以观察时间为横轴，以生存率为纵轴，将各个时间点所对应的生存率连接在一起的曲线。生存曲线是一条下降的曲线，表示随着时间的推移，生存率逐渐降低。平缓的生存曲线表示高生存率或较长的生存期，陡峭的生存曲线表示低生存率或较短生存期。2、寿命表法定期随访的大样本资料建立数据第一列（time ）第二列（结局state 1/0 ）一第三列（f ）分析：定义频数一 analyze 一 survival 一 life tables 一 time 调入 time（display time interval 中从 0 到几每隔几）-结局输入 status （ single value 输入1表示死亡，因为看上述文字：value indicating event has occurred表示目标事件发生的值，所以输入死亡所表示的数字）-options 选择life tables和survivalplot OK3、Kaplan-Meier 法小样本量有两个分组，两种不同方法生存分析并比较生存率建立数据第一列（time ）第二列（结局state 0死亡/I失访/2存活）一第三列（组别）分析： analyze 一survival一 Kaplan-Meier 一time 调入 time , group 调入factor ,结果调入status （定义结果选择0,表示死亡）-options 选择survival table、 mean and median survival -compare factor 中选择 log-rank 法一 ok 结果给出两组的平均生存时间和中位生存时间，标准误和可信区间，overallcomparisons表示对两者的生存率进行比较。Ps：在寿命表中也可以对生存率进行比较，options选项中compare level of firstfactor 中选择 overall第十四章量表信度效度分析1、量表信度分类：外在信度表示量表在不同时间测定时测量结果一致程度，重测信度、分半信度内在信度表示量表各项目之间的一致性程度，cronbach s a信度Analyze - scale 一 reliab订ity analysis一总体选入或根据不同的因子分别选入2、量表效度量表能够测量岀研究中所欲测量特性的程度。效度越高表示该测量的结果与测验行为的真实度越符合，越能够达到测验的目的。内容效度：专家法评价，对量表的题目，内容，范围是否符合调查目的进行分析评价标准效度：必须要有比较标准，指的是测量值与标准值之前的接近程度结构效度：根据实际测量的数据，考察所用的量表是否能反映事先假设的理论结构。KMCTo具体操作，先不用掌握了，不会考的。第十五章统计图形第一节条形图Bar chart先要看懂几个翻译，非常重要！！！ Simple简单条形图Clustered分组条形图Stacked分段条形图（堆积图）Data in chart areSummaries for separate variables按单独变量汇总Value of in dividual cases按某观察量的数值做条形图1. 简单条形图（绘制各种手术方式的人数）选Simple简单条形图-Summaries for group of cases按照观察量分组汇总一bars represent （图形代表什么？）选择n of case,表示直条的长短观察量分组的数值一 category axis中选定要绘制的观察量。可以点击title进行标题命名，双击图形可以对其作出设置（绘制手术中失血量和输血量的均值）两个变量则选用：Summaries for separate variable按单独变量汇总，将两个变量选入bars represent ,其他同上，也可以双击设置图形。（绘制每个病例的输血次数）每个变量单独绘制则选用：Value of in dividual cases按某观察量的数值做条形图。Bars represent 输入变量一 OK2. 分组条形图（就是有两个两个紧挨着一起，一对一对比较的图）（绘制不同手术方式下，感染者与非感染组的，平均手术时间）读题后，理所应当的想到，图形横坐标是不同的手术方式，一对别是感染与否，barsrepresent手术时间！Clustered- Summaries for group of cases 按照观察量分组汇总-bars represent（图形代表什么？）选择other ,调入time category axis 就是横轴的变量手术方式一 define cluster by定义分组通过感染与否一 0KPs：可以通过option添加误差线一 display error bars 有，置信区间，标准误,标准差，笔者选择了置信区间3. 分段条形图（堆积图），百分条图竖起来的一段一段的，跟圆图表达一起意思的图,但是可以直观的对两组进行比较。（不同手术下，输血次数，分为04次，每次有不同的次数）Stacked一 Summariesfor group of丫匚总-category axis就是横轴的变量手术方一一defi ne定义分组通过手术次数一 OKPs：可以通过options定义 scale to 100%第二节饼图转换为百分条图Graph一legacy dialogspie pie chart调入 define slice byOK双击可以编辑第三节线图简单线图/复合线图Graph一legacylinelinesummaries for group of cases横轴调入category axis中，j各对直线的定义调入define lines by的对话框一 OK点线图上述改为drop-line就可以。第四节直方图Graph一legacy dialogs 一 his to gram 一要绘希 U的变量选入 variable , 选择 displaynormal row表示绘制正态曲线第五节散点图Graph一legacy dialogs 一 seatter/dot

展开阅读全文

SPSS操作步骤汇总

最新文档