SPSS13.0课件

上传人:猪** 文档编号:243144756 上传时间:2024-09-16 格式:PPT 页数:94 大小:1.74MB
返回 下载 相关 举报
SPSS13.0课件_第1页
第1页 / 共94页
SPSS13.0课件_第2页
第2页 / 共94页
SPSS13.0课件_第3页
第3页 / 共94页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Public health school, Southeast University,SPSS,统计软件简 介,东南大学公共卫生学医疗保险系,张 晓,025-3272580,Hiaacenter,vip,1.,SPSS,简介,2. 数据输入与保存,文件的建立与编辑变量及变量操作,3.,SPSS,信息输入、输出,4.,SPSS,表格与图形,5. 图形的编辑功能,6.,SPSS,编程与自动化,7.,SPSS,统计功能之一:样本描述与数据准备,8.,SPSS,统计功能之二:假设检验、非参数统计,9.,SPSS,统计功能之三:相关与回归分析,10.,SPSS,统计功能之四:多元统计分析(介绍),SPSS,是软件英文名称的首字母缩写,原意为,Statistical Package for the Social Sciences,,,即,“,社会科学统计软件包,”,。但是随着,SPSS,产品服务领域的扩大和服务深度的增加,,SPSS,公司已于,2000,年正式将英文全称更改为,Statistical Product and Service Solutions,,,意为,“,统计产品与服务解决方案,”,,标志着,SPSS,的战略方向正在做出重大调整。,功能强大、实用与美观统一的视窗风格,SPSS,最突出的特点就是操作界面极为友好,他使用,Windows,的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的,Windows,操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。,输出结果十分美观漂亮(从国外的角度看) ,存储时则是专用的,SPO,格式,可以转存为,HTML,格式和文本格式。,在众多用户对国际常用统计软件,SAS,、,BMDP,、,GLIM,、,GENSTAT,、,EPILOG,、,MiniTab,的总体印象分的统计中,其诸项功能均获得最高分,。,非专业统计人员的首选统计软件,SPSS,采用类似,EXCEL,表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。,其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。,非专业统计人员的首选统计软件,对于熟悉老版本编程运行方式的用户,,SPSS,还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按,“,粘贴,”,按钮就可以自动生成标准的,SPSS,程序,极大的方便了中、高级用户。,SPSS,的基本特点,数据自动处理,强大的统计功能,完全的,Windows,风格,良好的帮助系统合自学功能,简单的编程,完美的图形处理功能,丰富的数据对接功能,支持,DLE,与,Active,技术,内置,VBA,客户语言,强大的函数功能,Intenet,功能,SPSS,的,功能,样本数据的描述和预处理;,假设检验(包括参数检验、非参数检验及其他检验);,方差分析,列联表,相关分析,回归分析,对数线性分析,聚类分析,判别分析,因子分析,对应分析,时间序列分析,生存分析,可靠性分析,SPSS,由多个模块构成(和,SAS,相同),,SPSS 11,版一共由十个模块组成,其中,SPSS Base,为基本模块,其余九个模块为,Advanced Models,、,Regression Models,、,Tables,、,Trends,、,Categories,、,Conjoint,、,Exact Tests,、,Missing Value Analysis,和,Maps,,,分别用于完成某一方面的统计分析功能,他们均需要挂接在,Base,上运行。除此之外,,SPSS 11,完全版还包括,SPSS Smart Viewer,和,SPSS Report Writer,两个软件,他们并未整合进来,但功能上完全是,SPSS,的辅助软件。,最新推出的,SPSS 12.0,除了原有的十个模块外,又新增了复杂抽样模块,能从您的调查数据中得到更多准确的分析结果。,历史,20世纪60年代,1975,年在芝加哥组建了,SPSS,总部。,1984,年,SPSS,总部首先推出了世界上第一个统计分析软件微机版本,SPSS/PC+,1994,至,1998,年间,,SPSS,公司陆续购并了,SYSTAT,公司、,BMDP,软件公司、,Quantime,公司、,ISL,公司等,并将各公司的主打产品收纳,SPSS,旗下,从而使,SPSS,公司由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的,“,数据仓库,”,和,“,数据挖掘,”,领域前沿的一家综合统计软件公司。,应用,广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。,其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。,缺点,由于在,SPSS,公司的产品线中,,SPSS,软件属于中、低档(,SPSS,公司共有二十余个产品),因此从战略的观点来看,,SPSS,显然是把相当的精力放在了用户界面的开发上。该软件只吸收较为成熟的统计方法,而对于最新的统计方法,,SPSS,公司的做法是为之发展一些专门软件,如针对树结构模型的,Answer Tree,,,针对神经网络技术的,Neural Connection,、,专门用于数据挖掘的,Clementine,等,而不是直接纳入,SPSS,,,因此他们在,SPSS,中均难觅芳踪。另外,其输出结果虽然漂亮,但不能为,WORD,等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这些都可以说是,SPSS,软件的致命伤。,数据输入与保存,SPSS,的界面,定义变量,输入数据,保存数据,例 某克山病区测得11例克山病患者与13名健康人的血磷值(,mmol,/L),如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?,编号,克山病患者,编号,健康人,1,0.84,1,0.54,2,1.05,2,0.64,3,1.20,3,0.64,4,1.20,4,0.75,5,1.39,5,0.76,6,1.53,6,0.81,7,1.67,7,1.16,8,1.80,8,1.20,9,1.87,9,1.34,10,2.07,10,1.35,11,2.11,11,1.48,12,1.56,13,1.87,数据文件管理,建立与保存数据文件(,File,菜单),新建数据文件,直接打开,使用数据库查询打开,使用文本导入向导读入文本文件,打开其他格式的数据文件,保存数据文件,File,菜单中的其他条目,10,个下拉式菜单,主菜单,中文名称,备注,File,文件操作,简介,Edit,数据编辑,重点介绍,View,观察(视图),Data,建立数据与数据整理,重点介绍,Transform,变量转换,重点介绍,Analyze,统计分析,重点介绍,Graphs,绘图,重点介绍,Utilities,实用程序,重点介绍,Windows,视窗控制,Help,在线帮助,数据的预分析,数据的简单描述,绘制直方图,按题目要求进行统计分析,保存和导出分析结果,保存文件,导出分析结果,数据文件管理,编辑数据文件,定义新变量,直接定义新变量,从原有变量计算新变量-,Transform,菜单,数据的录入,直接录入,数据录入技巧,进一步整理数据文件-,Data,菜单,程序编辑窗口用法详解,程序编辑窗口界面,邂逅,Paste,按钮,用程序编辑窗口加快我们的工作,用程序编辑窗口完成对话框无法完成的工作,SPSS,结果窗口用法详解,1结果窗口元素介绍,结果浏览窗口(,Viewer),结果草稿浏览窗口(,Draft Viewer),如何美化你的输出结果,SPSS,选项设置,2驾驭结果浏览窗口,结果窗口的的一般操作,结果的导出,如何在,WORD,等软件中使用输出结果,3文本输出结果的编辑,4表格编辑方法详解,1基本操作,特色菜单内容详解,5图片编辑方法详解,基本操作,特色菜单内容详解,SPSS,统计绘图功能详解,1常用统计图,操作界面介绍(条图),1条图的通用界面,2复式条图与分段条图的界面,其他常用统计图,1散点图,2线图,3饼图,4面积图,5直方图,6其他,常用统计图编辑方法详解,2交互式统计图,3,统计地图,条图,散点图,线图,直方图,饼图,面积图,箱式图,正态,Q-Q,图,正态,P-P,图,质量控制图,Pareto,图,自回归曲线图,高低图,交互相关图,序列图,频谱图,误差线图,朴素的美,削尖脑袋的模样,墙上长满了爬山虎,太阳照在红墙内外,反客为主的蓝飘带,我没有放倒!,描述性统计分析,Descriptive Statistics,菜单详解,1,Frequencies,过程,1界面说明,2分析实例,3结果解释,2,Descriptives,过程,界面说明,结果解释,3,Explore,过程,界面说明,结果解释,4,Crosstables,过程,界面说明,分析实例,结果解释,Frequencies,过程,例 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数,CV、,中位数,M、p2.5,和,p97.5(,卫统第三版,p233 1.1,题)。,4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05,步骤,Analyze=Descriptive Statistics=Frequencies,Variables,框:选入,X,单击,Statistics,钮:,选中,Mean,、,Std.deviation,、,Median,复选框,单击,Percentiles,:,输入,2.5,:单击,Add,:,输入,97.5,:单击,Add,:,单击,Continue,钮,单击,Charts,钮:,选中,Bar charts,单击,Continue,钮,单击,OK,Descriptives,过程,【Statistics,钮】,Descriptives,复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。,M-estimators,复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。,Outliers,复选框:输出五个最大值与五个最小值。,Percentiles,复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。,【Plot,钮】,Boxplots,单选框组:确定箱式图的绘制方式,可以是按组别分组绘制(,Factor levels together),,也可以不分组一起绘制(,Depentends,together),,或者不绘制(,None)。,Descriptive,复选框组:可以选择绘制茎叶图(,Stem-and-leaf),和直方图(,Histogram)。,Normality plots with test,复选框:绘制正态分布图并进行变量是否符合正态分布的检验。,Spread vs. Level with,Levene,Test,单选框组:当选择了分组变量时,绘制,spread-versus-level,图(我还没有找到他的中文名字该叫什么),设置绘图时变量的转换方式,并进行组间方差齐性检验。,【,Options,钮】,用于选择对缺失值的处理方式,可以是不分析有任一缺失值的记录、不分析计算某统计量时有缺失值的记录,或报告缺失值。,Crosstabs,过程,例6.2 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别(医统第二版,P37,例3.10)?,处 理,愈 合,未愈合,合计,呋喃硝胺,54,8,62,甲氰咪胍,44,20,64,合 计,98,28,126,步骤,Data=Weight Cases,Weight Cases by,单选框:选中,Freqency,Variable,:,选入,W,单击,OK,钮,Analyze=Descriptive Statistics=,Crosstabs,Rows,框:选入,R,Columns,框:,C,Statistics,钮:,Chi-square,复选框:选中:单击,Continue,钮,单击,OK,钮,均数间的比较,Compare Means,菜单详解,1,Means,过程,界面说明,结果解释,2,One-Samples T Test,过程,界面说明,结果解释,3,Independent-Samples T Test,过程,界面说明,结果解释,4,Paired-Samples T Test,过程,1界面说明,2分析实例,3结果解释,5,One-Way ANOVA,过程,1界面说明,2分析实例,3结果解释,Paired-Samples T Test,过程,例,某单位研究饮食中缺乏维生素,E,与肝中维生素,A,含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共,8,对,并将每对中的两头动物随机分到正常饲料组和维生素,E,缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素,A,的含量,问不同饲料的大白鼠肝中维生素,A,含量有无差别(卫统第三版例,4.5,)?,大白鼠对号,正常饲料组,维生素,E,缺乏,1,3550,2450,2,2000,2400,3,3000,1800,4,3950,3200,5,3800,3250,6,3750,2700,7,3450,2500,8,3050,1750,一般线性模型,General Linear Model,菜单详解,1两因素方差分析,univarate,对话框界面说明,结果解释,2协方差分析,分析步骤,结果解释,3其他较简单的方差分析问题,4多元方差分析,分析步骤,结果解释,5重复测量的方差分析,Repeated measures,对话框界面说明,结果解释,两因素方差分析,例 对小白鼠喂以,A、B、C,三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?,区组号,A,营养素,B,营养素,C,营养素,1,50.10,58.20,64.50,2,47.80,48.50,62.40,3,53.10,53.80,58.60,4,63.50,64.20,72.50,5,71.20,68.40,79.30,6,41.40,45.70,38.40,7,61.90,53.00,51.20,8,42.20,39.80,46.20,步骤,Analyze=General Lineal model=,Univariate,Dependent Variable,框:选入,weight,Fixed Factors,框:选入,group,和,food,Model,钮:单击,Custom,单选钮:选中,Model,框:选入,group,和,food,单击,OK,Post Hoc,钮:单击,Post Hoc test for,框:选入,food,SNK,复选框:选中,单击,OK,单击,OK,协方差分析,某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量与年龄有关,资料见下表。,正常组,超重组,年龄(,X1),胆固醇(,Y1),年龄(,X2),胆固醇(,Y2),48,3.5,58,7.3,33,4.6,41,4.7,51,5.8,71,8.4,43,5.8,76,8.8,44,4.9,49,5.1,63,8.7,33,4.9,49,3.6,54,6.7,42,5.5,65,6.4,40,4.9,39,6.0,47,5.1,52,7.5,41,4.1,45,6.4,41,4.6,58,6.8,56,5.1,67,9.2,步骤,Analyze=General Lineal model=,Univariate,Dependent Variable,框:选入,chol,Fixed Factors,框:选入,group,Model,钮:单击,Custom,单选钮:选中,Model,框:选入,group、age,和,group*age(,后者用,interaction,方法就可选入),Sum of squares,列表框:改为,Model I,单击,OK,单击,OK,相关分析,Correlate,菜单详解,1,Bivariate,过程,界面说明,分析实例,结果解释,2,Partial,过程,界面说明,结果解释,3,Distances,过程,多元线性回归与曲线拟合,Regression,菜单详解,1,Linear,过程,1 简单操作入门,界面详解,输出结果解释,2 复杂实例操作,分析实例,结果解释,2,Curve Estimation,过程,1 界面详解,2 实例操作,3,Binary Logistic,过程,1 界面详解与实例,2 结果解释,3 模型的进一步优化与简单诊断,1 模型的进一步优化,2 模型的简单诊断,非参数检验,Nonparametric Tests,菜单详解,1,概论,2,One-Sample,Kolmogorov,-Smirnov Test,3,Two-Independent-Samples Tests,生存分析,Survival,菜单详解,1,Life Tables,过程,界面说明,结果解释,2,Kaplan-Meier,过程,界面说明,结果解释,3,Cox Regression,过程,界面说明,结果解释,4,Cox w/Time-,Dep Cov,过程,界面说明,结果解释,第一讲,:,SPSS,简介,界面入门、数据管理,要求:,了解,SPSS,系统的构成,掌握数据管理界面的一般操作,熟悉常用数据转换命令的用法。,重点:,可以独立完成在,SPSS,中建库、录入数据、计算新变量、筛选变量等操作,重点考察以下过程:,compute、sort、split、weight、merge files。,懂得如何使用粘贴命令自动生成,SPSS,程序。,第二讲:,SPSS,结果浏览窗口用法详解、统计绘图功能详解,要求:,熟悉,SPSS,结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。,掌握常用统计图(线图、条图、饼图、散点、直方图等)的绘制方法,熟悉其他统计图的绘制方法,熟悉统计图的一般编辑方法。,重点:,能对分析结果进行编辑、输出。重点考察以下内容:结果表格的编辑、在,word,中使用结果、结果的导出。,能够独立判断遇到的统计问题应当采用何种统计图形,并用,SPSS,独立完成各种常用统计图的绘制。能根据目的对统计图进行一定的编辑。重点考察以下内容:统计图形的正确选用,条图的绘制和编辑,散点图的绘制和编辑,其他各种统计图的特色编辑功能。,第三讲:,统计基础知识及其在,SPSS,中的实现,要求:,熟悉和初步掌握基础统计概念、过程和方法:单变量统计、双变量统计、多变量统计。,SPSS,中有关这些统计知识和过程的帮助及实现:了解,SPSS,对统计概念和方法的系统诠释,、,SPSS,的若干统计过程及基本功能简介。,第四讲:,统计描述,多选题分析,均数间的比较,要求:,掌握常用描述性指标的计算方法,熟悉分类数据的两种录入格式,掌握多选题的常用指标和分析方法。,掌握成组、配伍,t,检验、单因素方差分析的操作方法和结果阅读。,重点:,能够正确选用适当的统计过程求出均数、标准差等各种常用描述指标。能独立对多选题进行正确描述。,能够用,SPSS,独立进行成组、配伍,t、u,检验、一元方差分析,能根据分析目的正确选择两两比较方法。,第五讲:,卡方检验,相关分析,回归分析,要求:,熟悉分类数据各种常用检验结果(成组卡方、配对卡方、分层卡方)的计算方法,掌握输出结果中各部分的正确含义并能正确选择所需结果。,掌握相关分析和回归分析的操作,掌握其结果阅读。,重点:,能用正确的数据格式完成成组、配对卡方检验和分层卡方检验,能从结果中选择正确的概率值。,能,用,SPSS,独立完成简单的相关分析与回归分析,能正确阅读其分析结果。,SPSS,初中级培训班课程大纲,SPSS,北京办事处,第一讲:,SPSS,简介,界面入门、数据管理,要求:,了解,SPSS,系统的构成,掌握数据管理界面的一般操作,熟悉常用数据转换命令的用法。考察目标:,可以独立完成在,SPSS,中建库、录入数据、计算新变量、筛选变量等操作,重点考察以下过程:,compute、sort、split、weight、merge file。,懂得如何使用粘贴命令自动生成,SPSS,程序。,第二讲:,SPSS,结果浏览窗口用法详解、统计绘图功能详解,要求:,熟悉,SPSS,结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。,掌握常用统计图(线图、条图、饼图、散点、直方图等)的绘制方法,熟悉其他统计图的绘制方法,熟悉统计图的一般编辑方法。,考察目标:,能对分析结果进行编辑、输出。重点考察以下内容:结果表格的编辑、,在,word,中使用结果、结果的导出。,能够独立判断遇到的统计问题应当采用何种统计图形,并用,SPSS,独立完成各种常用统计图的绘制。能根据目的对统计图进行一定的编辑。重点考察以下内容:统计图形的正确选用,条图的绘制和编辑,散点图的绘制和编辑,其他各种统计图的特色编辑功能。,第三讲:统计描述,多选题分析,要求:,掌握常用描述性指标的计算方法,熟悉分类数据的两种录入格式,掌握多选题的常用指标和分析方法。,考察目标:,能够正确选用适当的统计过程求出均数、标准差等各种常用描述指标。能独立对多选题进行正确描述。,第四讲:卡方检验,均数间的比较,非参数检验,要求:,熟悉分类数据各种常用检验结果(成组卡方、配对卡方、分层卡方)的计算方法,掌握输出结果中各部分的正确含义并能正确选择所需结果。,熟悉,SPSS,提供的用于测量变量间关联度指标的体系分类。,掌握成组、配伍,t、u,检验的操作方法和结果阅读。,熟悉用,SPSS,进行非参数统计分析的做法,掌握结果阅读。,考察目标:,能用正确的数据格式完成成组、配对卡方检验和分层卡方检验,能从结果中选择正确的概率值。,能够用,SPSS,独立进行成组、配伍,t、u,检验、一元方差分析,能根据分析目的正确选择两两比较方法。,能正确判断是否应使用非参数检验,能正确阅读各种非参数检验的统计分析结果。,第五讲:方差分析模型,要求:,掌握单因素方差分析的数据格式、操作方法与结果阅读,熟悉方差分析中各种两两比较方法的选择、操作和结果阅读。,掌握一元多因素方差分析模型的原理、操作和分析结果的阅读,掌握相应的图形工具在分析中的应用。,熟悉多元方差分析模型和重复测量方差分析模型的原理和操作方法,掌握这两者分析结果的阅读。,考察目标:,能够用,SPSS,独立进行一元多因素方差分析模型的统计分析,能独立、正确阅读多元方差分析模型和重复测量方差分析模型的统计分析结果。,重点考察内容:一元多因素方差分析模型为考察重点,具体有对话框操作、分析结果的阅读、均数图、两两比较方法的选择和结果阅读。,第六讲:相关分析、多元线性回归与,Logistic,回归分析,要求:,掌握相关分析、偏相关分析的操作与结果阅读。,掌握多元线性回归模型的原理、分析步骤、操作和结果阅读,重点掌握逐步、前进、后退三种筛选方法的含义与用法、分析结果的阅读,熟悉各种常用模型诊断工具(分类图等)的用法。,掌握二分类,Logistic,回归模型的原理、分析步骤、操作和结果阅读。,了解其他回归模型的原理、分析步骤、操作和结果阅读。,考察目标:,能用,SPSS,独立完成简单的相关分析、多元线性回归与,Logistic,回归模型的分析,能正确阅读其分析结果,能利用常用的模型诊断工具对模型拟和情况进行初步诊断。重点考察:回归分析时的变量筛选、回归分析结果和,Logistic,模型分析结果的阅读,变量是否满足回归分析要求的判断,。,第七讲:聚类分析,判别分析,要求:,掌握快速聚类和系统聚类的操作,了解各种距离,掌握其结果的阅读。,了解判别方法的分类,熟悉判别分析的适用条件和结果验证方法,掌握判别分析的操作,重点掌握结果阅读。,考察目标:,能按要求将样本进行分类,重点考察对冰柱图和树状图结果的解释。,能独立判断数据是否符合判别分析的适用条件,能求出相应的判别式,并使用他对新纪录进行分类。重点考察对结果的阅读(领域图、未标化典型判别函数、,Bayes,判别函数)和使用分析结果对新纪录进行分类。,第八讲:因子分析,生存分析,要求:,熟悉因子分析(主成分分析)的用途、目的,掌握如何判断因子分析的适用条件,能正确选择适当的因子。熟悉因子旋转的含义并能正确使用。掌握分析结果的阅读。,了解寿命表法、,K-M,曲线的一般操作方法,重点掌握结果的阅读。掌握,Cox,模型的原理、操作方法和结果的阅读。,考察目标:,能独立使用,SPSS,进行因子分析解决实际问题,能够正确阅读分析结果。重点考察因子数目的确定和结果的阅读。,独立完成简单的寿命表法、,K-M,法和复杂,COX,模型的分析,能正确阅读分析结果。重点考察,COX,模型的操作,分析结果的阅读。,例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行,logistic,回归分析(本例来自卫生统计学第四版第11章)。,i:,标本序号,x1:,确诊时患者的年龄(岁),x2:,肾细胞癌血管内皮生长因子(,VEGF),,其阳性表述由低到高共3个等级,x3:,肾细胞癌组织内微血管数(,MVC),x4:,肾癌细胞核组织学分级,由低到高共4级,x5:,肾细胞癌分期,由低到高共4期,y:,肾细胞癌转移情况(有转移,y=1;,无转移,y=0)。,标本序号,i,年龄,x1,VEGF,x2,MVC,x3,分级,x4,分期,x5,癌转移,y,1,59,2,43.4,2,1,0,2,36,1,57.2,1,1,0,3,61,2,190,2,1,0,4,58,3,128,4,3,1,5,55,3,80,3,4,1,6,61,1,94.4,2,1,0,7,38,1,76,1,1,0,8,42,1,240,3,2,0,9,50,1,74,1,1,0,10,58,3,68.6,2,2,0,11,68,3,132.8,4,2,0,12,25,2,94.6,4,3,1,13,52,1,56,1,1,0,14,31,1,47.8,2,1,0,15,36,3,31.6,3,1,1,16,42,1,66.2,2,1,0,17,14,3,138.6,3,3,1,18,32,1,114,2,3,0,19,35,1,40.2,2,1,0,20,70,3,177.2,4,3,1,21,65,2,51.6,4,4,1,22,45,2,124,2,4,0,23,68,3,127.2,3,3,1,24,31,2,124.8,2,3,0,25,58,1,128,4,3,0,26,60,3,149.8,4,3,1,Logistic,回归对话框如下:,上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析,可见此处因不存在缺失值,,26,条记录均纳入了分析。,此处已经开始了拟合,,Block 0,拟合的是只有常数的无效模型,上表为分类预测表,可见在,17,例观察值为,0,的记录中,共有,17,例被预测为,0,,,9,例,1,也都被预测为,0,,总预测准确率为,65.4%,,这是不纳入任何解释变量时的预测准确率,相当于比较基线。,上表为,Block 0,时的变量系数,可见常数的系数值为,-0.636,。,上表为在,Block 0,处尚未纳入分析方程的侯选变量,所作的检验表示如果分别将他们纳入方程,则方程的改变是否会有显著意义(根据所用统计量的不同,可能是拟合优度,,Deviance,值等)。可见如果将,X2,系列的哑变量纳入方程,则方程的改变是有显著意义的,,X4,和,X5,也是如此,由于,Stepwise,方法是一个一个的进入变量,下一步将会先纳入,P,值最小的变量,X2,,,然后再重新计算该表,再做选择。,此处开始了,Block 1,的拟合,根据我们的设定,采用的方法为,Forward,(,我们只设定了一个,Block,,,所以后面不会再有,Block 2,了)。上表为全局检验,对每一步都作了,Step,、,Block,和,Model,的检验,可见,6,个检验都是有意义的。,此处为模型概况汇总,可见从,STEP1,到,STEP2,,,DEVINCE,从,18,降到,11,,两种决定系数也都有上升。,此处为每一步的预测情况汇总,可见准确率,由,Block 0,的,65%,上升到了,84%,,最后达到,96%,,效果不错,最终只出现了一例错判。,上表为方程中变量检验情况列表,分别给出了,Step 1,和,Step 2,的拟合情况。注意,X4,的,P,值略大于,0.05,,但仍然是可以接受的,因为这里用到的是排除标准(默认为,0.1,),该变量可以留在方程中。以,Step 2,中的,X2,为例,可见其系数为,2.413,,,OR,值为,11,。,上表为假设将这些变量单独移出方程,则方程的改变有无统计学意义,可见都是有统计学意义的,因此他们应当保留在方程中。,最后这个表格说明的是在每一步中,尚未进入方程的变量如果再进入现有方程,则方程的改变有无统计学意义。可见在,Step 1,时,,X4,还应该引入,而在,Step 2,时,其它变量是否引入都无关了。,模型的进一步优化与简单诊断,模型的进一步优化,前面我们将,X1X5,直接引入了方程,实际上,其中,X2,、,X4,、,X5,这三个自变量为多分类变量,我们并无证据认为它们之间个各等级的,OR,值是成倍上升的,严格来说,这里应当采用哑变量来分析,即需要用,Categorical,钮将他们定义为分类变量。,但本次分析不能这样做,,原因是这里总例数只有,26,例,如果引入哑变量模型会使得每个等级的记录数非常少,从而分析结果将,极为奇怪,,无法正常解释,但为了说明哑变量模型的用法,下面我将演示它是如何做的,毕竟不是每个例子都只有,26,例。,上表为自变量中多分类变量的哑变量取值情况代码表。左侧为原变量名及取值,右侧为相应的哑变量名及编码情况:以,X5,为例,表中可见,X5=4,时,即取值最高的情况被作为了基线水平,这是多分类变量生成哑变量的默认情况。而,X5(1),代表的是,X5=1,的情况(,X5,为,1,时取,1,,否则取,0,),,X5(2),代表的是,X5=2,的情况,依此类推。同时注意到许多等级值有几个记录,显然后面的分析结果不会太好。,上表出现了非常有趣的现象:所有的检验,P,值均远远大于,0.05,,但是所有的变量均没有被移出方程,这是怎么回事?再看看下面的这个表格吧。,这个表格为方程的似然值改变情况的检验,可见在最后,Step 2,生成的方程中,无论移出,X2,还是,X4,都会引起方程的显著性改变。也就是说,似然比检验的结果和上面的,Walds,检验结果冲突,以谁为准?此处应以似然比检验为准,因为它是全局性的检验,且,Walds,检验本身就不太准,这一点大家记住就行了,实在要弄明白请去查阅相关文献。,上表为,Block 1,的迭代记录,可见无论是似然值,还是三个系数值,均是从迭代开始就向着一个方向发展,最终达到收敛,这说明整个迭代过程是健康的,问题不大;如果中途出现波折,尤其是当引入新变量后变化方向改变了,则提示要好好研究。,上表为方程中变量的相关矩阵,可见,X2,和常数相关性较强,当引入,X4,后仍然如此,提示要关注这一现象,以防因自变量间的共线性导致方程系数不稳(此时迭代记录多半也会有波动)。当然,由于本例只有,26,条记录,这一问题是没有办法深入研究的。,上图是,Step 1,结束时,即只引入,X2,时的预测图,,0,和,1,代表实际取值,当预测的概率值大于,0.5,时,则预测结果为,1,,反之为,0,,由上图可见,该模型对,0,的预测是比较好的,多数的概率都在,0,附近,但对,1,的预测不准,即使正确的,计算出的概率也在,0.8,左右,并且有好几个都判错了。,上图为,Step 2,结束后模型的预测状况,可见此时预测结果有了较大的改善,概率精度提高了许多,只有一例,0,被错判为了,1,,并且从分布上看,这一例可能是极端情况,再引入其它变量也不见的能将预测效果改变多少。,SPSS,高级培训班课程大纲,SPSS,北京办事处,第一讲:方差分析模型,掌握单因素方差分析的数据格式、操作方法与结果阅读,熟悉方差分析中各种两两比较方法的选择、操作和结果阅读。,掌握一元多因素方差分析模型的原理、操作和分析结果的阅读,掌握相应的图形工具在分析中的应用。,熟悉多元方差分析模型和重复测量方差分析模型的原理和操作方法,掌握这两者分析结果的阅读。,第二讲:相关分析,回归分析模型,掌握相关分析、偏相关分析的操作与结果阅读。,掌握多元线性回归模型的原理、分析步骤、操作和结果阅读,重点掌握逐步、前进、后退三种筛选方法的含义与用法、分析结果的阅读,熟悉各种常用模型诊断工具(分类图等)的用法。,熟悉加权最小二乘法、两阶段最小二乘法的原理、操作和结果阅读,了解最优尺度回归的功能。,第三讲:,Logistic,模型、非线性回归,掌握二分类,Logistic,回归模型的原理、分析步骤、操作和结果阅读,熟悉无序多分类、有序多分类,Logistic,回归模型、,Probit,模型的原理、分析步骤、操作和结果阅读,熟悉非线性回归模型的操作和结果阅读。,第四讲:聚类分析、判别分析、因子分析,掌握快速聚类和系统聚类的操作,了解各种距离,能按要求将样本进行分类,重点掌握对其结果的阅读,尤其是冰柱图和树状图结果的解释。,了解判别方法的分类,熟悉判别分析的适用条件和结果验证方法,掌握判别分析的操作,重点掌握对结果的阅读(领域图、未标化典型判别函数、,Bayes,判别函数)和使用分析结果对新纪录进行分类。,熟悉因子分析和主成分分析的用途、目的,掌握如何判断因子分析的适用条件,能正确选择适当的因子。熟悉因子旋转的含义并能正确使用。掌握分析结果的阅读。,第五讲:对应分析、信度分析、多维尺度分析,熟悉对应分析的原理、用途、目的、掌握其使用方法、结果阅读。,熟悉信度分析的用途、使用方法、结果阅读。,熟悉多维尺度分析的原理、用途、掌握其使用方法、结果阅读。,第六讲:时间序列模型简介、生存分析、讨论,熟悉时间序列模型的基本原理、用途、基本操作流程、建模时常用的诊断工具。,熟悉寿命表法、,K-M,曲线的一般操作方法,重点掌握结果的阅读。,掌握,Cox,模型的原理、操作方法和结果的阅读。,SPSS for Windows,初级培训,课程内容,:,统计图:饼图、条形图、散点图等,交互式统计图,频数分析,描述性分析,探索性分析,交叉表,多重选择变量,SPSS,语法,数据模版、数据字典,SPSS for Windows,的简单介绍,对原始数据进行编码和计算得出新的变量,如何选择适当的统计量,打印和保存结果,如何直接在,SPSS,数据编辑窗口直接输入数据,如何对缺失值进行编码,打开,EXCEL,Dbase,和,fixed format ASC,格式的文件,增加变量和变量的标签的方法,结果格式的修改(包括统计图和统计表的修改)统计图:饼图、条形图、散点图等,SPSS for Windows,中级培训,课程内容,统计图:饼图、条形图、散点图等,l,交互式统计图,频数分析,描述性分析,探索性分析,交叉表,多重选择变量,数据模版、数据字典,对原始数据进行编码和计算得出新的变量,如何选择适当的统计量,打印和保存结果,如何直接在,SPSS,数据编辑窗口直接输入数据,如何对缺失值进行编码,打开,EXCEL,Dbase,和,fixed format ASC,格式的文件,增加变量和变量的标签的方法,结果格式的修改(包括统计图和统计表的修改),数据整理,样本数量的影响,假设检验:均值计算,单样本,t,检验,独立样本均值检验,成对样本的均值比较,,F,检验,分布检验,方差分析:单因素方法分析,双因素方差分析,相关分析,线性回归,SPSS,培训市场研究专题班,课程内容,:,一、 数据采集(,SPSS Data Entry),进行问卷设计,同时建立数据库。数据有效性检验、字段间逻辑关系检验、条件跳转等。 处理多选题,用一套数据定义同时生成打印格式的纸张问卷、在线录入和,WEB,格式问卷。 如何进行问卷录入,核对。,二、 数据分析使用,SPSS,对收集到的数据进行整理数据,并制作高级统计图表。 使用,SPSS,中的相关分析、聚类分析与判别分析、因子分析分析消费者的购买习惯、市场情况等。 使用,SPSS,的联合分析模块,了解在消费者心目中什么产品属性是重要的;了解最偏爱的属性水平是什么;进行定价研究;进行品牌价格研究;在产品投入大批量生产之前进行这些研究,以避免可能的失误。 使用,SPSS,的对应分析,透过感知图来解释结果。研究任何分类型态,使用尺度优化过程,使分析结果变量中的关系定位在大型参考框架中。通过改进传统的主成份分析,更确切地处理和了解顺序及名义数据。有效地对消费者进行定位,找出具有不同特性的消费者的不大相同的消费偏好,更深入地了解消费者。 使用,AnswerTree,软件,采用数据挖掘的计算方法,建立顾客决策树模型和市场细分,把整个市场划分成不同的几个小区域,找出最有可能响应您宣传促销的顾客群,减少促销成本,提高利润。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!