SPSS实例分析

上传人:hjk****65 文档编号:244990393 上传时间:2024-10-06 格式:PPT 页数:99 大小:1.17MB
返回 下载 相关 举报
SPSS实例分析_第1页
第1页 / 共99页
SPSS实例分析_第2页
第2页 / 共99页
SPSS实例分析_第3页
第3页 / 共99页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS,软件例题分析,Base system,(,基本统计系统),ACF,(,时间序列研究中的自动相关分析),97K,Aggregate,(,数据文件的汇总),106K,Anova,(,方差分析),137K,Autorecode,(,变量自动赋值处理),49K,Correlations,(,相关分析),73K,Crosstabs,(,列联表处理),302K,Curvefit,(,11,种曲线模型的拟合),125K,Date,(,变量定义与数据录入),155K,Descriptives,(,均数、标准差等的描述性统计,79K,Examine,(,数值分布形式的探究),290K,Fit,(,定义程序运行条件),94K,Flip,(,数据行列转换),44K,Frequencies,(,频数表分析),121K,Graph,(,统计图制作),219K,List,(,原始数据显示),52K,Matrix Data,(,数据的矩阵处理),81K,Mconvert,(,矩阵转化),42K,Means,(,均数及均数差别的显著性检验),140K,Mult,Response,(,多变量数据的处理),90K,Nonpar,Corr,(,非参数资料的相关分析),80K,Npar,Tests,(,非参数检验),199K,Oneway,(,单因素方差分析),160K,Partial,Corr,(,偏相关分析),90K,Plot,(,曲线绘制),118K,Rank,(,等级排序、计算正态分数、百分比等分析),57K,Regression,(,回归分析),453K,Report,(,结果输出),226K,Sort,(,数据排序),43K,SP Chart,(,高分辨率的统计制图),94K,Sysfile,Info,(,显示,SPSS,格式的系统文件信息),35K,TS Plot,(,时间序列资料的统计制图),190K,T-Test,(,t-,检验),77K,基本统计系统共需硬盘空间,4.1 M,Professional Statistics option,(,专业统计系统),Alscal,(,利用最小二乘法处理多等级测量资料),404K,Cluster,(,聚类分析),166K,Discriminant,(,判别分析),435K,Factor,(,因子分析),296K,Proximities,(,资料相似性分析),117K,Quick Cluster,(,快速聚类分析),104K,Reliability,(,可靠性分析),164K,2SLS,(,两级最小二乘法分析),107K,WLS,(,加权最小二乘法分析),94K,专业统计系统共需硬盘空间,1.9 M,Advanced Statistics option,(,高级统计系统),Cox Regression,(,Cox,回归模型),374K,Hiloglinear,(,多因子系统模式的对数线性模型),155K,Kaplan-Meier,(,Kaplan-Meier,生存时间模型),160K,Loglinear,(,对数线性模型及最优化检验),207K,Logistic,(,Logistic,模型),351K,Manova,(,协方差分析),738K,Matrix,(,高级矩阵转换),490K,Nonlinear,(,非线性分析),147K,Probit,(,依照所需概率作拟合最优化分析),134K,Survival,(,寿命表方式的生存分析),178K,高级统计系统共需硬盘空间,2.9 M,80/20,规则在,SPSS,的使用中同样有效,以,Analyze,菜单为例,其中最常用的子菜单为:,Discriptive,Statistics,Compare Means,General Linear Model,(,第一项),Correlate,Regression,(,前半截),SPSS,软件界面,查阅变量,Data Reduction,数据变换,Report,报告,Compare Means,平均数比较,Descriptive Statistics,描述性统计分析,General Linear Model,一般线性模型,Correlate,相关分析,Regression,回归分析,Loglinear,对数线性模型,Classify,分类,Survival,生存分析,Nonparametric Tests,非,参数检验,查阅数据,t,SPSS,的主菜单,菜单栏共有,9,个选项:,1,、,File,:,文件管理菜单(文件调入、存储、显示和打印等),2,、,Edit,:,编辑菜单(文本内容的选择、拷贝、剪贴、寻找和替换等),3,、,Data,:,数据管理菜单(数据变量定义、数据格式选定、观察对象 的选择、排序、加权、数据文件的转换、连接、汇总等),4,、,Transform,:,数据转换处理菜单(数值的计算、重新赋值、 缺失值替代等),5,、,Statistics,:,统计菜单(统计方法),6,、,Graphs,:,作图菜单(统计图的制作),7,、,Utilities,:,用户选项菜单(命令解释、字体选择、文件信息、定义 输出标题、窗口设计等),8,、,Windows,:,窗口管理菜单(窗口排列、选择、显示),9,、,Help,:,求助菜单,第一章,SPSS,概览,1.1,数据的输入和保存,例,1.1,某克山病区测得,11,例克山病患者与,13,名健康人的血磷值,(,mmol,/L),如下,问该地急性克山病患者与健康人的血磷值是否不同?,患者,: 0.84 1.05 1.20,1.20,1.39 1.53 1.67 1.80 1.87 2.07 2.11,健康人,: 0.54 0.64,0.64,0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,具体工作流程如下:,1.,将数据输入,SPSS,。,2.,进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。,3.,按题目要求进行统计分析。,4.,保存和导出分析结果。,下面就按这几步依次讲解。,1.1,数据的输入和保存,1.1.1 SPSS,的界面,1.1.2,定义变量,该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为,X,,,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为,GROUP,。,建立,X,变量,1.1.3,输入数据,先来输入变量,X,的值,1.1.4,保存数据,支持数据类型:,DBF,、,FoxPro,、,EXCEL,、,ACCESS,1.2,数据的预分析,选择“分析”,=“,描述统计”,=“,描述”菜单,我们以上的做法对吗?,当然有问题!,光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择,Data =Split File,菜单,系统弹出文件分割对话框如下:,1.2.2,绘制直方图,统计指标只能给出数据的大致情况,没有直方图那样直观,画直方图,选择,Graphs =Histogram,,,系统会弹出绘制直方图对话框如下:,将变量,X,选入,Variable,选择框内,单击,OK,按钮。此时结果浏览窗口内会绘制出如下两个直方图:,两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样本均数比较的,t,检验来分析。,最后,还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“,Analyze all cases, do not create group”,,,单击,OK,按钮就可以了。,1.3,按题目要求进行统计分析,下面用,SPSS,来做成组设计两样本均数比较的,t,检验,选择,Analyze=Compare Means= Independent -Samples T test,,,系统弹出两样本,t,检验对话框如下:,将变量,X,选入,test,框内,变量,group,选入,grouping,框内,注意这时下面的,Define Groups,按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:,该对话框用于定义是哪两组相比,在两个,group,框内分别输入,1,和,2,,表明是变量,group,取值为,1,和,2,的两组相比。然后单击,Continue,按钮,再单击,OK,按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等,然后是,t,检验的结果如下:,Independent Samples Test,可见该结果分为两大部分:第一部分为,Levenes,方差齐性检验,用于判断两总体方差是否齐,这里的检验结果为,F,= 0.032,,,p,= 0.860,,,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的,t,检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的,t,检验结果,即上面一行列出的,t,= 2.524,,,=22,,,p,=0.019,。,从而最终的统计结论为按,=0.05,水准,拒绝,H,0,,,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。,1.4,保存和导出分析结果,1.4.1,保存结果文件,三种办法:,需要结果的时候再运行一次分析程序。,用笔将结果抄在纸上。,直接保存结果文件。,方便快捷的是第三种,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单,File=Save,,,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个,Save as,对话框,和前面相比,唯一的区别就是文件的保存类型只有,View Files(*.,spo,),一种。在文件名框中键入“,Li1_1”,并回车,该结果文件就会按文件名,Li1_1.spo,被存储。,1.4.2,导出分析结果,SPSS,提供纯文本格式功能,在结果浏览窗口中选择菜单,File=Export,,,系统会弹出,Export Output,对话框如下:,第二章 描述性统计分析,Frequencies,过程,【Display frequency tables,复选框,】,确定是否在结果中输出频数表。,【,Statistics,钮,】,单击后弹出,Statistics,对话框,用于定义需要计算的其他描述统计量。,定义需要输出的百分位数,定义描述集中趋势的一组指标:均数,(Mean),、,中位数,(Median),、,众数,(Mode),、,总和,(Sum),定义描述离散趋势的一组指标:标准差,(Std.deviation),、,方差,(Variance),、,全距,(Range),、,最小值,(Minimum),、,最大值,(Maximum),、,标准误,(S.E.mean),定义描述分布特征的两个指标:偏度系数(,Skewness,),和峰度系数,(Kurtosis),第三章 均数间的比较,3.1,Means,过程,和上一章所讲述的几个专门的描述过程相比,,Means,过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程。显然要方便的多。,分组平均数比较的含义,当一个变量为定类变量,另一变量为定距变量时,两变量间是否有关,通常以分组平均数比较的方法来考察。即按照定类变量的不同水平来分组,看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小,两个变量间的关系越弱;相反,平均数差异越大,变量间关系越强。,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。,自变量的不同取值在因变量上无差异,两变量无关。,自变量的不同取值在因变量上有差异,两变量有关。,因变量,自变量,3.1.1,界面说明,【Dependent List,框,】,用于选入需要分析的变量。,【Independent List,框,】,用于选入分组变量。,【Options,钮,】,弹出,Options,对话框,选择需要计算的描述统计量和统计分析:,选入的描述统计量,对分组变量进行单因素方差分析,检验线性相关性,Statistics,框 可选的描述统计量。它们是:,sum,,,number of cases,总和,记录数,mean, geometric mean, harmonic mean,均数,几何均数,修正均数,standard deviation,,,variance,,,standard error of the mean,标准差,均数的标准误, 方差,median, grouped median,中位数,minimum,,,maximum,,,range,最小值,最大值,全距,kurtosis, standard error of kurtosis,峰度系数,峰度系数的标准误,skewness, standard error of,skewness,偏度系数,偏度系数的标准误,percentage of total sum, percentage of total N,总和的百分比,样本例数的百分比,3.1.2,结果解释,以第一章的数据为例,输出如下:,3.2,Independent-Samples T Test,过程,Independent-Samples T Test,过程用于进行两样本均数的比较,即常用的两样本,t,检验。,定义需要相互比较的两组的分组变量值,选入分组变量,选入需要分析的变量,与,Means,过程的含义相同,3.2.2,结果解释,要检验克山病患者与健康人的血磷值是否相同,用,Independent-Samples T Test,过程的结果输出如下:,T-Test,可见该结果分为两大部分:第一部分为,Levenes,方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为,F = 0.032,,,P = 0.860,,,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的,t,检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的,t,检验结果,即上面一行列出的,t= 2.524,,,=22,,,P=0.019,。,从而最终的统计结论为按,=0.05,水准,拒绝,H0,,,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。,上表的标题内容翻译如下:,3.3,One-Way ANOVA,过程,One-Way ANOVA,过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较,在本章的内容中,是最为复杂的一个。,AN,alysis,O,f,VA,riance,F,统计的原理,F,统计的目的是分析分组的平均数是否相等。如果相等,说明组间没有差别;如果不相等,说明组间平均数有差异,这时分组是有效的。但,F,统计独特的地方是,它并不直接利用平均数来比较,而是利用与方差有关的统计指标总变差(,SST,)、,组间变差(,SSB,)、,组内变差(,SSW,),的关系来进行判别。,3.3.1,界面说明,An,alysis,o,f,Va,riance,选入需要分析的变量,可选入多个结果变量。,选入需要比较的分组因素,只能选入一个。,用于对精细趋势检验和精确两两比较的选项进行定义,选择进行各组间两两比较的方法,定义相关的选项,可选从线性趋势一直到最高五次方曲线,定义是否在方差分析中进行趋势检验,定义精确两两比较的选项。这里按照分组变量升序给每组一个系数值,注意最终所有系数值相加应为,0,。如果不为,0,仍可检验,只不过结果是错的。,如对第一、三组进行单独比较,则给三组分配系数为,1,、,0,、,-1,,就会在结果中给出相应的检验内容。,一组当各组方差齐时可用的两两比较方法,共有,14,种,其中最常用的为,LSD,和,S-N-K,法。,一组当各组方差不齐时可用的两两比较方法,共有,4,种,其中以,Dunnettss,C,法较常用。,定义两两比较时的显著性水平,默认为,0.05,。,统计描述,方差齐性检验,用各组均数做图,对缺失值的处理方法,相关变量有缺失值,则在所有分析中均将该记录去除,具体分析用到的变量有缺失值才去除该记录,3.3.2,分析实例,例 用低、中、高水平的生长素处理牧草根系,测定处理后的根系长度,问,3,组根长有无差别,?,1.8,2.3,2.9,1.4,2.1,3.2,1.5,2.1,2.7,2.1,2.1,2.8,1.9,2.6,2.7,1.7,2.5,3.0,1.8,2.3,3.4,1.9,2.4,3.0,1.8,2.4,3.4,1.8,3.3,2.0,3.5,低 中 高,Oneway,上面给出了单因素方差分析的结果,可见,F=84.544,,,P0.001,。,因此可认为,3,组根长不同。翻译如下:,上表是用,S-N-K,法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的,P,值小于,0.05,,而同一亚组内的各组均数比较的,P,值则大于,0.05,。从上表可见,高、中和低被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有,1,个组别进入,因此最下方的组内两两比较,P,值均为,1.000,(自己和自己比较,当然绝对不会有差异了)。,例,1,:通过重复小区的牧草生长量的比较,从,8,个苜蓿品种无性系中选优,考虑到试验地土质差异,而将整个试验区划分成,4,个区组(即,4,个重复),每一区组分成,8,个小区,每一小区是一个处理,各区组的小区排列是随机的,其设计图式及试验结果如图:,保护带,0.20,0.18,0.18,0.16,0.14,0.20,0.19,0.12,3,8,6,2,1,7,5,4,0.15,0.18,0.14,0.22,0.14,0.23,0.19,0.20,7,2,3,4,1,5,8,6,0.12,0.13,0.17,0.20,0.21,0.16,0.13,0.21,1,4,7,5,6,8,2,3,0.13,0.18,0.17,0.21,0.17,0.13,0.15,0.11,4,5,6,3,7,2,8,1,保护带,保,护,带,保,护,带,为了进行方差分析,将所取得的各无性系重复小区的生长数据列下表,1,,并计算其有关数值见表,2-1,、表,2-2,。,表,2-1,组区,B,生长量,x,品种,A,重 复,平均数,1,2,3,4,5,6,7,8,牧,草,生,长,量,0.14,0.16,0.20,0.12,0.19,0.18,0.20,0.18,0.14,0.14,0.22,0.14,0.23,0.20,0.18,0.19,0.12,0.13,0.21,0.13,0.20,0.21,0.17,0.16,0.11,0.13,0.21,0.13,0.18,0.17,0.17,0.15,0.52,0.56,0.84,0.52,0.80,0.76,0.72,0.68,0.13,0.14,0.21,0.13,0.20,0.19,0.18,0.17,0.2704,0.3136,0.7056,0.2704,0.6400,0.5776,0.5184,0.4624,1.37,1.45,1.33,1.25,5.40,1.35,3.7584,0.17125,0.18125,0.16625,0.15625,0.16875,表,2-2,品 种,重 复,总和,牧,草,生,长,量,1,2,3,4,5,6,7,8,0.0196,0.0256,0.0400,0.0144,0.0361,0.0324,0.0400,0.0324,0.0196,0.0196,0.0484,0.0196,0.0529,0.0400,0.0324,0.0361,0.0144,0.0169,0.0441,0.0169,0.0400,0.0441,0.0289,0.0256,0.0121,0.0169,0.0441,0.0169,0.0324,0.0289,0.0289,0.0225,0.0686,0.0790,0.1766,0.0678,0.1614,0.1454,0.1302,0.1166,0.9456,解(,)作统计假设,假设八个无性系在各小区的生长均无显著差异。,(,2,)计算离差平方和,SS,内,= SS,总,SS,间,=0.03435-0.02835,= 0.00600,列方差分析表,表,2-3,(4),结论,:,小概率事件出现,推翻假设,即八个无性系之间的生长量有显著差异。,上面进行的方差分析只得出八个无性系之间的生长量有着显著的差异,但究竟这些无性系品种相互之间生长量哪些有显著差异,现在还需要进行检验。,下面按各平均数的大小顺序排列,列表,2-4,进行比较。,变差,来源,离差,平方和,自由度,方 差,F,F,a,组间,0.02835,8-1=7,0.00405,F,0.05,(7;24),=2.42,组内,0.00600,31-7=24,0.00025,总和,0.03435,31,结论,:,无性系中,3,与,4,,与,1,,,3,与,2,,,5,与,1,,,5,与,2,;,6,与,4,,,6,与,1,,,6,与,2,;,7,与,4,,,7,与,1,均有显著差异。即无性系中,3,,,5,,,6,和,7,号品种均可以,95%,的可靠性选用,其他不宜选用。,上面是对试验结果作的单因素方差分析,随机区组试验的结果还可以用双因素方差分析的方法进行分析。其中一因素即问题所研究的因素,无性系的生长量,另一因素为区组条件。双因素方差分析可以判断这两个因素各水平间的差异显著程度。如果区组之间无显著差异。说明各区组条件相似。否则,只有用随机区组设计,借助于双因素方差分析把区组间差异撇除,才可能真正弄清楚所研究的各处理间的差异显著性,克服区组间差异的干扰。,0.08 *,0.07*,0.06*,0.05*,0.04,0.01,0.00,0.08*,0.07*,0.06*,0.05*,0.04,0.01,0.07*,0.06*,0.05*,0.04,0.01,0.07*,0.06*,0.05*,0.04,0.03,0.04,0.03,0.02,0.01,0.02,0.01,0.01,表2-4,例,2,:对上例我们用双因素方差分析的方法进行分析。,统计假设是一样的。,在离差平方和的计算中多一项区组间离差平方和。,SS,总,=0.03435,(同前),SS,A,=0.02835,,(,SS,A,表示品种间的离差平方和也同前),=0.03435-0.02835-0.0026,=0.0034, (,SSe,表示误差项平方和),自由度,f,总,=km-1=48-1=31,f,A,=m-1=8-1=7,f,B,=K-1=4-1=3,f,C,= f,总,-,f,A,-f,B,=31-7-3=21,列方差分析表,2-5,表,2-5,结论,:,F,A,F,a,F,B,F,a,表明无性系品种与区组对生长量均有显著影响,品种的差异显著性与单因素方差分析是一致的,但在单因素方差分析中假定了区组条件基本一致,而用双因素方差分析方法分析的结果,区组的差异也显著,这表明虽然采取了随机区组设计,但在土壤条件方面差异并没有被完全克服。若用单因素方差分析则不能发现这一问题,用双因素方差分析的优点也就在于此。,关于具体信息测验部分与单因素方差分析是相同的。,变差来源,离差平方和,自由度,方 差,F,Fa,品种,A,0.02835,f,A,=7,0.0045,F0.05(7.21),=2.49,F0.05(3,21),=3.07,区组,B,0.0026,f,B,=3,0.0087,误差项,0.0034,f,C,=21,0.00016,总 和,0.03435,F,总,=31,第四章 一般线性模型,Univariate,子菜单:单变量方差分析。,Multivariate,子菜单:多变量方差分析。,Repeated Measures,子菜单:重复测量数据的分析。,Variance Components,子菜单:用于作方差成份模型。,4.1,两因素方差分析,例 对小白鼠喂以,A,、,B,、,C,三种不同配方的食物,目的是了解不同食物增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的,24,只小白鼠分为,8,个区组,每个区组,3,只小白鼠。三周后体重增量结果,(,克,),列于下表,问小白鼠经三种不同食物喂养后所增体重有无差别?,选入需要分析的变量,(,因变量,),,只能选入一个,weight,固定因素,随机因素,协方差分析时的协变量,food,group,单击,【Model,钮,】,后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为,Full factorial,,,即分析所有的主效应和交互作用。我们这里没有交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的,custom,,,这时中部的,Build Term,下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。这里我们只能分析主效应:选择,main,,,再用黑色箭头将,group,和,food,选入右侧的,model,框中,如果对这段叙述不太清楚,请参考下面的动画。,首先是所用方差分析模型的检验,,F,值为,11.517,,,P,小于,0.05,,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量,GROUP,,,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的,FOOD,,,非常遗憾,它的,P,值为,0.084,,结论是:尚不能认为三种配方喂养的小白鼠体重增量有差别。,Post Hoc Tests,FOOD,Homogeneous Subsets,这是两两比较的结果,方法为,SNK,法,由于前面总的比较无差异,所以这里三种食物均在一个亚组内,检验无差异,,P,值为,0.121,可能有用的几个问题:,需要分析的影响因素可以都选入,fixed factor,框,如果不是复杂的模型,一般分析结果不会有误。,方差分析模型多数情况下要选,model III,,,但这在数据存在缺失值、设计不平衡等情况下要慎重考虑,因为此时往往会要求模型进行详细的设置。,model,的设置对分析是非常重要的,如果设置不正确,可能什么都做不出来,比如无重复数据的方差分析纳入了交互作用、析因设计的方差分析纳入了设计中不存在的因素,就会做不出结果。,一般线性模型的复杂性是较高的,一旦存在有疑问的内容,一定要查阅有关统计书籍,并在必要时请教专业统计分析人员。,4.4,多元方差分析,所谓的多元方差分析,就是说存在着不止一个因变量,而是两个以上的因变量共同反映了自变量的影响程度。比如要研究某些因素对牧草生长的影响程度,则高度、产量等都可以作为生长状况的测量因子,即都应作为因变量。,学生编号,甲地区,乙地区,丙地区,身高,体重,胸围,身高,体重,胸围,身高,体重,胸围,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,119.80,121.70,121.40,124.40,120.00,117.00,118.10,118.80,124.20,124.90,124.70,123.00,125.30,124.20,127.40,128.20,126.10,128.70,129.50,126.90,126.50,128.20,131.40,130.80,133.90,130.40,131.30,130.20,136.00,141.00,22.60,21.50,19.10,21.80,21.40,20.10,18.80,22.00,21.30,24.00,23.30,22.50,22.90,19.50,22.90,22.30,22.70,23.50,24.50,25.50,25.00,26.10,27.90,26.80,27.20,24.40,24.40,23.00,26.30,31.90,60.50,55.50,56.50,60.50,57.70,57.00,57.10,61.70,58.40,60.80,60.00,60.00,65.20,53.80,59.50,60.00,57.40,60.40,51.00,61.50,63.90,63.00,63.10,61.50,65.80,62.60,59.50,62.60,60.00,63.70,125.10,127.00,125.70,114.90,124.90,117.60,124.20,117.90,120.40,115.00,126.20,125.10,114.90,121.50,114.00,118.70,120.60,122.90,119.60,112.30,121.30,121.20,120.20,120.30,120.00,123.30,122.10,123.30,109.90,125.60,23.00,21.50,23.40,17.50,23.50,18.90,20.80,20.30,20.00,19.70,21.20,22.10,19.70,22.00,19.00,19.10,20.00,18.50,19.50,20.00,20.00,21.20,23.10,21.00,22.20,20.10,21.00,21.50,17.80,23.30,62.00,59.00,61.50,52.50,58.50,57.00,58.50,61.00,56.00,56.50,56.50,58.50,56.00,57.00,54.50,54.50,55.50,56.00,59.50,58.00,58.00,59.00,59.50,59.50,59.50,56.50,57.50,61.00,56.50,60.50,118.30,121.30,121.80,124.20,123.50,123.00,134.90,123.70,105.20,112.20,118.60,112.00,121.50,124.50,119.50,122.50,115.50,122.50,124.50,125.00,117.50,127.30,122.30,121.30,120.50,116.00,120.50,114.50,131.00,122.50,20.40,20.00,26.60,22.10,23.20,22.90,32.30,22.70,20.20,20.80,21.00,23.20,24.00,21.50,20.50,23.00,19.00,22.50,25.00,25.50,23.00,22.50,22.00,21.00,22.00,19.00,20.00,19.00,25.50,24.50,54.40,54.30,61.10,58.60,60.20,58.20,64.80,59.90,54.50,57.50,57.60,58.20,60.30,55.60,55.50,56.70,54.20,57.60,57.90,60.30,59.00,58.90,58.20,55.60,55.10,53.50,54.40,53.40,58.30,58.70,4.5,重复测量的方差分析,重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。,4.5.1,Repeated measures,对话框界面说明,实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?我们通过下面的例子来看看:,第五章 相关分析,相关,(,Correlation,),是用来作两个变量关系的统计分析,考察两变量是否存在共同变化的趋势。,两变量共同变化的趋势在统计中用,共变异数(,Covariance,),来表示。即,A,变量的取值从低到高(或从高到低)变化时,,B,变量是否也同样发生变化。当两变量在同一方向上变化,称为有正相关;相反方向变化,称为负相关;无变化即无相关。相关系数即用来表示相关的程度。,SPSS,的相关分析功能被集中在,Statistics,菜单的,Correlate,子菜单中,包括以下三个过程:,Bivariate,过程,此过程用于进行两个,/,多个变量间的参数,/,非参数相关分析,如果是多个变量,则给出两两相关的分析结果。这是,Correlate,子菜单中最为常用的一个过程,实际占相关分析的,95%,以上。,Partial,过程,如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数,这种分析思想和协方差分析非常类似。,Partial,过程就是专门进行偏相关分析的。,Distances,过程,调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。该过程在实际应用中用的非常少。,Bivariate,过程,界面说明,用于选入需要进行相关分析的变量,至少需要选入两个,产量,高度,进行积距相关分析,即最常用的参数相关分析,计算,Kendalls,等级相关系数,非参数相关分析(秩相关),单侧或双侧检验,一般选双侧检验。,是否用星号标记有意义的相关系数,一般选中。,P0.05,的系数会标一个星号,,P0.01,的标两个星号。,第六章:多元线性回归,回归的含义:,回归(,Regression,,或,Linear Regression,),和相关同样都用来分析两个变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。,例测得,10,名,3,岁儿童的身高(,cm,)、,体重(,kg,),和体表面积(,cm,2,),资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为因变量的回归方程。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!