(精品)spsst2_装配图网

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,李炜制作,*,第三讲,SPSS,的主要窗口和菜单,1,SPSS,的3个主要窗口,1-1 数据编辑器窗口（,SPSS Data Editor）：,用来编辑和显示数据；在此窗口中的文件名称为*.,sav,。,1-2 程序语句编辑器窗口（,SPSS Syntax Editor）：,用来编写各种程序；在此窗口中的文件名称为*.,sps,。,1-3 结果观看窗口（,SPSS Viewer）：,显示统计运算结果；在此窗口中的文件名称为*.,spo,。,2,SPSS,数据编辑器的主要菜单,2-1,File,菜单：文件管理,New；Open；Save；Save as；Exit。,2-2,Edit,菜单：编辑,Undo；Cut；Copy；Paste；Clear；Find；,2-3,View,菜单：视图,Fonts；Grid lines；Value labels。,2-4,Data,菜单：数据整理,define variables；Insert variables；Insert case；,go to case；sort case；select case。,2-5,Transform,菜单：数据转换,recode,；compute；count。,2-6,Statistics,菜单：统计,2-7,Graphs,菜单：统计图,2-8,Utilities,菜单：工具附件,2-9,Windows,菜单：窗口,2-10,Help,菜单：帮助,第四讲,SPSS,的单变量描述统计,1 单变量描述统计介绍,A,变量的尺度：,a,定类,Category Scale：,只能计次,b,定序,Ordinal Scale：,计次、排序,c,定距,Interval Scale：,计次、排序、加减,d,定比,Ratio Scale：,计次、排序、加减、乘除,B,变量的统计描述：,分布,Distribution,集中趋势,Central tendency,离散趋势,Dispersion,分布,平均数,中位数,众数,离散程度,2,SPSS,的单变量描述统计命令,A Frequencies:,频数统计,Statistics,Summarize,Frequencies,变量值,频数,百分比,有效百分比,累计百分比,中位数,百分比和有效百分比,B,Descriptives,:,定距变量描述统计,Statistics,Summarize,Descriptives,变量名,平均数,标准差,最小值,最大值,第四讲,SPSS,的双变量关系描述统计（一）,列联与方差分析,1、变量关系概述,寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。,在统计学上，我们通常这样判断变量之间是否有关：如果一个变量的取值发生变化，另外一个变量的取值也相应发生变化，则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。,性别与四级英语考试通过率的相关统计,表述：统计结果显示，当性别取值不同时，通过率变量的取值并未发生变化，因此性别与考试通过率无关。,自变量的不同取值在因变量上无差异，两变量无关。,自变量的不同取值在因变量上有差异，两变量有关。,因变量,自变量,表述：统计结果显示，当性别取值不同时，收入变量的取值发生了变化，因此性别与月收入有关。,自变量,因变量,2、双变量关系的统计类型,3、列联统计,3-1 列联表的格式,自变量,因变量,人数,行百分比,列百分比,总百分比,边缘百分比,边缘百分比,条件百分比,3-2 列联分析的原理：,自变量发生变化，因变量取值是否也发生变化。,比较边缘百分比和条件百分比的差别,。,4-1）变量关系强度的含义:,指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析：,A）,两变量是否相互独立。,B）,两变量是否有共变趋势。,C）,一变量的变化多大程度上能由另一变量的变化来解释。,4 列联变量的关系强度测量,4-2）双变量关系强度测量的主要指标,4-3）卡方测量的原理：,卡方测量用来考察两变量是否独立(无关)。,其原理是根据这一概率定理：若两变量无关，则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。,在列联表中，这一定理就具体转化为：,若两变量无关，则两变量中条件概率应等于各自边缘的概率乘积。反之，则两变量有关，或，两变量不独立。,示例,15,15,65,5,观察值,边缘概率,边缘概率,期望条件概率,9,9,-9,-9,残差,由此可见，,期望值（独立模型）与观察值的差距越大，说明两变量越不独立，也就越有相关。,因此，卡方的表达式如下：,卡方的取值在0之间。卡方值越大，关联性越强。在,SPSS,中，有,Pearson X,2,和相似比卡方（,Likelihood Ratio X,2,）,两种。,4-4）的改进标准化系数,：,为使值有一固定的区间，便于比较，采用了以下几个修正：,A、,系数（,Phi）：(01),适用于22表。,B、,列联系数（,Contingency Coefficient）：,(01)，适用任意表。,C、,Cramer,V,系数：(01)，适用任意表。,D、,系数(,Lambda)：(01)，,适用任意表。,E、Goodman&,Kruskal,-,tau,系数:(01)，适用任,意表。,5 列联统计命令：,Statistics,Summarize,Crosstabs,第五讲,SPSS,的双变量关系描述统计（二）,分组平均数比较（方差分析）,1、分组平均数比较的含义,当一个变量为定类变量，另一变量为定距变量时，两变量间是否有关，通常以分组平均数比较的方法来考察。即按照定类变量的不同水平来分组，看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小，两个变量间的关系越弱；相反，平均数差异越大，变量间关系越强。,2、分组平均数比较的格式,3、定类定距变量的关系强度测量,定类变量和定距变量的关系强度测量采用,F,统计的方法，即方差分析。,3-1,F,统计的原理,F,统计的目的是分析分组的平均数是否相等。如果相等，说明组间没有差别；如果不相等，说明组间平均数有差异，这时分组是有效的。但,F,统计独特的地方是，它并不直接利用平均数来比较，而是利用与方差有关的统计指标总变差（,SST）、,组间变差（,SSB）、,组内变差（,SSW）,的关系来进行判别。,男,女,收入,Y,总,=800元,Y,女,=800元,Y,男,=800元,男,女,收入,Y,总,=800元,Y,女,=600元,Y,男,=1000元,收入,Y,i,Y,i,男,女,SST=SSB+SSW,三者的关系是,：,SST,是总变差，即未分组的数据的变差，总方差的分子,。,SSTSSB+SSW,SSB,是组间变差，各组平均数与总平均数的离差平方和,SSW,是组内变差，每组数据和该组平均数的离差平方和。,由于方差和变差标志着每一数据对其平均数的偏离（即异质性），因此，,F,值（,F=SSB/SSW）,含义就可理解为组间异质性和组内异质性的比较。,F,值的范围在 0到正无穷大之间。当,F,值1，则说明组与组间的差别大于组内的差别，也就说明这时组间平均数的差异是存在的。,3-2定类定距变量的关系强度系数,E,ta,2,F,值和列联统计中的,X,2,一样，取值范围在0到正无穷大之间。因此，也需要对,F,值加以修正，形成一个标准化的关系系数。,Eta,2,就是这样的一个系数。,Eta,2,=SSB/SST,即在总变差中，组间变差所占的比例。,Eta,2,的取值范围在0+之间，越接近1，就表明组间差异越大；越接近0，就表明组间平均数趋于一致。,Eta,2,=0.026,4,SPSS,中分组平均数和方差分析的统计命令,Statistics,Compare Means,Means,第六讲,SPSS,的双变量关系描述统计（三）,相关,1 定距定距尺度（,P,earson Cor,.）,1）相关的含义:,相关(,Correlation),是用来作两个定距变量关系的统计分析，考察两变量是否存在共同变化的趋势。如年龄与收入。,2）积矩相关的统计原理：,两变量共同变化的趋势在统计中用,共变异数（,Covariance）,来表示。即,A,变量的取值从低到高（或从高到低）变化时，,B,变量是否也同样发生变化。,当两变量在同一方向上变化，称为有正相关；相反方向变化，称为负相关；无变化即无相关。相关系数即用来表示相关的程度。,如：,X(,丈夫收入);,Y(,妻子收入,),Y,X,P(,x,i,y,i,),Y=k,k,P(,x,i,y,i,),+,-,-,+,共变异数(协方差)=,+,-,-,+,散点越集中于1、3象限，共变异数的和正值约大；,散点越集中于2、4象限，共变异数的和负值约大；,散点越均匀分布于各象限，共变异数的和越趋近于0。,3）相关系数的计算公式：,由此公式可看出：,1,相关就是共变异数的标准化。,2,相关系数,r,的取值范围在（-1，+1）之间。,+1代表完全正相关；-1表示完全负相关；0,表示无相关。,示例：通过此题来演算相关系数,。,2 定序定序尺度（,Spearman Cor,.）,积差相关的公式：,积差相关又称等级相关，用来考察两个定序变量间的相关关系。它的公式是由积矩相关转变而来，,其中，,D,是每一对因变量和自变量的序数的差值；,N,是总的排序的序数。,示例：,3,SPSS,中的相关统计命令,Statistics-Correlate-,Bivariate,4 相关统计的输出格式,相关系数,人数,1,回归的含义：,回归（,Regression，,或,Linear Regression）,和相关同样都用来分析两个定距变量间的关系，但回归有明确的因果关系假设。即要假设一个变量为自变量，一个为因变量，自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达，它具有统计预测功能。,第六讲,SPSS,的双变量关系描述统计（四）,线性回归,2 回归的统计原理：,两个定距变量的回归是用函数,y=f（x）,来分析的。我们最常用的是一元回归方程,其中,x,为自变量；,y,为因变量；,a,为截距，即常量；,b,为回归系数，表明自变量对因变量的影响程度。,Y=350+20 x,在统计学中，这一方程中的系数是靠,x,与,y,变量的大量数据拟合出来的。,X,Y,Y=a+,bx,（x，y）,由图中可以看出，回归直线应该是到所有数据点最短距离的直线。该直线的求得即使用“最小二乘方法”，使:,在拟合的回归直线方程中，回归系数：,表示,x,每变化一个单位时，,x,与,y,共同变化的程度（共变异数）。,常数,比如通过上学年数和工资的关系计算得出下列的回归公式：,y=472+14.8x,就可知上学年数每增长1年，工资会增加14.8元；,也可推测，上学年数为15年的人，工资收入应为472+14.8*15=694元。,3,SPSS,线性回归的统计命令,Statistics,Regression,Linear,自变量,因变量,回归方式,4,SPSS,线性回归的输出格式：,常数,自变量,回归系数,标准化回归系数,每月工资=823.3-3.487年龄,1,推断统计的一般概念,1.1 推断统计的含义及类型：,（1）含义：推断统计是指用概率分布的方法，由,样本的统计量,推断,总体参数,的统计方式。,第七讲：,SPSS,的推断统计（一）,参数估计和单变量的假设检验,样本统计量,：样本中某个变量的统计值。如此次调查中高中文化程度的人占32%。,样本 32%,总体参数,：与样本中某个变量的统计值相对应的总体中的统计值。如全市人口中高中比例为38%。,总体38,样本统计量有可能等于总体参数，也有可能不等于总体参数，但二者之间有着某种概率关系。,推断统计就是教会我们如何利用这种概率关系来由样本统计量推估总体参数。,为了区别样本和总体的不同，样本的平均数用,

展开阅读全文

(精品)spsst2

最新文档