第3章spss21教程完整版课件

上传人:仙*** 文档编号:241638995 上传时间:2024-07-12 格式:PPT 页数:32 大小:1.02MB
返回 下载 相关 举报
第3章spss21教程完整版课件_第1页
第1页 / 共32页
第3章spss21教程完整版课件_第2页
第2页 / 共32页
第3章spss21教程完整版课件_第3页
第3页 / 共32页
点击查看更多>>
资源描述
第三章 数据文件、变量与函数lSPSS的变量类型l数据文件的打开和保存lSPSS的函数3.1 SPSS的变量类型 在变量视图中,选择变量类型一列,然后单击“类型”按钮,弹出“定义变量类型”对话框数据类型l数值型,即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数,默认为2位。l加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型。l3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为 12.345,00(实际是12345E-4)。l科学记数型,同时定义数值宽度和小数位数,在数据管理窗口中以指数形式显示。例如,定义数值宽度为9,小数位数为2,则345.678 显示为3.4678E+02。l日期型,用户可从系统提供的日期显示形式中选择自己需要的。例如,选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。l货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有。l常用型,显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。l字符型,用户可定义字符长度以便输入字符。横方向为电子表格的行,其行头以1,2,3,表示,即第1,2,3,行;纵方向为电子表格的列,其列头以var00001,var00002,var00003,表示变量名。鼠标一旦移入电子表格内即呈十字形,这时单击鼠标左键可激活单元格,被激活的单元格以加粗的边框显示;用户也可以按方向键上下左右移动来激活单元格。单元格被激活后,用户即可向其中输入新数据或修改已有的数据。输入数据编辑变量1、名称(名称(Name)选项 用于输入字符(汉字和英文)作为变量的名称,如不输入名称,系统依次默认为“var00001”,“var00002”,“var00003”变量名应遵循下列原则:l在SPSS21.0中没有限制。l首字符必须是字母或汉字,不能以下划线“_”或圆点“.”结尾。l变量名不能有空格或某些特殊符号,如“!?*”等。l变量名不能与SPSS的关键字相同,即不能用ALL、AND、BY、EQ、GT、LE等。2类型(型(Type)选项 用于设置变量类型,前面已经讲述,单击其左侧的按钮即可弹出对话框进行设置。3宽度(度(Width)选项 用于指定数据字符占据的总个数(包括小数点和小数位)。4小数(小数(Decimal)选项 用于指定小数位。5标签(Label)选项 变量标签:有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。这个时候,就在变量定义的标签栏里输入注释。6值(Values)选项 变量值标签:变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。例如,有一个数值变量,0表示女性,1表示男性。此时,为了便于识别这些数值,则用变量值标签。7缺失(缺失(Missing)选项 缺失值:缺失值是统计分析时,对数据中缺少数据的一种统计识别值。8宽度(度(Columns)选项 数据列的显示宽度:显示数据的列宽,默认8个字 符。9对齐(Align)选项 对齐方式:有左中右三种数据显示方式。10度量度量标准(准(Measure)选项 度量标准:按度量精度将变量分为定量变量、等级变量和定性变量。该选项仅用于统计绘图时坐标轴变量的区分,以及决策树模块的变量定义。定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生低抗、中抗和高抗。11角色角色选项 角色包括输入、目标,两者都是无分区拆分。3.2 数据文件的打开和保存l打开打开SPSS数据数据 从菜单选择“文件(File)打开(Open)数据(Data)”命令,在弹出的“打开文件”对话框中指定数据文件的路径,文件名框内显示的是SPSS数据文件,系统默认的文件类型为“*.sav”,单击所选文件,单击“打开”按钮,或双击所选文件。这样就把该数据文件调入数据编辑窗口中。l打开其他格式的数据文件打开其他格式的数据文件 SPSS现在可以直接读入许多格式的数据文件,其中就包括Excel各个版本的数据文件。选择菜单“文件(File)打开(Open)数据(Data)”或直接单击快捷工具栏上的 按钮,系统就会弹出“打开文件(Open File)”对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式。数 据 格 式说 明SPSS(*.sav)SPSS数据文件SPSS压缩文件(*.zsav)被压缩的SPSS数据文件SPSS/PC+(*.sys)SPSS 4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSS portable(*.por)SPSS便携格式的数据文件Excel(*.xls)Excel数据文件Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBASE(*.dbf)dBASE系列数据文件Text(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件SASSAS格式的数据集l数据文件保存数据文件保存 选择菜单“文件(File)保存(Save)”SPSS可以将数据保存为SPSS(*.sav)、Excel(*.xls)、dBASE(*.dbf)、ASCII(*.dat,*txt)等数据文件形式。在弹出的“保存文件”对话框里,指定保存路径,输入文件名,确定数据类型,最后单击“保存(save)”按钮。3.3 SPSS函数l 算算术函数函数函 数 名自变量含义函 数 类 型函数功能及说明ABS(numexpr)(算术表达式)数值型函数求绝对值ARSIN(numexpr)(角度;弧度单位)数值型函数求反正弦值ARTAN(numexpr)(角度;弧度单位)数值型函数求反正切值COS(radians)(角度;弧度单位)数值型函数求余弦值EXP(numexPr)(算术表达式)数值型函数求e的指数幂值LGl0(numexp)(算术表达式)数值型函数求以10为底的对数值LN(numexpr)(算术表达式)数值型函数求以e为底的对数MOD(numexpr,modulus)(算术表达式;模数(常数)数值型函数求算术表达式除以模数的余数SIN(radians)(角度;弧度单位)数值型函数求正弦值SQRT(numexpr)(正数)数值型函数求平方根RND(numexpr)(算术表达式)数值型函数求算术表达式的值四舍五入后的整数TRUNC(numexpr)(算术表达式)数值型函数求算术表达式的值被截去小数部分的整数l 统计函数函数函 数 名自变量含义函 数 类 型函数功能与说明CFVAR(numexpr,numexpr,)(变量名,变量名,.)数值型函数求出多个变量值的变异系数(标准差/均值)LAG(variable)(变量名)数值型函数或字符型函数返回滞后一期的变量数据。对第一个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格LAG(variable,ncases)(变量名,自然数n)数值型函数返回滞后n期的变量数据。对前n个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格MAX(ivalue,value,)(变量名,变量名,)数值型函数求多个变量值中的最大值;例如,MAX(数学,物理,化学):分别计算每个学生三门成绩中的最高分MEAN(numexpr,numexpr,)(变量名,变量名,)数值型函数求多个变量值的平均值;例如,MEAN(数学,物理,化学):分别计算每个学生三门成绩的平均值MIN(value,value,)(变量名,变量名,)数值型函数求多个变量值中的最小值;例如,Min(数学,物理,化学):分别计算每个学生三门成绩中的最低分NVALID(variable,variable,)(变量名,变量名,)数值型函数求出变量的(不包括缺失值)数量SD(numexpr,numexpr,)(变量名,变量名,)数值型函数求多个变量值的标准差;例如,SD(数学,物理,化学):分别计算每个学生三门成绩的标准差SUM(numexpr,numexpr,)(变量名,变量名,)数值型函数求多个变量值的和;例如,Sum(数学,物理,化学):分别计算每个学生三门成绩的总和VARIANCE(numexpr,numexpr,)(变量名,变量名,)数值型函数求多个变量值的方差;例如,Variance(数学,物理,化学):分别计算每个学生三门成绩的方差l 逻辑函数函数 逻辑函数有如下两个:1ANY(test,valu,value,)逻辑型函数型函数 自变量为(变量名,x1,x2,),函数功能是判断变量值是否是x1,x2,中的一个,例如,Any(数学,80,90,70):分别对每条个案判断其数学成绩是否为80分或90分或70分。2RANGE(test,lo,hi,10,hi)逻辑型函数型函数 变量必须都为数值型或字符型,自变量为(变量名,x1,x2),其中x1x2,函数功能是判断某变量值是否在x1x2之间,例如,RANGE(数学,80,90):分别对每条个案判断其数学成绩是否在8090分。l 日期和日期和时间函数函数1DATE.DMY(day,month,year)SPSS日期型格式的数值函数,返回与指定的日、月、年相应的日期值。2DATE.YRDAY(year,daynum)SPSS日期型的格式数值函数,返回与指定的天数、年相应的日期值。要正确显示这个值,必须赋予其DATE格式。daynum取值范围为1366。3XDATE.DATE(datevalue)SPSS日期格式的数值型函数,从具有SPSS的日期格式的自变量数值返回一个日期,自变量数值由DATE.xxx函数产生或按DATE输入格式读取。该函数用于将日期的数值格式转换为日期格式,因此,要想按日期格式显示必须再在Variable View中定义一种日期格式,否则会按SPSS日期的数值格式显示。此函数无2000年问题21世纪的日期也能正确显示。4XDATE.HOUR(datevalue)数值型函数,从DATE.xxx函数产生或按一种DATE格式读入的SPSS日期格式的数值,返回一个小时数(023)。5XDATE.JDAY(datevalue)数值型函数,通过DATE.xxx函数产生或由DATE输入格式读入SPSS日期格式的数值,返回一年的天数(1366)。6XDATE.MDAY(datevalue)数值型函数,从一个SPSS日期格式的数值通过DATE.xxx函数产生或由DATE输入格式读入,返回一个月的天数(131)。7XDATE.MINUTE(datevalue)数值型函数,通过DATE.xxx函数产生或由DATE输入格式读入SPSS日期格式的数值,返回分钟数(059)。8XDATE.MONTH(datevalue)数值型函数,通过DATE.xxx函数产生或由DATE输入格式读入SPSS日期格式的数值,返回一年中的月数(112)。9XDATE.TDAY(timevalue)数值型函数,自变量是由TIME.xxx函数产生或由TIME输入格式读取的SPSS时间间隔格式的数值,返回整天数(正整数)。10XDATE.TIME(datevalue)SPSS时间间隔格式的数值型函数,把自变量的值看做从午夜开始的秒数,返回一天中的时间(小时、分、秒)。自变量是SPSS日期格式的数值,可以是由DATE.xxx函数产生的或由DATE输入格式读入的。由该函数建立的变量应该给定一个合适的显示格式。在VariableView中,赋予它一个时间显示格式,将变量值显示成小时和分。11XDATE.WEEK(datevalue)数值型函数。由一个SPSS日期格式数值(由DATE.xxx函数产生或由一种DATE输入格式读入),返回周数(153整数)。12XDATE.WKDAY(datevalue)数值型函数,由一种通过DATE.xxx函数产生或用 DATE格式读入的SPSS日期格式数值,返回的数值表示一周的星期几(星期一至星期日用17之间的整数表示)。13XDATE.YEAR(datevalue)数值型函数,由DATE.xxx函数产生或用DATE格式读入的SPSS日期格式的数值,返回年数。YRMODA(year,month,day)数值型函数,返回一个由1582年10月15日到自变量给定的年月日(year,month,day)之间的天数。l 随机随机变量函数量函数1NORMAL(stddev)数值型函数,产生一个来自均值为0标准差为stddev的分布总体的随机数。2RV.BERNOULLI(p)数值型函数,产生一个来自伯努利分布具有指定概率参数 P的随机数。3RV.BINOM(n,p)数值型函数,产生一个来自二项式分布具有指定试验次数n和概率参数p的随机数。4RV.CHISQ(df)数值型函数,产生一个来自卡方分布具有指定自由度df的随机数。5RV.EXP(shape)数值型函数,产生一个来自指数分布具有指定形状参数的随机数。6RV.F(df1,df2)数值型函数,产生一个来自F分布具有指定自由度的随机数。7RV.GEOM(p)数值型函数,产生一个来自几何分布具有指定概率参数P的随机数。8RV.HYPER(totd,sample,hits)数值型函数,产生一个来自超几何分布具有指定参数的随机数。9RV.LOGISTIC(mean,scale)数值型函数,产生一个来自逻辑斯蒂分布具有指定的均数mean和标度scale参数的随机数。10RV.LNORMAL(a,b)数值型函数,产生一个来自对数正态分布具有指定参数的随机数。11RV.NORMAL(mean,stddev)数值型函数,产生一个来自正态分布具有指定均值 mean和标准差stddev的随机数12RV.PARETO(threshold,shape)数值型函数,产生一个来自帕累托分布具有指定临界值threshold和形状shape参数的随机数。13RV.POISSON(mean)数值型函数,产生一个来自泊松分布具有指定均值或比率参数的随机数。14RV.T(df)数值型函数,产生一个来自学生t分布具有指定自由度的随机数。15RV.UNIFORM(min,max)数值型函数,产生一个来自具有指定最大值max和最小值min的均匀一致分布的随机数。16RV.WEIBULL(a,b)数值型函数,产生一个来自威布尔分布具有指定参数的随机数。17UNIFORM(max)数值型函数,产生一个来自一致分布的值在0和自变量给定的max之间的伪随机数。l 反分布函数反分布函数 IDF.CHISQ(p,df)数值型函数,产生来自卡方 分布的临界值,第一个自变量为概率值p,第二个自变量为自由度df。例如,累积概率为0.95,自由度为5的卡方分布的临界值记作IDF.CHISQ(0.95,5),其函数值IDF.CHISQ(0.95,5)=1.145。IDF.EXP(p,shape)数值型函数,产生一个来自指数分布的临界值,该分布具有给定行状参数shape,概率值p。IDF.F(p,dfl,df2)数值型函数,产生一个来自F分布的值,该分布具有自由度为dfl,df2,累计概率为p的临界值。例如,显著性概率在0.05水平上,自由度分别为6、5的F值为IDF.F(0.95,6,5)=4.9503。DF.LOGISTIC(prob,mean,scale)数值型函数,产生一个均值为mean和标度参数为scale,累计概率为p的逻辑斯蒂分布的临界值。IDF.LNORMAL(p,a,b)数值型函数,产生具有指定参数和累计概率p的对数正态分布的临界值。IDF.NORMAL(p,mean,stddev)数值型函数,产生来自正态分布具有指定均值和标准差的累计概率。例如,显著性水平为0.05,均值为0,标准差为1的标准正态分布的临界值IDF.NORMAL(0.95,0,1)=1.645。IDF.PARETO(prob,threshold,shape)数值型函数,产生一个来自帕累托分布,累计概率为p的值,该分布的临界值为threshold,尺度参数为scale。IDF.T(prob,df)数值型函数,产生一个自由度为df,累计概率为p的来自学生t分布的临界值。IDF.UNIFORM(p,min,max)数值型函数,产生一个累计概率为p的来自均匀分布的临界值,均匀分布的最大值为max、最小值为min。PROBIT(p)数值型函数,产生累计概率为p的标准正态分布的临界值。l 累累计分布函数分布函数1CDF.BERNOULLI(q,p)数值型函数,产生来自具有给定概率参数p的伯努利分布,变量值小于q的累计概率值。2CDF.BETA(q,shapel,shape2)数值型函数,产生来自Bate分布的变量取值小于q累计概率值,该分布具有给定的形状参数shapel,shape2。3CDF.BINOM(q,n,p)数值型函数,产生来自二项分布的变量取值小于q的累计概率值,该分布具有给定每次试验成功的概率p,成功的试验次数是n。当n=1时,该函数与CDF.BERNOULLI相同。4CDF.CAUCHY(q,loc,scale)数值型函数,产生来自柯西分布的变量取值小于q的累计概率值,该分布具有给定的位置参数loc和标度参数scale。5CDF.CHISQ(q,df)数值型函数,返回来自卡方分布的变量取值小于q的累计概率值,该分布具有给定的自由度df。6CDF.EXP(q,shape)数值型函数,产生来自指数分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape。7CDF.F(q,df1,df2)数值型函数,产生来自F分布的变量取值小于q的累计概率值,该分布具有给定的自由度dfl,df2,累计概率值小于quant。8CDF.GAMMA(q,shape,scale)数值型函数,产生来自伽玛分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape和标度参数scale。9CDF.GEOM(q,p)数值型函数,产生一个几何分布的变量取值小于q的累积概率,即获得一次成功的试验次数,成功概率由p确定。10CDF.HYPER(q,total,sample,hits)数值型函数,产生小于q的累积概率,即具有指定特性的事件数q,当样品sample事件是从尺寸为total的总体中随机选择出来的情况下,其命中数hits具有指定的特性。11CDF.LAPLACE(q,mean,scale)数值型函数,产生来自拉普拉斯分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。12CDF.LOGISTIC(q,mean,scale)数值型函数,产生来自逻辑斯蒂分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。13CDF.LNORMAL(q,a,b)数值型函数,产生具有指定参数的对数正态分布变量取值小于q的累计概率值。14CDF.NEGBIN(q,thresh,p)数值型函数,产生变量取值小于q的累计概率值,即当临界参数为 thresh,p给出成功的概率。15CDFNORM(zvalue)数值型函数,产生一个具有均值为0,标准差为1的随机变量的取值小于zvalue的概率。16CDF.NORMAL(q,mean,stddev)数值型函数,产生一个正态分布的变量取值小于q的累计概率,该分布均值为mean,标准差为stddev。17CDF.PARETO(q,threshold,shape)数值型函数,产生一个变量取值小于q的帕累托分布的累计概率,该分布具有指定的限值threshold和形状参数shape。18CDF.POISSON(q,mean)数值型函数,产生一个来自POISSON分布的小于q的累计概率值,它具有指定的均值或率参数。19CDF.T(q,df)数值型函数,产生一个变量取值小于q的学生t分布的累计概率,该分布具有指定的自由度参数df。20CDF.UNIFORM(q,min,max)数值型函数,产生一个变量取值小于q的均匀一致分布的累计概率,该分布具有指定的最小值min和最大值max参数。21CDF.WEIBULL(q,a,b)数值型函数,产生一个变量取值小于q的威布尔分布的累计概率,该分布具有指定的参数。l 缺失缺失值函数函数1NMISS(variable,)数值型函数,自变量是当前工作数据文件中的变量名。计算自变量中缺失值的数目。例如,Missing(数学):分别对数学这个变量逐个判断是否为系统缺失值或用户缺失值。l表示是,0表示不是。2MISSING(variable)逻辑型函数,自变量应该是工作数据文件中的变量名。如果变量具有缺失值,返回1或者true。3SYSMIS(numvar)逻辑型函数,自变量numvar是工作数据文件中的一个数值型变量的变量名。如果numvar的值为系统缺失值,返回1或者true。4VALUE(variable)数值型或字符型函数,忽略用户缺失值,即将用户缺失值看做普通的数据,返回变量值。自变量必须是工作数据文件中的变量名。l 字符串函数字符串函数1CONCAT(strexpr,strexpr,.)字符型函数,函数中每个自变量都是一个字符串表达式。该函数值是一个字符串,是各自变量代表的字符串按括号中的顺序串接起来的。此函数要求两个或两个以上的自变量。2INDEX(haystack,needle)数值型函数,产生一个整数,它表明字符串needle在字符串 haystack中第一次出现的起始位置。如果返回值为0,表明字符串needle不在字符串haystack中存在。3INDEX(haystack,needle,divisor)数值型函数,见INDEX(haystack,needle)函数。其第三个自变量divisor是可选择的,它必须是一个整数,表明将字符串needle均匀地分为要被查询的独立字符串的字符数。4LENGTH(strexpr)数值型函数,自变量是字符串,函数值是字符串表达式值的长度。这里获得的长度包括尾部空格。5LPAD(strexpr,length)字符型函数,第一个自变量strexpr是字符串,第二个自变量length是正整数,其范围为1255。函数值是字符串表达式的左侧增加空格扩展到length所规定的长度。6LTRIM(strexpr)字符型函数,返回的字符串是自变量表达式的值去除打头的空格后的字符串。7LOWER(strexpr)字符型函数,返回字符串,将字符串中的大写字母改变为小写字母。8RINDEX(haystack,needle)数值型函数,产生一个整数,它表明字符串needle在字符串haystack中最后出现的开始位置。返回0表示字符串needle不在haystack中。9RPAD(strexpr,length)字符型函数,返回字符串,其长度由length决定。在字符串表达式的右侧加空格,以达到length的长度,length的值为1255。写在最后写在最后成功的基成功的基础在于好的学在于好的学习习惯The foundation of success lies in good habits31谢谢聆听 学习就是为了达到一定目的而努力去干,是为一个目标去战胜各种困难的过程,这个过程会充满压力、痛苦和挫折Learning Is To Achieve A Certain Goal And Work Hard,Is A Process To Overcome Various Difficulties For A Goal
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!