资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,实用生物统计分析(一),SPSS,简介与基本操作,安徽大学生命科学学院,实用生物统计分析(一)SPSS简介与基本操作安徽大学生命科,统计学为数据分析的理论基础,统计软件为数据分析的实现手段,实用统计分析的基本过程,明确分析目的,正确整理待分析的数据,选择适当的统计方法进行分析,正确解读分析结果,发现规律,得出结论,序 言,统计学为数据分析的理论基础,统计软件为数据分析的实现手段序,序 言,优秀的统计分析软件应具备:,算法先进、运算能力强大;,系统地集成了多种成熟的统计分析方法;,有完善的数据定义、操作和管理功能;,方便地生成各种统计图形和统计表格;,良好的人机交互环境;,软件开放性好,能方便地和其他软件进行数据交换。,序 言优秀的统计分析软件应具备:,序 言,常用的统计分析软件,Excel,;,SAS(Statistical Analysis System),;,SPSS,;,Minitab,;,Origin,;,R,S-Plus,MATLAB,STATISTICA,序 言常用的统计分析软件,序 言,参考书籍,GR Norman&DL Streiner,著,凌莉等译:,生物统计学基础,(Biostatistics:the Bare Essentials),(第,3,版)人民卫生出版社,,2010,杜荣骞著:,生物统计学,(第,3,版)高教出版社,,2009,张文彤等著:,SPSS,统计分析基础教程,北京高教出版社,,2011,GP Quinn&MJ Keough,著,曾岩主等译:,生物实验设计与数据分析(中文版),(Experimental Design and Data Analysis for Biologists),,高教出版社,,2004,序 言参考书籍,SPSS,基础,软件名称,Statistical Package for Social Science,Statistical Product and Service Solutions,软件发展,1968,:,SPSS,始创于美国斯坦福大学,1975,:,SPSS,公司成立于芝加哥,推出,SPSS,中小型 机版,SPSSX,1984,:,SPSS PC DOS,版问世(,SPSS/PC+,),1992,:,SPSS Windows,版问世(,v5,),2013,:,SPSS Windows,最新版(,v22,),(,IBM SPSS Statistics 22),SPSS基础软件名称,SPSS,基础,SPSS,基本特点,视窗风格界面,对初学者友好,易上手,集成常用和高级分析模块,功能完整、强大,内置程序编译功能,满足编程用户基本需要,较为丰富的图表生成功能,与,Excel,等外部软件实现数据交流和自动嵌入,不足,对大数据量的计算速度相对较慢,整合最新统计模型、方法相对滞后,不利于前沿的统计分析,SPSS基础SPSS基本特点,SPSS,基础,基本窗口,数据编辑窗口(,Data editor,),功能:对,SPSS,的数据进行定义、录入、修改、管理等基本操作的窗口,包含,数据视图工作表(,data view,),和,变量视图工作表(,variable view,),两部分。,组成:窗口主菜单,(,Data,、,Transform,、,Analyze,、,Graphs,),、工具栏、数据编辑区、状态显示区,SPSS,运行过程中自动打开;且只能打开一个窗口;运行过程中无法关闭,SPSS,中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以,.sav,存于磁盘上,SPSS基础基本窗口,数据编辑窗口,(,Data editor,),数据框,变量名,工具栏,状态栏,数据编辑区,变量视图工作表,数据编辑窗口(Data editor)数据框变量名工具栏状态,变量视图工作表(,Variable View,),变量名,(variable name),变量名是变量存取的唯一标志,变量类型,(type),和显示宽度,(width),数值型:常用标准数值型,(Numeric):,默认类型,8.2,如:,12345678,、,12345.67,、,-1234.56,字符型,(String):,存储字符数据,8,位。如:,beijing,处理时用双引号扩起来,日期型,(Date):,存储日期数据,如:,20-AUG-1999,变量视图工作表(Variable View)变量名(vari,变量视图工作表(,Variable View,),标签,(Label),:注释变量的意义,数值标签,(Values),:特定赋值代表的意义,如:,1-,“高温”;,2-,“常温”;,3-,“低温”,缺失,(Missing),:,若有数据缺失时的处理,如:缺失的数据都用“,99.00,”代替,测量方法,(Measure),:,标度、有序、名义,scale ordinal nominal,变量视图工作表(Variable View)标签(Label,统计学基础回顾,“,scale,”,统计学基础回顾“scale”,基本窗口,输出窗口(,viewer,),功能:,SPSS,统计分析报表及图形的输出窗口,组成:窗口主菜单、工具栏、结果显示区、状态显示区,在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的,viewer,窗口;输出窗口可以关闭;,状态栏上的,!,表示当前输出窗口,窗口内容存储文件格式,-,filename.spo,SPSS,基础,基本窗口SPSS基础,输出窗口,(,Viewer,),结果显示区,状态显示区,输出窗口(Viewer)结果显示区状态显示区,高级应用窗口,语法编辑窗口(,syntax editor,),功能:,SPSS,语言的程序编译,适合批量数据处理等高级运用,打开:,SPSS,基础,File,NewSyntax,高级应用窗口SPSS基础FileNewSyntax,主要菜单项,SPSS,基础,主要菜单项SPSS基础,SPSS,基础,利用,SPSS,做数据分析的一般步骤,建立,SPSS,数据文件,定义数据文件结构(包含哪些变量),录入、修改和编辑待分析的数据,分析数据,统计分析之前的数据预处理,统计分析和建模,结果输出和解读,数据和分析结果的保存,SPSS基础利用SPSS做数据分析的一般步骤,SPSS,数据文件,默认格式:,*.sav,兼容格式:,Excel:*.xls,纯文本:,*.txt,*.dat,其他,SPSS 数据文件 默认格式:*.sav,打开,*.sav,数据文件,数据文件,(,后缀,sav),打开数据文件,打开*.sav 数据文件数据文件(后缀sav)打开数据文件,打开,Excel,数据文件,打开数据文件,数据文件,(,后缀,xls),打开Excel数据文件打开数据文件数据文件(后缀xls),打开,Excel,数据文件,打开数据文件,打开Excel数据文件打开数据文件,打开纯文本数据文件,打开数据文件,数据文件,(,后缀,dat),打开纯文本数据文件打开数据文件数据文件(后缀dat),打开纯文本数据文件,打开数据文件,按提示步骤完成格式转换,打开纯文本数据文件打开数据文件按提示步骤完成格式转换,数据保存(,Save,Data,),默认保存为,*.sav,。,如果出于兼容性的考虑,可存为更为通用的格式,如:,Excel,(,*.xls,),纯文本格式(,*.dat,):选择“,tab-delimited(*.dat),”,纵列数据间用“,tab,”分隔,数据保存(Save Data)默认保存为*.sav。,数据处理,SPSS,内置一系列函数,可实现对数据的各种数学处理,为后续的统计操作作准备。,根据函数功能和处理的变量类型,,SPSS,函数大致可以分成八大类:,算术函数、统计函数、分位数函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数,。,操作步骤:,Transform,Compute variable,数据处理SPSS内置一系列函数,可实现对数据的各种数学处理,,数据处理函数举例,函数名,功能,举例,Abs(a),求,a,的绝对值,Abs(k-38),Sqrt(a),求,a,的平方根,Sqrt(4)=2,Sin(a),求,a,的正弦值,Sin(30*3.14/180)=0.5,Cos(a),求,a,的余弦值,Cos(60*3.14/180)=0.5,Exp(a),求,e,为底的,a,次幂,Exp(50)=148.41,Ln(a),求,a,的自然对数值,Ln(k),Lg10(a),求,a,以,10,为底的对数值,Lg10(5)=0.7,Rnd(a),求,a,四舍五入后的整数,Rnd(2.66)=3,Trunc(a),求,a,截去小数部分后的整数,Trunc(4.7)=4,Mod(a,b),求,a,除以常数,b,后的余数,Mod(20,3)=2,算术函数,数据处理函数举例函数名功能举例Abs(a)求a的绝对值Abs,函数名,功能,Mean(v),求变量,v,的平均数,Sd(v),求变量,v,的标准差,Variance(v),求变量,v,的方差,Sum(v),求变量,v,的总和,Cfvar(v),求变量,v,的变异系数,Max(v),求变量,v,的最大值,Min(v),求变量,v,的最小值,数据处理函数举例,统计函数,函数名功能Mean(v)求变量v的平均数Sd(v)求变量v的,数据处理函数举例,统计函数,CDF&Noncentral CDF(,累积概率函数,),Inverse DF(,将概率转化换为正态离差等,),PDF&noncentral PDF(,概率密度函数,),Random numbers(,产生各类随机数,),Statistics(,计算方差、协方差等,),Significance(,卡方、,F,分布的临界值计算,),数据处理函数举例统计函数CDF&Noncentral C,数据处理函数举例,如计算,F,分布,(df1=5,df2=15),在,x=0.10,处的概率密度值,数据处理函数举例如计算F分布(df1=5,df2=15)在,数据处理函数举例,计算,F,分布,(df1=5,df2=15),在,x=0.10,处的概率密度值,选择,PDF&Noncentral PDF,函数组下的,Pdf.F(quant,df1,df2),函数,指定参数取值即可,数据处理函数举例计算F分布(df1=5,df2=15)在x,
展开阅读全文