资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,PPT,学习交流,*,SAS,软件教程,(Celon),celons,单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,SAS,过程步常用语句,proc,语句,by,语句,class,语句,var,语句,weight,语句,freq,语句,id,语句,output,语句,title,语句,options,语句,where,语句,format,语句,label,语句,1,PPT,学习交流,SAS,过程步的一般形式,PROC DATA= ,;,/,;,/,;,RUN;,2,PPT,学习交流,PROC,语句,语句格式:,proc sas,过程名,;,功能:指定所需调用的过程,以及该过程的若干选择项。,选项类型:,(,1,)关键字规定反映本过程特征,(,2,)关键字,=,值规定参数值,(,3,)关键字,=sas,数据集名设定输入输出,3,PPT,学习交流,例,1,:,PRINT,过程,显示数据集,a,的内容,用标签内容代替变量名:,proc print data=a label;,例,2,:,means,过程,计算数据集,b,中指定变量的观测个数、均值和总和:,proc means data=b n mean sum;,4,PPT,学习交流,BY,语句,by,语句指定用于分组的变量(不同于,class,语句所指定的分组变量),以便按照该变量的水平(或多个,by,变量的水平组合)将输入数据集分割成多个子数据集,从而在各个子数据集内分别执行相应的分析过程。使用,by,语句时,相应的,SAS,过程要求输入数据集已经按照,by,语句定义的变量进行排序,,by,语句中指定的变量必须为输入数据集中的一个或多个变量,可为数值型和字符型。,如果输入数据集事先并未按照,by,语句定义的变量进行排序,我们可通过以下三种方法进行处理:,(1),使用,sort,过程;(,2,)在,by,语句中设置选项:“,notsorted”,或“,descending”,,“,notsorted”,表示数据未按照,by,变量进行任何排序。若数据集事先按照,by,变量进行了升序排列,则不要设置选项;若进行了降序排列,则应该在变量名之前用“,descending”,。,5,PPT,学习交流,例,1,:下面的程序对数据集按,sex,变量值升序排列,并在同一组内按,h,降序排列,并按,sex,变量分组显示。,libname el e:saslx;,proc sort data=el.students out=el.sortstud;,by sex descending h;,run;,proc print data=el.sortstud;,by sex;,run;,6,PPT,学习交流,Class,语句,class,语句用于指定数据分析中的分组变量,每一个,class,变量的水平(变量值)或多个,class,变量的每个水平组合定义一个分组,有关全体样本和个分组内样本的相应统计量均会被计算并显示。对,means,过程的一次调用中可使用多个,class,语句,此时等同于在一个,class,语句中指定了全部的,class,变量。,7,PPT,学习交流,Var,语句,var,语句用于指定所要分析的变量,分析变量在该语句中的排列位置决定了其在输出结果中的排列位置。它的一般形式为:,var,变量,1,变量,2 ,;,8,PPT,学习交流,例,2,:下面语句按,sex,值分组对,VAR,所标识的变量进行分析,产生两个单独的描述性统计报告。,proc means data=sasuser.class;,by sex;,var weight height;,run;,9,PPT,学习交流,weight,语句,若资料已经分组,编成了变量序列,在这组数据中,各个变量值在总结果中所占的百分比称为这个变量的权重。数据的权重反映了该变量在总体中的相对重要性每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。权重的取值在不同的数据分析中方法不同。语句格式:,Weight,变量;,功能:在过程中规定一个数值变量,并以它的值作为观测的相关权重。权重值可以为大于,0,的数。,10,PPT,学习交流,freq,语句,freq,语句指定用以作为观测频数的变量,,freq,变量须为数值型变量。如果,freq,变量值为非整数,则其小数部分被截去,如果其变量值小于,1,或为缺失值,相应观测将不被用在计算统计量的过程中。统计量中的观测总数将等于,freq,变量值的合计。,11,PPT,学习交流,id,语句,id,语句指定在输出结果或输出数据集中作为行标识的变量。在输出结果或输出数据集中,行(每个分组占一行)的标识以该组中,id,变量的最大值来表示。如果在,proc means,语句中设置“,idmin”,选项,则各分组中,id,变量的最小值将被作为行表示来使用。,12,PPT,学习交流,output,语句,output,语句的功能是将分析所得的各类统计量存储到指定名称的输出数据集中。,13,PPT,学习交流,title,语句,14,PPT,学习交流,15,PPT,学习交流,16,PPT,学习交流,options,语句,Options,语句的格式:,Options option;,Options,语句将改变,SAS,系统的默认设置。由于它所做的改变在,SAS,运行期间一直起作用。,17,PPT,学习交流,where,语句,18,PPT,学习交流,format,语句,19,PPT,学习交流,label,语句,20,PPT,学习交流,此课件下载可自行编辑修改,供参考!,感谢您的支持,我们努力做得更好!,21,PPT,学习交流,
展开阅读全文