SAS基础与金融计算7

上传人:gp****x 文档编号:243137435 上传时间:2024-09-16 格式:PPT 页数:44 大小:326.50KB
返回 下载 相关 举报
SAS基础与金融计算7_第1页
第1页 / 共44页
SAS基础与金融计算7_第2页
第2页 / 共44页
SAS基础与金融计算7_第3页
第3页 / 共44页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SAS,基础与金融计算,1,本节讲授内容,SAS,图表过程,Proc chart,过程,Proc gchart,过程,2,统计图,对统计资料图形化处理就形成统计图,运用统计图形能直观地描述统计分布的特征和变量之间的关系。,统计图有多种表现形式:,1,、直方图,2,、饼图,3,、折线图,4,、曲线图,3,回顾,Proc univariate data= student,plot,;,var height ;,Run;,获得三个图,:,1,、茎叶图,2,、箱线图,3,、正态概率图,4,统计分组的相关概念,根据统计研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组,称为统计分组。,分组的性质来看:兼有分和合双重含义。,5,统计分组的步骤,1.,确定数据的全距(,R,):,R,x,max,-x,min,(即最大变量值与最小变量值之差),2.,确定组限、组距和组数,(,1,)组限分为上限和下限,上限是各组的最大变量值,下限是各组的最小变量值。,(,2,)各组上限与下限之差称为该组的组距。,(,3,)组数是指某个变量数列划分为多少个组。,说明:组数的多少与组距的大小成反比关系,组距越大,则可分的组就越少。,6,分组,应注意如下两个问题:,首先,分组时各组数量界限的确定必须能反映事物质的差别,体现量变到质变的转化。,其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限,主要解决分多少组的问题。,7,组数的确定:与组距大小成反比,以下是美国学者斯特杰斯经验公式:,n=1+3.322lgN,(,n:,组数;,N,:总体单位数),d=R/n=,(,Xmax-Xmin,),/n,(,n,为组数,,d,为组距,,R,为全距),8,根据上述公式,可以得出如下的组数参考标准:,分组组数参考表,N,15-24,25-44,45-89,90-179,180-359,n,5,6,7,8,9,上述数据仅供参考,不能生搬硬套,实际分组时要依所研究资料的性质而定。,9,SAS,制图过程,SAS,统计制图过程均可以实现对样本分布特征的图形表示,一般情况下可以使用的有,chart,过程、,plot,过程、,gchart,过程和,gplot,过程。,前两个和后两个只有一个字母“,g”,(代表,graph,)的差别,其实它们之间(只差一个字母,g,的过程之间)的统计描述功能是相同的,区别仅在于绘制出的图形的复杂和美观程度。,10,此外,还有一些较为复杂的制图命令,如运用,G3D,过程绘制曲面图,运用,GCONTOUR,过程绘制曲面对应的等高线图。,例如,我们想绘制一个二维正态分布曲面的图形,假设,(X,,,Y),服从联合正态分布,其均值都是,0,,方差分别为,1,和,a,,相关系数为,r,。,11,chart,(或,plot,)与,gchart,(或,gplot,),chart,过程和,plot,过程绘制的图形类似于我们用文本字符堆积起来的图形,只能概括地反映出资料分布的大体形状,实际上这两个过程绘制的图形并不能称之为图形,因为它没有涉及一般意义上图形的任何一种元素(如颜色、分辨率等)。,而,gchart,过程和,gplot,过程给出的是真正意义上的图形,可以用很多的语句和选项来控制图形的各方面的性质和特征。,12,Chart,(或,gchart,)与,plot,(或,gplot,),chart,和,gchart,过程可以绘制出的图形主要有条形图(包括横条和竖条)、圆图、环形图和星形图等;,plot,和,gplot,过程通常用一个记录中的两个变量值表示点的坐标来绘制图形,如散点图和线图等。,13,gchart,过程的一般格式,Proc gchart,选项列表;,图形关键词 变量名称,/,选项列表;,Run,;,此过程格式简单,复杂的地方在于图形关键字(每个图形关键字对应一种图形类型)所引导的语句,它是控制图形类型及图形要素的地方,涉及到众多的关键字和选项。,14,gchart,过程可以使用的图形关键字及其所绘制的图形类型见下表:,15,图形关键字后的变量名用以指定进行图形描述时的分组变量,可以是数值型的(此时以各组的组中值为分组的标志),也可以是字符型的。,选项列表中比较重要的有:,(,1,),type=,统计量关键字,表示图形对变量(,sumvar,所指定的变量)的哪一种统计量进行描述,比如频数(,freq,)、均数(,mean,)、总计(,sum,)、频数百分比(,percentage,)等;,16,(,2,),subgroup=,变量名(分组变量),指定要进行分组(各组内再分组)的变量;,(,3,),sumvar=,变量名(数值变量),指定要进行统计计算的变量,也就是“,type=,统计量关键字”选项中统计量的计算所依据的变量。,17,下表为长沙市某大学,160,名正常成年女子,2006,年体检资料中的血清甘油三酯的测量结果(,mmol/L,),试以直方图来表示上述资料的分布特征。,18,例,1,:单变量数据,第一步:建立数据集;,data test;,input x,;,cards;,0.91 0.881.410.961.481.460.911.10,1.26 1.691.141.240.980.680.831.77,1.49 1.021.170.990.611.330.790.95,1.05 1.651.201.240.841.400.721.06,;,Run;,双尾符,它表示为了执行下一个,input,语句,保持指针在这个输入的记录行上。,比较有加双尾符和没加双尾符的区别。,19,第二步,进行初步的统计分析,确定分组的个数。,Proc univariate data=test;,var x;,Run;,20,所有,160,个观测值中,最大的为,1.77,,最小的为,0.51,,如果以,0.1,为组距,将所有观测值归入,13,个组。,如果根据前面的斯特杰斯经验公式,则应将所有观测值归入,8,组。,The MEANS Procedure,Analysis Variable : x,N Mean Std Dev Minimum Maximum,160 1.1312 0.2945 0.5100 1.7700,21,第三步,画图。,proc gchart data=test;,vbar x/,type,=freq,levels,=13,inside,=freq,space,=0,width,=6;,run;,Vbar,语句表示我们要做的是竖立的条形图,其后跟的是作图所要依据的分类变量,这里我们以变量,x,来做直方图。斜杠后的内容是对所做条形图进行控制的选项,本段程序所涉及的各选项的含义和功能见下表。,22,各选项的含义和功能,23,Proc gchart data=test;,vbar x/,type,=freq,levels,=13,sumvar,=x,inside,=freq,space,=0,width,=6;,Run;,24,Proc gchart data=test;,vbar x/,type,=freq,levels=8,sumvar,=x,inside,=freq,space,=0,width,=6;,Run;,25,Proc gchart data=test;,vbar x/,type,=freq,levels,=13,sumvar,=x,inside=mean,space,=0,width,=6;,Run;,26,Proc gchart data=test;,vbar x/,type,=freq,levels,=13,sumvar,=x,inside,=mean,space=5,width,=6;,Run;,27,Proc gchart data=test;,vbar x/,type,=freq,levels,=13,sumvar,=x,inside,=mean,space,=0,width=9,;,Run ;,28,比较,Proc gchart,与,Proc chart;,比较,vbar,和,hbar;,Vbar,用来列出用户想要画的垂直条形图的那些变量,每个图表变量对应一张垂直条形图;,Hbar,对列出的每个图变量生成水平的条形图。,比较直方图与饼图。,29,Proc gchart data=test;,hbar,x/,type,=freq,levels,=13;,Run;,30,Proc gchart data=test;,pie,x/,type,=freq,levels,=13;,Run ;,31,Proc gchart data=test;,pie,x/,type,=mean,sumvar,=x,levels,=13;,Run ;,32,Proc gchart data=test;,pie,x/,type,=mean,sumvar,=x,levels,=5;,Run ;,33,例,2,:分组数据,下表是财政系问卷设计资料汇总,34,第一步,建立数据集;,Data score;,input subject $ sex $ num1 num2;,Cards;,;,Run;,Data score;,set score;,label,subject=,专业, sex=,性别, num1= ,人数, num2=,题量,;,Run;,35,Group,语句,Proc,gchart,;,vbar,subject/,group,=sex,sumvar,=num2,type,=,mean,;,run,;,Num2,表示题量。,上述语句意思是:先按性别分两组,接着在每组中按专业进一步分三组,最后再将每组设计的题量的平均数列示出来。,36,Proc,gchart,;,vbar,subject/,group,=sex,type,=,freq,;,run,;,Num2,表示题量。,上述语句意思是:先按性别分组,接着在每组中按专业进一步分组,最后再将每组包含的单位数列示出来。,37,Proc,gchart,;,vbar,sex/,group,=subject,sumvar,=num2,type,=,mean,;,run,;,Num2,表示题量。,上述语句意思是:先按专业分三组,接着在每组中按性别分别分两组,最后再将每组设计的题量的平均数列示出来。,38,By,语句,Proc,gchart,;,vbar,subject/,sumvar,=num2,type,=,mean,;,by,sex;,run,;,上述语句将得到由,by,变量定义的几个观测组分别画出的图表。,39,Subgroup,语句,Proc,gchart,;,vbar,sex/,subgroup,=subject,type,=freq ;,run,;,上述语句意思是:先按性别分两组,接着在每组中按专业进一步分三组,最后再将每组包含的单位数列示出来。,40,Proc,gchart,;,vbar,subject/,subgroup,=sex,type,=freq ;,run,;,上述语句意思是:先按专业分三组,接着在每组中按专业进一步分两组,最后再将每组包含的单位数列示出来。,41,Block,语句,该语名列出用户想要画的块形图的变量。,Proc,gchart,;,block,sex/,group,=subject,sumvar,=num2,type,=mean ;,run,;,42,Proc,gchart,;,block,subject/,group,=sex,sumvar,=num2,type,=mean ;,run,;,43,期中作业,对交易数据制图,要求:,(,1,)根据个人分析需要,选择适当的图形,并附以文字进行说明;,(,2,)图型类型要包含茎叶图、箱线图、直方图、饼图中至少两种;,(,3,)以,word,文档提交,文档中至少要出现,6,幅图;,(,4,)提交到,信箱(注明姓名学号)。,44,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!