SAS第讲分析家模块数据管理功能实用教案

上传人:莉**** 文档编号:78255656 上传时间:2022-04-21 格式:PPTX 页数:97 大小:1.80MB
返回 下载 相关 举报
SAS第讲分析家模块数据管理功能实用教案_第1页
第1页 / 共97页
SAS第讲分析家模块数据管理功能实用教案_第2页
第2页 / 共97页
SAS第讲分析家模块数据管理功能实用教案_第3页
第3页 / 共97页
点击查看更多>>
资源描述
1“分析家分析家”的数据管理功能的数据管理功能(gngnng)目录目录 1. Analyst入门 2. 数据(shj)操作 3. 数据(shj)变换 4. 合并数据(shj)表 5. 数据(shj)的转置及堆叠和折分 6.* 生成图形和统计分析功能第1页/共96页第一页,共97页。2“分析家分析家”简介简介(jin ji)分析家(Analyst)是为了完成基本统计分析而设计的一个菜单系统;它是用图形界面来调用SAS功能的一个模块.用户通过选择菜单系统的不同菜单项可完成数据管理,各种基本的分析功能和绘图功能.在所选择的菜单项完成每项任务后,立即显示相应的结果(ji gu);因分析家是通过数据步编程和调用SAS过程联合完成的,故所用的SAS程序可以显示在一个单独窗口供我们学习使用;每项任务完成后所保留的SAS程序,有关的图形和结果(ji gu),在分析的过程中随时可以调出显示.第2页/共96页第二页,共97页。3“分析家分析家”简介简介(jin ji)分析家分析家(ANALYST)的功的功能能1. 从菜单栏目的文件(File),编辑(Edit),查看(View)和数据(Data)下可完成数据管理功能;包括数据的筛选,数据的变换和转置等. 2. 图形(Graphs)栏目下是图形功能,包括直方图,盒须图,饼图,等高线图,二维或三维散点图和曲面图等. 3. 报表(Report)栏目支持PRINT过程的列表(li bio)和TABULATE过程的汇总报表.第3页/共96页第三页,共97页。4“分析家分析家”简介简介(jin ji)分析家分析家(ANALYST)的功的功能能 4. 统计(Statistics)栏目下是主要的统计分析功能,包括描述统计,列联表分析,假设检验,方差分析(含线性模型和混合模型等),回归分析,多变量分析(主成分和典型相关),生存分析及功效与样本量大小. 5. 工具(Tools)栏目可对图形(txng)查看器等的设置进行修改. 6. 窗口(Wondows)栏目可切换窗口,改变窗口的显示方式等.第4页/共96页第四页,共97页。5 Analyst 入门入门启动启动(qdng)Analyst(分析家分析家)的方法的方法(1) 键入( jin r)命令ANALYST (2) 用下拉菜单用下拉菜单 解决方案解决方案(Solutions) 分析分析(fnx)(Analysis) 分析分析(fnx)家家( Analyst) (3) 启动启动SAS系统时系统时(从从“开始开始” “运运行行”打开打开)加上选项加上选项(-initcmd analyst ):“d:sas82sas.exe” -initcmd analyst第5页/共96页第五页,共97页。第6页/共96页第六页,共97页。第7页/共96页第七页,共97页。8 Analyst 入门入门(r mn)启动启动(qdng)分析家分析家(Analyst)后的界面后的界面第8页/共96页第八页,共97页。9 Analyst 入门入门(r mn) 进入分析家窗口后,系统自动生成一个新的进入分析家窗口后,系统自动生成一个新的分析项目。分析家窗口分为左右两部分:左边为分析项目。分析家窗口分为左右两部分:左边为项目管理,用树状目录显示打开的数据及其对其项目管理,用树状目录显示打开的数据及其对其所进行的分析;右边所进行的分析;右边(yu bian)(yu bian)显示数据。该项显示数据。该项分析所生成的输出结果的名字将列在项目管理的分析所生成的输出结果的名字将列在项目管理的树状目录中,而输出的结果或图形将在单独的窗树状目录中,而输出的结果或图形将在单独的窗口里显示。口里显示。第9页/共96页第九页,共97页。10 Analyst入门入门(r mn)Analyst的主菜单的主菜单(Menus)文件文件(File) - 新建新建,打开和存贮文件打开和存贮文件,项目项目和数和数 据集据集,及打印报表及打印报表.(2) 编辑编辑(Edit) -转换浏览和编辑的模式转换浏览和编辑的模式,并可并可 添加添加,拷贝和删除列拷贝和删除列和行和行.(3) 查看查看(View) -可以移动、隐藏列可以移动、隐藏列,还还可修改可修改 数据表的属性数据表的属性.(4) 工具工具(Tools) -定制输出标题定制输出标题,画图画图(hu t)选项等选项等(5) 数据数据(Data) -对用户的数据筛选子集对用户的数据筛选子集,排序排序, 概括概括,串接和合并及进串接和合并及进行计算行计算, 数据变换和转置数据变换和转置. 第10页/共96页第十页,共97页。11 Analyst入门入门(r mn)Analyst的主菜单的主菜单(Menus)(6) 报表(Reports)-产生报告,列出观测等(7) 图形(Graphs)-生成图表,图形和直方 图等.(8) 统计(Statistics)-选择统计分析及使用 索引搜寻任务和统计量.(9) 窗口(Window)-切换到其他窗口.(10)帮助(Help)-显示Analyst和SAS系统(xtng) 的帮助信息 . 第11页/共96页第十一页,共97页。12 Analyst 入门入门(r mn)Analyst的工具条的工具条(Toolbar) Analyst的工具条包括16个图标(如产生新表,打开文件,存贮当前的表,打印数据表,预浏览,对数据表排序,取子集,计算新列,生成汇总报表,生成直方图,生成二维散点图,计算汇总统计量,计算相关系数,进行单因子方差分析,进行回归分析,帮助(bngzh) . 用户还可以定义其它工具条图标: 选菜单项工具(Tools)从下拉菜单选定制 (Customize)=进入定制工具对话窗口=建立图标.第12页/共96页第十二页,共97页。13 Analyst入门入门(r mn)Analyst的工具条的工具条(Toolbar) 新建一个新表 产生汇总报表 打开一个SAS文件 产生一个直方图 保存当前表格 产生一个散点图 打印数据(shj)表 计算汇总统计量 打印预览 计算相关系数 对表格进行排序 执行单向方差分析 对数据(shj)取子集 执行线性回归 由计算得到新列 分析家帮助第13页/共96页第十三页,共97页。14 Analyst 入门入门(r mn)Analyst的索引的索引(Index) 使用索引来访问经常使用的一些统计任使用索引来访问经常使用的一些统计任务和绘图任务务和绘图任务. 例如以下任务例如以下任务: Brown-Forsythe test, Bar chart horizontal, One-Way ANOVA,N-Way ANOVA, Pie chart 等等等等 从按字母顺序的任务列表中选择从按字母顺序的任务列表中选择(xunz)某项任务后某项任务后=OK,则进入完成该任务的窗则进入完成该任务的窗口口.(在你不记得在哪个菜单中可以找到你想(在你不记得在哪个菜单中可以找到你想要的要的过程的时候,可以到过程的时候,可以到Index中来寻找)中来寻找)第14页/共96页第十四页,共97页。15 Analyst 入门入门(r mn)Analyst的项目的项目(Project) 一个项目就是在一个或几个数据集上分一个项目就是在一个或几个数据集上分析的一些结果析的一些结果.一个项目用项目树显示一个项目用项目树显示,该树该树包含不同的数据表包含不同的数据表,报表报表,程序码程序码,以及同该以及同该项目有联系的其它结果的目录项目有联系的其它结果的目录.这些这些(zhxi)结果在项目树里呈现为一些分枝结果在项目树里呈现为一些分枝. 通过点击加号通过点击加号(+)或减号或减号(-)来打开或关闭来打开或关闭一个目录一个目录.通过点击某个分枝可以浏览目录通过点击某个分枝可以浏览目录中的这个分枝中的这个分枝.如果分枝是一张数据表如果分枝是一张数据表,可以可以浏览这张表浏览这张表,也可以打开这张表并进行分析也可以打开这张表并进行分析.还可以从下拉菜单选择还可以从下拉菜单选择Interactive Analysis来启动来启动SAS/INSIGHT并进行探索数据分析并进行探索数据分析. 从从File菜单选择菜单选择 Projects,用户可以创建用户可以创建,打打开开,存贮或删除这个分析项目存贮或删除这个分析项目(V8).第15页/共96页第十五页,共97页。16 Analyst 入门入门浏览和存贮浏览和存贮(cn zh)程序码功能程序码功能 用户在用户在Analyst里对数据进行任何统计里对数据进行任何统计分析和绘图任务分析和绘图任务(rn wu)后后,都可以浏览都可以浏览和存贮程序码和存贮程序码.这些源程序可以拷贝到编这些源程序可以拷贝到编辑窗进行编辑辑窗进行编辑,然后再提交系统执行然后再提交系统执行.第16页/共96页第十六页,共97页。17 Analyst 入门入门在多个在多个(du )窗口浏览窗口浏览结果结果 可以对一个或几个数据表进行分析可以对一个或几个数据表进行分析,并在多个并在多个(du )窗口同时浏览结果窗口同时浏览结果. 若双击在项目树的某项结果上若双击在项目树的某项结果上,则在单个窗口浏览这则在单个窗口浏览这个结果个结果.在相同的结果上还可以打开一个新的窗口来浏览在相同的结果上还可以打开一个新的窗口来浏览这个结果这个结果.第17页/共96页第十七页,共97页。18 Analyst 入门入门存贮存贮(cn zh)任务选项任务选项功能功能 通过在任务对话窗里双击通过在任务对话窗里双击 Save Options来存贮同这来存贮同这项任务有关项任务有关(yugun)的选项的选项. 以后当用户点击以后当用户点击Reset纽纽时时,这些选项将用来作为用户的缺省选项这些选项将用来作为用户的缺省选项.第18页/共96页第十八页,共97页。19 Analyst 入门入门存贮文本存贮文本(wnbn)和绘图和绘图结果结果 可把程序码及分析和绘图的结果存为可把程序码及分析和绘图的结果存为文件文件. 选中项目树中的某个分枝选中项目树中的某个分枝,并从下拉菜并从下拉菜单选择单选择(xunz)另存为另存为 (Save as) 来存贮来存贮程序码和结果程序码和结果.然后指定文件名并选择然后指定文件名并选择(xunz)一种文件类型一种文件类型.对于绘图结果对于绘图结果,可可用用GIF,JPEG等格式来存贮等格式来存贮.第19页/共96页第十九页,共97页。20Analyst 入门入门定制定制(dn zh)用户的会用户的会话功能话功能 通过从工具通过从工具(Tools)菜单项菜单项=选择查看器设置选择查看器设置(Viewer Settings),=并设置浏览器的特性并设置浏览器的特性(txng)来定制用户的分来定制用户的分析会话析会话. 选择图形设置选择图形设置(Graph Settings),并设置绘图的特性并设置绘图的特性(txng).全局选项全局选项,用户在某项任务中规定的设置用户在某项任务中规定的设置,这时都这时都将被覆盖将被覆盖.第20页/共96页第二十页,共97页。21 数据数据(shj)操作操作打开数据打开数据(shj)集集 A n a l y s t 的 数 据 表 显 示 来 自 ( l i z ) S A S 数据 集 , S A S 视 窗 和 其 它 数 据 源 ( 如 文 本文 件 , E x c e l 电 子 表 , S P S S 文 件 ) 的 数据 . 从 文 件 ( F i l e s ) 菜 单 可 以 创 建 新数 据 表 , 打 开 S A S 数 据 集 及 浏 览 , 打 开非 S A S 文 件 ( V 8 ) .第21页/共96页第二十一页,共97页。22数据操作数据操作(cozu)打开数据集打开数据集从文件(从文件(Files) 打开打开 将进入以下将进入以下(yxi)窗口:窗口:用户可以选择将要用户可以选择将要(jingyo)(jingyo)打开的数据打开的数据文件的类型文件的类型第22页/共96页第二十二页,共97页。23数据数据(shj)操作操作打开数据打开数据(shj)集集 如果打开如果打开(d ki)的数据为的数据为SAS数据集数据集,则常通过则常通过从从 文件(文件(Files) 用用A名称打开名称打开(d ki) 在弹出的选择成员窗口中从某个逻辑库中选择将在弹出的选择成员窗口中从某个逻辑库中选择将被打开被打开(d ki)的的SAS 数据集名字数据集名字(比如从比如从SASUSER库中选择数据集库中选择数据集 CLASS).第23页/共96页第二十三页,共97页。24数据操作数据操作数据集的浏览数据集的浏览(li ln)与编辑模式与编辑模式 在分析时当打开一个文件或在分析时当打开一个文件或SASSAS库的成员时库的成员时 , ,数据被转换为数据表数据被转换为数据表. .在此可浏览在此可浏览, ,编辑及整编辑及整 理数据表的行和列理数据表的行和列. . 数据表被打开的模式可以是浏览数据表被打开的模式可以是浏览, ,编辑和编辑和 共享编辑三种共享编辑三种(sn zhn)(sn zhn)模式之一模式之一( (类似于类似于VTVT界面界面).). 由由 编辑编辑(Edit) = (Edit) = 模式模式(Model)(Model) = = 可以从浏览可以从浏览, ,编辑和共享编辑编辑和共享编辑 三种三种(sn zhn)(sn zhn)模式中任选一种模式中任选一种. . 第24页/共96页第二十四页,共97页。25数据数据(shj)操作操作对列的操作对列的操作 在数据表中可以对列或行进行在数据表中可以对列或行进行操作操作. .如移动列如移动列, ,插入插入(ch r)(ch r)列列, ,拷贝列或删除列拷贝列或删除列, ,隐藏列隐藏列, ,固定列固定列; ;添加行或删除行添加行或删除行, ,按变量的值对行按变量的值对行排序排序; ;以及浏览变量名或列标签以及浏览变量名或列标签. .第25页/共96页第二十五页,共97页。26数据操作数据操作对列的操作对列的操作-在浏览在浏览(或编辑(或编辑(binj))模)模式下式下 1. 改变列的显示顺序 由查看(View) = 列(Columns) = 移动(Move) 在出现的Move Columns( 移动列)对话窗口选中想移动的变量按箭头方向上下随意移动来改变列的显示次序(cx). 也可以先选中某列(该列加亮),然后点鼠标右键,在弹出的菜单项中选 Move来改变列的显示顺序。 以下介绍的其它列操作也可用类似的方法。 第26页/共96页第二十六页,共97页。27数据数据(shj)操作操作对列的操作对列的操作-在浏览在浏览(或编辑)模式下(或编辑)模式下 2. 隐藏一些列不显示 由查看(View) =列(Columns) = 隐藏(Hide ) 在出现(chxin)的Hide Columns(隐藏列)对话窗口选中想 隐藏起来不显示的变量放到Hide框里,然后按OK 可以让所选中的几列不显示。 若由查看(View) =列(Columns) = 取消隐藏 (Hide ) 又可以把已被隐藏不显示的列重新显示在数据表中。第27页/共96页第二十七页,共97页。28数据数据(shj)操作操作对列的操作对列的操作-在浏览在浏览(或编辑)模式下(或编辑)模式下 3. 固定几列在表的前面不随游标而左右移动 由查看(View) =列(Columns) = 保持(boch)(Hold) 可以固定选中的几列总保持(boch)在表的左边位置显示. 4. 用列标签显示用列标签显示 由查看由查看(View) =列列(Columns) = 标签标签(Lables) 要求要求(yoqi)用变量(列)的标签显示数据表。用变量(列)的标签显示数据表。第28页/共96页第二十八页,共97页。29数据数据(shj)操作操作对列的操作对列的操作-在编辑模在编辑模式下编辑数据式下编辑数据(shj) 1. 插入新变量(列): 由 编辑(binj)(Edit) = 插入列(Insert Column) = 选字符型(Character)或数值型 (Numeric), 即可在数据表的最右边或选中变量(列)的左边插入新 变量.2. 拷贝选中的一列或几列拷贝选中的一列或几列 首先选中数据表中要复制的几个列,然后首先选中数据表中要复制的几个列,然后(rnhu) 由由 编辑(编辑(Edit)= 复制(复制(Duplicate)把它们复制到所选中列的面前把它们复制到所选中列的面前.第29页/共96页第二十九页,共97页。30数据操作数据操作对列的操作对列的操作-在编辑在编辑(binj)模式下编辑模式下编辑(binj)数据数据 3. 删除选中的一列或几列 首先选中数据表中要删除的某个列或几个(j )列,然后 由编辑(Edit) = 删除 (Delete)可删除选中的列.第30页/共96页第三十页,共97页。31数据操作数据操作(cozu)对行的操作对行的操作(cozu)-在编辑模式下编辑数据在编辑模式下编辑数据 在分析家窗口将光标置于打开数据表的某一行序号上并点击右键,就表示(biosh)选中该行,同时在弹出菜单中也显示了可对这一行进行的操作: Add在数据表的最后加入一新行; Duplicate将该行复制到数据表的最后一行; Delete-删除选中的行.第31页/共96页第三十一页,共97页。32数据操作数据操作(cozu)对行的操作对行的操作(cozu)-在编辑模式下编辑数据在编辑模式下编辑数据 或者先选中某行,然后 由编辑(Edit) = 删除 (Delete) 则系统(xtng)在询问对话框得到肯定后立即将把这一行 从数据表中删除; 或由编辑(Edit) =复制(Duplicate) 则将选中的行复制到数据表的最后一行. 由编辑(Edit) = 添加行 (Add row) 则在数据表的最后加入一新行. 第32页/共96页第三十二页,共97页。33数据数据(shj)操作操作存贮数据存贮数据(shj) 可以可以(ky)(ky)存贮数据表中的数据为存贮数据表中的数据为SASSAS支持的任何支持的任何 格式格式, ,包括包括SASSAS数据集数据集, ,文本文件文本文件,Excel,Excel和和LotusLotus文件文件. . 由由 文件文件(File)=(File)=保存保存(Save),(Save),可存贮修改后可存贮修改后 的数据集的数据集; ; 由文件由文件(File)=(File)=另存为另存为(Save as),(Save as),可存贮当可存贮当 前数据表为非前数据表为非SASSAS格式或存为其它格式或存为其它SASSAS数据集数据集. . 由文件由文件(File)=(File)=用用SASSAS名称另存为名称另存为(Save as (Save as SAS name),SAS name),可存贮当前数据表为所选择的可存贮当前数据表为所选择的SASSAS 库中的库中的SASSAS数据集数据集. . 第33页/共96页第三十三页,共97页。34 数据数据(shj)操作操作筛选数据筛选数据(shj) 由 数据(Data) =过滤(Filter), 然后选择取数据子集(Subset data) ,并对数据集应用 Where条件(如SEX=M) 来浏览数据集的子集. 若要保存,可 选 文件 = 另存为 SAS . (比如(br)找出所有男生的观测) 第34页/共96页第三十四页,共97页。35 数据操作数据操作排序对话窗排序对话窗(编辑编辑(binj)模式模式) 由 数据(Data)=排序(pi x)(Sort),候选的变量列表中选择用于排序(pi x)的变量;如选中的变量不只一个,对Sort by列表可用向上或向下的箭头规定排序(pi x)变量的顺序;选中一变量后,还可规定按上升或下降的次序排序(pi x).第35页/共96页第三十五页,共97页。36数据操作数据操作产生某些分布产生某些分布(fnb)的的随机变量随机变量(编辑模式编辑模式) 由 数据(Data)=随机变量 (Random Variates),可生成基于某个(mu )分布的随机变量.分布包括正态分布,均匀分布,二项分布,泊松分布,指数分布,伽码分布,几何分布,极值分布. 第36页/共96页第三十六页,共97页。37数据数据(shj)操作操作分组概括数据分组概括数据(shj)由 数据(Data)=按组汇总 (Summarize by Group) ,可对数据表里(bio l)的观测按分组变量所分成的几个组分别计算概 括统计量.第37页/共96页第三十七页,共97页。38数据操作数据操作(cozu)产生随机样本产生随机样本 由数据( Data)=随机抽样 (Random Sample),可由原数据表生成用户指定样本个数为n(或抽取的比例(bl)的随机样本. 第38页/共96页第三十八页,共97页。39数据操作数据操作(cozu)生成汇总报表生成汇总报表 由 报表 (Report)= 数据列表(List Data),可用列表方式显示(xinsh)数据表里数据(可选择id变量,列表变量等). 由报表(bobio)(Report)=表.(Tables) ,可用汇总报表(bobio)的方式生成五种形式的报表(bobio). 第39页/共96页第三十九页,共97页。40 数据操作数据操作生成汇总生成汇总(huzng)报表报表选择选择(xunz)(xunz)菜单项报表菜单项报表(Reports)=(Reports)=表表.(Tables),.(Tables),再选择再选择(xunz)(xunz)一一种表格形种表格形式进行设式进行设置置. .如选择如选择(xunz)(xunz)表格表格(5)(5)(1 1)(2 2)(3 3)(4 4)(5 5)第40页/共96页第四十页,共97页。41 数据操作数据操作生成汇总生成汇总(huzng)报表报表Summary标签下汇总了变量的选择第41页/共96页第四十一页,共97页。42 数据操作数据操作生成生成(shn chn)汇总汇总报表报表Options按键可打开设置附加选项的窗口TotalTotalTotalTotal第42页/共96页第四十二页,共97页。43数据数据(shj)变换变换在编辑模式下在编辑模式下1. 计算(j sun)新变量 由 数据(Data) = 变换(Transform) = 计算(j sun)(Compute),将显示计算(j sun)对话窗,利用这个窗口来规定关系式,公式或表达式,以便在数据表中生成新的变量(列). 第43页/共96页第四十三页,共97页。44数据数据(shj)变换变换在编辑模式下在编辑模式下2. 求秩(Rank) 由数据(Data)=变换(Transform)=求秩(Rank),将显示求秩对话框,利用这个窗口来变量(binling)(列)的秩(包括简单秩等).3. 对变量标准化对变量标准化 (Standardize) 由数据由数据(Data) =变换变换(Transform) =标准化标准化(Standardize) ,将显示变量标准化对话窗将显示变量标准化对话窗,利用利用(lyng)这个窗口这个窗口可以将变量可以将变量(列列)标准化标准化.第44页/共96页第四十四页,共97页。45数据变换数据变换(binhun)在编辑模式下在编辑模式下 4. 重新定义记录(jl)的值(Recode Values) 由 数据(Data)=变换(Transform)=记录(jl)值(Recode Values),将显示重新定义记录(jl)值的对话窗,利用这个窗口可以对某一个列重新赋值5. 重新定义记录的范围重新定义记录的范围(Recode Range) 由数据由数据(Data)=变换变换(Transform)=记录范围记录范围(Recode Range),将显示重新定义记录范围的对话将显示重新定义记录范围的对话窗窗,利用这个利用这个(zh ge)窗口可以对某一个列按照一定的区窗口可以对某一个列按照一定的区域重新赋值域重新赋值.第45页/共96页第四十五页,共97页。46数据数据(shj)变换变换在编辑模式下在编辑模式下6. 转换变量类型(Convert Type.) 由 数据(Data)=变换( Transform)= 转换类型(Convert Type.),将显示(xinsh)转换变量类型对话窗,利用这个窗口来指定将转换的变量(把数值型转换为字符型,或反之).7. 计算对数计算对数(du sh)(Log(Y) :先选中一数先选中一数值变量,值变量, 由数据由数据(Data)=变换变换( Transform)= Log(Y),对该变量进行对数对该变量进行对数(du sh)变换,变换,并得到新的变量。并得到新的变量。第46页/共96页第四十六页,共97页。47数据变换数据变换(binhun)在编辑模式下在编辑模式下8. 计算平方根 (Sqrt(Y): 先选中一数值(shz)变量,由 数据(Data)=变换( Transform)= Sqrt(Y),对该变量进行求平方根变换,并得到新的变量。 9. 计算倒数计算倒数(1/Y) :先选中一数值变量,先选中一数值变量, 由数据由数据(Data)=变换变换(Transform)= 1/Y,对该变量进行对该变量进行(jnxng)求倒数变换,并得求倒数变换,并得到新的变量。到新的变量。第47页/共96页第四十七页,共97页。48数据变换数据变换在编辑在编辑(binj)模式下模式下 10. 计算平方(Y*Y) :先选中一数值变量(binling), 由数据(Data)=变换(Transform) = Y*Y, 对该变量(binling)进行求平方变换,并得到新的变量(binling).11. 计算指数计算指数(Exp(Y) :先选中一数值变量先选中一数值变量(binling), 由数据由数据(Data)=变换变换(Transform)= Exp(Y) ,对该变量对该变量(binling)进行求指数变换,并得到新的进行求指数变换,并得到新的变量变量(binling)。第48页/共96页第四十八页,共97页。49合并合并(hbng)数据表数据表 合并数据表功能是版本8新增加的功能. 可按列来合并数据表,或者(huzh)按行连接数据表.(1)由数据 (Data)=合并表(Combine Tables) =按列合并(Merge by Columns) 可将指定的几个数据表由By变量匹配合并.(2)由数据(Data) =合并表(Combine Tables) =按行合并(Concatenate by Rows) 可将指定的几个数据表按行串接成新数据表.第49页/共96页第四十九页,共97页。50合并合并(hbng)数据表数据表AB AB AB合并合并(hbng)表表数据数据(shj)(shj)串接串接SAS SAS 数据集数据集SAS SAS 数据集数据集数据并接数据并接第50页/共96页第五十页,共97页。51合并数据合并数据(shj)表表串接串接SAS数据数据(shj)集集-简简单连接单连接NUM VARA 1 A1 2 A2 5 A3串接(Concantenate)A:B:NUM VARA VARB 1 A1 2 A2 5 A3 3 B1 4 B2 6 B3 COMBINE:NUM VARB 3 B1 4 B2 6 B3把第二个数据集把第二个数据集B B的的观测串接在第一个观测串接在第一个数据集数据集A A的所有的所有(suyu)(suyu)观测后面观测后面第51页/共96页第五十一页,共97页。52NUM VARB 3 B1 4 B2 6 B3合并合并(hbng)数据表数据表串接串接SAS数据集数据集-插入式连插入式连接接NUM VARA 1 A1 2 A2 5 A3串接(Interleave)A:B:NUM VARA VARB 1 A1 2 A2 3 B1 4 B2 5 A3 6 B3 COMBINE:按两个数据集按两个数据集A A和和B B的共同变量的共同变量NUMNUM的值排次序的值排次序(cx)(cx)后串接在后串接在一起一起(analyst41.sas(analyst41.sas) )第52页/共96页第五十二页,共97页。53 合并合并(hbng)数据表数据表串接串接SAS数据集数据集 在Analyst环境下要串接 数据集可在下拉菜单选: (1) 数据(Data)合并(hbng)表( Combine Tables) 按行连接( Concatenate by Rows)选要串接的数据集选要串接的数据集选选byby变量变量 (2) 选要串接的数据集选要串接的数据集(3)指定是简单指定是简单(jindn)连接还连接还是插入式连接是插入式连接(4) 选择串接的变量名选择串接的变量名第53页/共96页第五十三页,共97页。54 合并合并(hbng)数据表数据表并接并接SAS数据集数据集-匹配合匹配合并并(hbng) NUM VARA 1 A1 2 A2 3 A3NUM VARB 1 B1 2 B2 4 B3并接(Match Merge)C:D:NUM VARA VARB 1 A1 B1 2 A2 B2 3 A3 4 B3COMBINE:按两个数据集按两个数据集C C和和D D的的共同变量共同变量NUMNUM的相同的相同(xin tn)(xin tn)值匹配值匹配合并合并. . (analyst42.sas)(analyst42.sas)第54页/共96页第五十四页,共97页。55合并合并(hbng)数据表数据表并接并接SAS数据集数据集 在Analyst环境(hunjng)下要并接数据集可在下拉菜单选: (1)数据(Data)合并表( CombineTables) 按列合并Merge by Columns 选选byby变量变量选并接数据集选并接数据集(2)选并接的数据集选并接的数据集(3)指定并接的方式指定并接的方式(有三有三种种:见右边屏幕见右边屏幕(pngm)的中间的中间)(4) 选选by变量变量(5) 选择并接的变量名选择并接的变量名第55页/共96页第五十五页,共97页。56数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分转置数据转置数据(shj)集集 当希望把数据表中的某些列变为行,行变为列 时,可用此项功能(gngnng).在浏览模式下, 由 数据(Data)=转置(Transpose), 则显示转置对话窗,在这里可以规定将被转置 的一些(变量)列(Transpose)名字;还可以规定 一个变量(Group by),用于转置时按该变量的不 定,记录源变量名的列名也可以规定,当然也可 以用缺省名字.第56页/共96页第五十六页,共97页。57数据的转置数据的转置(zhun zh)及堆及堆叠和拆分叠和拆分转置转置(zhun zh)数据集例数据集例1 例例1 1:SASSAS数据集数据集produprodu中包含三中包含三种产品从种产品从20022002年年1 1月开始共月开始共1515个月的个月的销售数据,即三个观测销售数据,即三个观测1616个变量(个变量(3 3行行1616列)的列)的SASSAS数据集,其中数据集,其中(qzhng)(qzhng)变量变量LIMELIME记录产品号。为记录产品号。为了分析三种产品的销售量如何随时了分析三种产品的销售量如何随时间而变化的规律,首先应把该数据间而变化的规律,首先应把该数据集转化为集转化为3 3个变量(即三种产品)个变量(即三种产品)1515个观测(即个观测(即1515个月份的销售量)的个月份的销售量)的数据数据; ;在转化后的数据集中还要求加在转化后的数据集中还要求加上日期变量上日期变量DATEDATE。(analyst51.sas)第57页/共96页第五十七页,共97页。58数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分转置数据转置数据(shj)集集-例例1转置(zhun zh)数据数据(shj)(shj)集集ProduProduAnalyst: 数据(Data) 转置(Transpose)第58页/共96页第五十八页,共97页。59数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤1.1.启动启动“分析家分析家”,”,并打开数据集并打开数据集ProduProdu;2.2.选选 数据数据(Data) (Data) 转置转置(Transpose)(Transpose);3. 3. 在转置窗口下,在转置窗口下, 选中想要转置的变量选中想要转置的变量(binling)(binling)(这里是(这里是t1t15t1t15),然后点击),然后点击Transpose,Transpose,即把选中的变量即把选中的变量(binling)(binling)送到送到TransposeTranspose窗口内;窗口内; 规定转置后列变量规定转置后列变量(binling)(binling)的名字,如的名字,如规定列变量规定列变量(binling)(binling)名的前缀为名的前缀为PRODU,PRODU,缺省时缺省时前缀名字为前缀名字为COL;COL; 规定存放转置后源变量规定存放转置后源变量(binling)(binling)的列名的列名字,缺省时名字为字,缺省时名字为_SOURSE_SOURSE_; 按按OKOK键键. .第59页/共96页第五十九页,共97页。60数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤4. 4. 存贮转置后的数据为一新的存贮转置后的数据为一新的SASSAS数据集数据集 文件文件(File)=(File)=用用SASSAS名字名字(mng zi)(mng zi)另存为另存为=选选择逻辑库择逻辑库, ,并规定数据集的名字并规定数据集的名字(mng zi)(mng zi)(如如Product)Product)后按保存键后按保存键. .5. 5. 加工数据集加工数据集Product;Product; 因转置后生成的数据集没有日期变量因转置后生成的数据集没有日期变量Date,Date,以下以下步骤就是用来增加一个日期变量步骤就是用来增加一个日期变量. . 打开刚生成的打开刚生成的SASSAS数据集数据集Product,Product,并转换为并转换为编辑模式编辑模式; ; 选数据选数据(Data) (Data) 变换变换(Transform)(Transform) 计算计算(Compute)(Compute)在以下出现的在以下出现的Compute:ProductCompute:Product窗口做以下的选择窗口做以下的选择: :第60页/共96页第六十页,共97页。61数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分转置数据转置数据(shj)集的具体步骤集的具体步骤( (计算公式由计算公式由SASSAS日期时间日期时间(shjin)(shjin)函数给出函数给出) )第61页/共96页第六十一页,共97页。62数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤选择正确后,按OK键,则在数据表窗口变量列后面生成新变量Date,但此时该变量的值为日期时间相应的数值. 选中变量Date,点右键,在弹出的子菜单中选Properties,然后在出现的列属性Column Properties对话框中修改输出格式(g shi)为Format:MONYY7.;按OK键. 变量_SOURSE_在这里没有用,可以删除. 把符合要求的数据表存为SAS数据集(如仍用名字Product).第62页/共96页第六十二页,共97页。63数据的转置数据的转置(zhun zh)及堆及堆叠和拆分转置叠和拆分转置(zhun zh)数数据集据集-例例2 例例2 2:SASSAS数据集数据集transtrans中包含某企业中包含某企业从从19811981年至年至19951995年的销售资料年的销售资料(zlio).(zlio).该数据集的每个观测记录年该数据集的每个观测记录年度及该年度及该年1212个月的销售量个月的销售量, ,共有共有1515行行1313列列. .为了分析该企业月销售量如何随时为了分析该企业月销售量如何随时间而变化的规律,请把该数据集转化间而变化的规律,请把该数据集转化为为2 2个变量(个变量(DATEDATE和和SALESSALES)180180个观测个观测(即(即1515年年1212个月)的数据个月)的数据. .(analyst52.sas)第63页/共96页第六十三页,共97页。64数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集数据集-例例2按年转置(zhun zh)并加日期第64页/共96页第六十四页,共97页。65数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分转置数据转置数据(shj)集的具体步骤集的具体步骤1.1.启动启动“分析家分析家”,”,并打开数据集并打开数据集transtrans;数据数据(Data) (Data) 转置转置(Transpose)(Transpose);3. 3. 在转置窗口下,在转置窗口下, 选中想要转置的变量(这里是选中想要转置的变量(这里是jandecjandec),然),然后后(rnhu)(rnhu)点击点击Transpose,Transpose,即把选中的变量送到即把选中的变量送到TransposeTranspose窗口内;窗口内; 选选Group byGroup by变量(这里是变量(这里是YEARYEAR),然后),然后(rnhu)(rnhu)点击点击 Group by, Group by,即把选中的变量送到即把选中的变量送到Group byGroup by窗口内;窗口内; 规定转置后列变量的名字规定转置后列变量的名字, ,如规定列变量的前如规定列变量的前缀名为缀名为SALESSALES; 规定转置后源变量的列名字,缺省时名字为规定转置后源变量的列名字,缺省时名字为_SOURSE_SOURSE_; 按按OKOK键键. .第65页/共96页第六十五页,共97页。66数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤第66页/共96页第六十六页,共97页。67数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤4. 4. 存贮按年转置后的数据为一新的存贮按年转置后的数据为一新的SASSAS数据集数据集 文件文件(File)=(File)=用用SASSAS名字另存为名字另存为=选择选择(xunz)(xunz)逻辑库逻辑库, ,并规定数据集的名字并规定数据集的名字( (如如Trans1)Trans1)后按保存键后按保存键. .5. 5. 加工数据集加工数据集Trans1;Trans1; 因转置后生成的数据集没有日期变量因转置后生成的数据集没有日期变量Date,Date,以下步骤就是用来增加一个日期变量以下步骤就是用来增加一个日期变量. . 打开刚生成的打开刚生成的SASSAS数据集数据集Trans1,Trans1,并转为并转为编辑模编辑模式式; ; 选数据选数据(Data) (Data) 变换变换(Transform)(Transform) 计计算算(Compute)(Compute)在在Compute:ProductCompute:Product窗口选择窗口选择(xunz)(xunz)合适的合适的日期时间函数日期时间函数, ,给出的计算公式给出的计算公式, ,并计算出并计算出DATEDATE的数值的数值. .第67页/共96页第六十七页,共97页。68数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分转置转置(zhun zh)数据集的具体步骤数据集的具体步骤 选中变量Date,点右键,在弹出的下拉菜单中选Properties,然后在出现的列属性Column Properties对话框中修改输出格式为Format:YYMMDD8.;按OK键. 变量_SOURSE_和YEAR在这里没有用,可以删除(shnch). 把符合要求的数据表存为SAS数据集(如用名字Trans2).第68页/共96页第六十八页,共97页。69数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分加工数据加工数据(shj)集集-堆叠列堆叠列(Stacking Column) 把选中的几个(变量)列的数值叠加为一列(即 每一个观测行叠加后变成几个观测行).在浏览 模式下, 由 数据(Data)=堆叠列 (Stacking Columns) 则显示叠加列的对话窗,在这里可以规定(gudng)将叠加为一 列的哪几个变量列的名字;还可以规定(gudng)叠加后新列的 名字,及规定(gudng)一个名字用于记录叠加的这些列名. 当数据表中每个观测的一些数值是对同一个对象 重复几次测量得到的,叠加列的功能特别有用 (见pr0 数据集) .第69页/共96页第六十九页,共97页。70数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分加工数据加工数据(shj)集集-堆叠列例子堆叠列例子 例3. 数据集PRO记录了27个人在8岁,10岁,12岁,14岁的生长指数(用Y1Y4表示).因分析处理的需要,希望把每一行记录(观测) ,如 person sex y1 y2 y3 y4 1 F 21 20 21.5 23加工(ji gng)为 person sex age y 1 F 8 21 1 F 10 20 1 F 14 23 加工(ji gng)后生成的新数据集PR包含有274=108行4列.(analyst53.sas)第70页/共96页第七十页,共97页。71数据的转置及堆叠数据的转置及堆叠(dudi)和拆分和拆分加工数据集加工数据集-堆叠堆叠(dudi)列例子的具体步骤列例子的具体步骤 1.1.启动启动“分析家分析家”,”,并打开数据集并打开数据集PRoPRo; 数据数据(Data) (Data) 堆叠列堆叠列(Stacking Column);(Stacking Column); 3. 3. 在堆叠列窗口下,在堆叠列窗口下, 选中想要堆叠的变量(这里是选中想要堆叠的变量(这里是Y1Y4Y1Y4),),然后点击然后点击(din j)Stack ,(din j)Stack ,即把选中的变量即把选中的变量送到送到StackStack窗口内;窗口内; 规定堆叠所成的新列的名字为规定堆叠所成的新列的名字为Y (Y (缺省时缺省时名字为名字为_Stack_);_Stack_); 规定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字, ,缺省时缺省时名字为名字为_Source_;_Source_; 按按OKOK键键. .第71页/共96页第七十一页,共97页。72数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工加工(ji gng)数据集数据集-堆叠列例子的具体步骤堆叠列例子的具体步骤Y第72页/共96页第七十二页,共97页。73数据的转置及堆叠数据的转置及堆叠(dudi)和拆分和拆分加工数据集加工数据集-堆叠堆叠(dudi)列例子的具体步骤列例子的具体步骤 4. 4. 存贮堆叠后的数据为一新的SASSAS数据集 文件(File)=(File)=用SASSAS名字另存为=选择逻辑库, ,并规定数据集的名字( (如PR1)PR1)后按保存键. . 5. 5. 加工数据集PR1;PR1; 因堆叠后生成的数据集没有记录年龄的变量AGE,AGE,以下步骤就是用来(yn li)(yn li)增加一个年龄变量. . 打开刚生成的SASSAS数据集PR1,PR1,并转为编辑模式; ; 选数据(Data) (Data) 变换(Transform)(Transform) 记录值(Recore)(Recore) 在出现的记录值信息窗口修改新列的名字 为AGE;AGE;第73页/共96页第七十三页,共97页。74数据的转置及堆叠数据的转置及堆叠(dudi)和拆分和拆分加工数据集加工数据集-堆叠堆叠(dudi)列例子的具体步骤列例子的具体步骤第74页/共96页第七十四页,共97页。75数据的转置数据的转置(zhun zh)及堆叠和拆分及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤堆叠列的具体步骤 1.1.启动启动“分析家分析家”,”,并打开并打开(d ki)(d ki)数据集数据集transtrans; 数据数据(Data) (Data) 堆叠列堆叠列(Stacking Column);(Stacking Column); 3. 3. 在堆叠列窗口下,在堆叠列窗口下, 选中想要堆叠的变量(这里是选中想要堆叠的变量(这里是jandecjandec),),然后点击然后点击Stack ,Stack ,即把选中的变量送到即把选中的变量送到StackStack窗窗口内;口内; 规定堆叠所成的新列的名字为规定堆叠所成的新列的名字为Sales (Sales (缺缺省时名字为省时名字为_Stack_);_Stack_); 规定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字, ,缺省时缺省时名字为名字为_Source_;_Source_; 按按OKOK键键. .第75页/共96页第七十五页,共97页。76数据数据(shj)的转置及堆叠和拆分的转置及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤堆叠列的具体步骤 文件(File)=(File)=用SASSAS名字另存为=选择(xunz)(xunz)逻辑库, ,并规定数据集的名字( (如trans1)trans1)后按保存键. . 5. 5. 加工数据集trans1;trans1; 因转置后生成的数据集没有日期变量Date, Date, 用与例2 2类似的方法来增加一个日期变量. . 第76页/共96页第七十六页,共97页。77数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工加工(ji gng)数据集数据集-拆分列拆分列(Splitting Column) 把选中的一个将被分拆(fn chi)的(变量)列,按分拆(fn chi)by变量 名字的前缀,也可以使用缺省的名字. 在浏览模式下, 由 数据(Data)= 拆分列(Split Columns), 则显示分拆(fn chi)列的对话窗,在这里可以规定将被分拆(fn chi)的 数据表中某个数值变量y的值按性别的不同分拆(fn chi)为二 列,则可以此项功能.第77页/共96页第七十七页,共97页。78生成生成(shn chn)图形功能图形功能 在Analyst中可以生成以下几种(j zhn)类型的图形: 1. 条形图Bar Plot(V8) 2. 饼图Pie Plot(V8)第78页/共96页第七十八页,共97页。79生成图形生成图形(txng)功能功能 在Analyst中可以生成以下几种类型(lixng)的图形: 3. 直方图Histogram Plot 4. 盒型图Box Plot第79页/共96页第七十九页,共97页。80生成生成(shn chn)图形功能图形功能 在Analyst中可以(ky)生成以下几种类型的图形: 5. 概率图Probability Plot 6. 散点图Scatter Plot第80页/共96页第八十页,共97页。81生成图形生成图形(txng)功能功能 在Analyst中可以生成以下几种类型的图形(txng): 7. 等高线图Contour Plot 8. 曲面图Surface Plot第81页/共96页第八十一页,共97页。82统计分析功能统计分析功能(gngnng)描述统计(Descriptive):1. 汇总统计量(Summary Statistics)-计算概括统计量可以计算的概括性统计量有:
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!